expresiÓn y anÁlisis de datos · caso de variables cualitatitivas ... negro rosa verde i i i i i...
TRANSCRIPT
Análisis de datos
Estadística descriptiva:
Se encarga de la recolección, organización, presentación y análisis de los datos de una población.
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
Estadística inferencial:
Conceptos básicos
Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Al número de integrantes de la población se llama
tamaño de la población y se representa con la
letra N.
Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medición de una variable en los
elementos de una población.
Muestra:
Subconjunto de una población, que intenta reflejar
las características de la población lo mejor posible.
El número de individuos que integran la muestra,
llamado tamaño de la muestra se representa con
la letra n.
Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
Expresan distintas cualidades, características o
modalidad
Cada modalidad que se presenta se denomina atributo
o categoría
Las variables cualitativas pueden ser dicotómicas cuando
sólo pueden tomar dos valores posibles, como sí y no,
hombre y mujer o ser politómicas cuando pueden adquirir
tres o más valores
Datos Cualitativos
(categorías):
Se obtienen al calificar la característica en cuestión
como el sexo, estado civil, grado máximo de
estudios.
Variable cualitativa nominal En esta
variable los valores no pueden ser
sometidos a un criterio de orden, como
por ejemplo los colores
Variable cualitativa ordinal o variable casi cuantitativa La variable puede
tomar distintos valores ordenados siguiendo una escala establecida, aunque
no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo:
leve, moderado, severo.
Datos Cuantitativos (números):
Valores obtenidos al medir peso,
estatura, temperatura, número
de hijos.
Son las variables que toman como argumento
cantidades numéricas, son variables matemáticas.
En la variable CUANTITATIVA se pueden distinguir dos
tipos: continua y discreta.
Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
Qué es la Expresión de Datos??
Expresión
Declaración con palabras u otros signos de algo para darlo a entender
Datos
Información amplia o
concreta que permite una deducción
Tipos de Expresión
•Tablas
De Frecuencia Absoluta
De Frecuencia Acumulada
•Gráficas
Gráfico de Barras
Gráfico Circular
Histograma y Polígono de frecuencias
Orden de datos
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.
Hay dos métodos comunes:
• Listado en orden ascendente
• Método de tallo y hojas
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg)
42 40 48 51 49
56 44 43 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 5555 5656 57 58
59 62 63 63 66
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.
Datos sin ordenar:
Datos ordenados:
4
5
6
4
5
6
0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8,9
2,3,3,6
Peso de 25 estudiantes (en kg)
42 40 48 51 49
56 44 43 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
2,0,8,9,4,3,4,5
1,6,5,2,2,0,9,0,6,5,7,1,8
2,3,6,3
Medidas resumen
Cuando los datos son cuantitativos, las
observaciones individuales se corresponden con
cantidades numéricas y resulta conveniente
complementar la distribución de frecuencias con
algunas medidas resumen:
Tendencia central o centralización (medias, mediana y
moda),que indican el valor medio de los datos.
Medidas de dispersión (desviación típica y coeficiente
de variación), que expresan su variabilidad.
Caso de variables cualitatitivas
El procedimiento es:
Se identifican todos los valores diferentes y se
acomodan en columna.
Se agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces
que aparece el valor dado.
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuencia
Azul
Blanco
Café
Gris
Negro
Rosa
Verde
I I I I
I I I I I I
I I I
I I I I
I I
I I I I
I
Considera que la variable de estudio es el color
de playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:
Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores
x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
La frecuencia es el número de veces que aparece
cada dato.
Hay dos clases de tablas de frecuencias:
Para datos NO agrupados.
Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 5555 5656 57 58
59 62 63 63 66
xi f
40
42
43
44
45
48
49
50
51
xi f
52
55
56
57
58
59
62
63
66
Total
1
1
1
2
1
1
1
2
2
2
2
2
1
1
1
1
2
1
25
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia
acumulada “fa”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Ejemplo
xi f fr fa
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
xi f fr fa
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total 25
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.08
0.08
0.08
0.08
0.08
0.08
0.08
1/25
2/25
1
2
3
5
6
7
8
10
12
14
16
18
19
20
21
22
24
25
1
Siempre
es el
número
total
Siempre es 1
Intervalo de clase
En ocasiones es conveniente acomodar los
datos en pequeños grupos de igual tamaño,
llamados intervalos de clase.
El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase = Límite inferior + límite superior
2
Ejemplo
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65
Límite inferior Límite superior Lím inf + Lim sup2
Tabla de distribución de
frecuencias para datos agrupados
Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para
cada uno de los intervalos.
xi f
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total 25
Da
tos
sin
ag
rup
ar
Intervalo de
clase
Punto medio
“xi”
f
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 - 67 65
Total
Datos agrupados
2
4
8
5
3
3
25
Se agregan las columnas de frecuencia relativa “fr”
y frecuencia acumulada “fa”:
Intervalo
de clase
Punto
medio “xi”
f fr Fa
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63- 67 65 3
Total 25
0.08
0.16
0.32
0.20
0.12
0.12
1
2
6
14
19
22
25
2/25
4/25
8/25
Por último se agregan las columnas:
Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a un
dato dado.
Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
Tablas de frecuencias absoluta,
relativa y acumulada
Intervalo
de clase
Punto medio
“xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 67 65 3 0.12 25
Total 25 1
8
16
32
20
12
12
100
0.08
0.24
0.56
0.76
0.88
1
8
24
56
76
88
100
0.08 x
100
2/25
0.08 x
100
Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
Polígono de Frecuencias
Histograma
Otros gráficos:
Gráfica de barras
Pictograma
Gráfico Circular o de pastel.
Polígono de Frecuencias
Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.
El eje “x” representa el dato “xi”
y el eje “y” las frecuencias.
Ejemplo
Intervalo de
clase
Punto medio
“xi”
f
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 67 65 3
Total 25
0
1
2
3
4
5
6
7
8
9
35 40 45 50 55 60 65 70
f
xi
Polígono de Frecuencias
El eje “y” puede ser sustituido por las frecuencias
relativas o porcentuales.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
35 40 45 50 55 60 65 70
fr
xi
Polígono de Frecuencia Relativa
0
5
10
15
20
25
30
35
35 40 45 50 55 60 65
% f
xi
Polígono de Frecuencia Porcentual
Histograma
Es la representación gráfica de
los datos mediante una sucesión
de rectángulos.
Está formado por rectángulos cuya anchura
representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
Pirámide Poblacional
Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.
En el eje “x” estarán los puntos medios y en el
eje “y” las frecuencias acumuladas.
Ejemplo
02
6
14
19
22
25
0
5
10
15
20
25
30
35 40 45 50 55 60 65
fa
xi
Ojiva
Interval
o de
clase
Punto
medio
“xi”
f fr fa
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 67 65 3 0.12 25
Total 25 1
Gráfico Circular
También es llamado gráfico de pastel.
Sólo se representan datos de frecuencias relativas
o frecuencias porcentuales.
Se debe dividir el área del círculo de manera
proporcional a las frecuencias.13%
17%
57%
13%PERRO
PAJARO
HAMSTER
GATO
Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
Intervalo
de clase
Punto medio
“xi”
f fr (fr ) (360°)
38 – 42 40 2 0.08
43 – 47 45 4 0.16
48 – 52 50 8 0.32
53 – 57 55 5 0.20
58 – 62 60 3 0.12
63- 67 65 3 0.12
Total 25 1
28.8°
0.08 x
360°
0.16 x
360°
57.6°
115.2°
72°
43.2°
43.2°
360°
Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos.
811
8
3 36
11
Elección de Carrera
Pictograma
Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.
¿Qué es análisis?
Distinción y separación
de las partes de un todo
hasta llegar a conocer
los principios o elementos
de este.
¿Qué es el análisis de datos?
El análisis de datos es un proceso de
inspeccionar, limpiar y transformar datos con el
objetivo de resaltar información útil, lo que
sugiere conclusiones, y apoyo a la toma de
decisiones.
Metodología cualitativa
Tiene como objetivo la descripción de las cualidades
de un fenómeno. Busca un concepto que pueda
abarcar una parte de la realidad.
No se trata de probar o de medir en qué grado una
cierta cualidad se encuentra en un cierto
acontecimiento dado, sino de descubrir tantas
cualidades como sea posible.
Características principales de la
metodología cualitativa
Es inductiva.
Tiene una perspectiva holística.
Se trata de estudios en pequeña escala.
Hace énfasis en la validez de las investigaciones a través de la proximidad a la realidad empírica que brinda esta metodología.
No suele probar teorías o hipótesis.
Características principales de la
metodología cualitativa
No tiene reglas de procedimiento.
La base está en la intuición.
En general no permite un análisis estadístico.
Se pueden incorporar hallazgos que no se habían previsto.
Los investigadores cualitativos participan en la investigación a través de la interacción con los sujetos que estudian, es el instrumento de medida.
Analizan y comprenden a los sujetos y fenómenos desde la perspectiva de los dos últimos; debe eliminar o apartar sus prejuicios y creencias.
Metodología cuantitativa
La Metodología Cuantitativa
es aquella que permite
examinar los datos de manera
numérica, especialmente en
el campo de la estadística.
Características principales de la
metodología cuantitativo
La objetividad es la única forma de alcanzar el conocimiento.
El objeto de estudio es el elemento singular Empírico.
La teoría es el elemento fundamental de la investigación social.
Comprensión explicativa y predicativa de la realidad, bajo una concepción objetiva, unitaria, estática y reduccionista.
Concepción lineal de la investigación a través de una estrategia deductiva.
Es de método Hipotético – Deductivo.
Diferencias entre investigación cualitativa y cuantitativa
Investigación cualitativa Investigación cuantitativa
Centrada en la fenomenología y
comprensión
Basada en la inducción probabilística
del positivismo lógico
Observación naturista sin control Medición penetrante y controlada
Subjetiva Objetiva
Inferencias de sus datos Inferencias más allá de los datos
Exploratoria, inductiva y
descriptiva
Confirmatoria, inferencial, deductiva
Orientada al proceso Orientada al resultado
Datos "ricos y profundos" Datos "sólidos y repetibles"
No generalizable Generalizable
Holista Particularista
Realidad dinámica Realidad estática
Ventajas e inconvenientes de los métodos cualitativos vs
cuantitativos.
Métodos cualitativos Métodos cuantitativos
Propensión a "comunicarse con" los
sujetos del estudio
Propensión a "servirse de" los sujetos
del estudio
Se limita a preguntar Se limita a responder
Comunicación más horizontal...
entre el investigador y los
investigados... mayor naturalidad y
habilidad de estudiar los factores
sociales en un escenario natural
Son fuertes en términos de validez
interna, pero son débiles en validez
externa, lo que encuentran no es
generalizable a la población
Son débiles en términos de validez
interna -casi nunca sabemos si miden
lo que quieren medir-, pero son
fuertes en validez externa, lo que
encuentran es generalizable a la
población
Preguntan a los cuantitativos:
¿Cuan particularizables son los
hallazgos?
Preguntan a los cualitativos: ¿Son
generalizables tus hallazgos?
Inferencia estadistica
Estadística Inferencial se refiere al proceso de
lograr generalizaciones acerca de las propiedades
del todo, población, partiendo de lo específico,
muestra
la Inferencia distingue:
la Estimación
la Contrastación de Hipótesis
Hipótesis
Las pruebas de hipótesis son reglas objetivas que
nos permiten rechazar o no una hipótesis planteada
de antemano sobre la población usando la
información contenida en la muestra.
Los componentes de una prueba de hipótesis son: la
hipótesis nula (H0), la hipótesis alternativa (H1), el
error de tipo I o error α, el error de tipo II o error
β, el grado de significación o valor p y la potencia
de la prueba.
¿Qué análisis de los datos pueden
efectuarse?
Los análisis que vayamos a practicar a los datos
dependen de tres factores:
a. El nivel de medición de las variables
b. La manera como se hayan formulado las hipótesis
c. El interés del investigador.
Usualmente el investigador busca, en primer
término describir sus datos y posteriormente
efectuar análisis estadístico para relacionar sus
variables. Es decir, realiza análisis de
estadística descriptiva para cada una de sus
variables y luego describe la relación entre
éstas.
Los tipos o métodos de análisis son variados
y pero cabe señalar que el análisis no es
indiscriminado, cada método tiene su razón
de ser y un propósito especifico, no deben
hacerse más análisis de los necesarios.
La estadística no es un fin es sí misma, es
una herramienta para analizar los datos.
Los principales análisis que pueden efectuarse son:
• Estadísticas descriptivas para las variables, tomadas individualmente
• Puntuaciones “Z”
• Razones y tasas
• Cálculos y razonamientos de estadísticas inferencia
• Pruebas paramétricas
• Pruebas no paramétricas
• Análisis multivariados
Cuando un determinado resultado es diferente del
esperado, esto puede deberse a tres posibilidades:
1. Que sea debido a la existencia de fuente deerror al momento de la recolección oprocesamiento de la información.
2. Hasta cierto limite, es posible explicar, ladiferencia obtenida por razones de azar. Paraconocer si es explicable por el azar, se utilizanmétodos estadísticos diseñados para tal fin.
3. Que la diferencia encontrada sea real. A estadeterminación se llega por exclusión de las otrasdos posibilidades.
Por tanto, para aceptar la negación de las
hipótesis y considerar los resultados como
reales, debemos descartar las posibles
fuentes de error y el azar, esto nos permite
poder identificar nuevas hipótesis que sean
punto de partida para nuevos estudios.
Es importante tener presente que a partir
del momento en que obtenemos los
resultados, pasamos nuevamente a un
trabajo donde predominan los aspectos
teóricos y metodológicos que conforman un
solo momento que incluyen tres nuevas
etapas que se explican a continuación.
1.Discusión de los resultados
Una vez obtenidos los resultados del trabajo, llegamos a unaetapa de discusión.
Como se puede observar, en este momento recurrimos a lateoría para la interpretación de los resultados obtenidosencaminados a la obtención de las conclusiones.
Hacemos énfasis en que el abordaje teórico debe ser elmismo señalado al inicio (marco teórico) y que sirvió de basepara determinar las unidades de análisis, las variables, susrespectivos valores y relaciones, las hipótesis y los principios oconceptos básicos que constituirán nuestros puntos de partidapara la discusión de los resultados obtenidos.
La descripción de los resultados deberáagruparse en función de los objetivos específicosde la investigación, en cambio, para la discusiónde los mismos, la teoría juega un papelfundamental abordándose en forma global.
De acuerdo a este esquema la Discusión de losresultados se ordena por EJES DE DISCUSION,cada eje conlleva a la interpretación de ungrupo de resultados a partir de criterios teóricosde referencia, lo cual da lugar al establecimientode valoraciones correspondientes orientadas alObjetivo General de la Investigación.
2. Conclusiones
Las conclusiones serán una síntesis obtenido de ladiscusión de los resultados a partir del abordajeteórico en que se basa el estudio y deberánencaminarse a dar respuesta al problema planteadode acuerdo a lo expresado en el objetivo general.
Deberá tenerse cuidado en que los argumentos quefundamentan las conclusiones están contenidos en ladiscusión de los resultados, éstos tienen una orientaciónvertical y se realiza por cada objetivo especifico y ladiscusión tiene una orientación horizontal en función deejes de integración de los objetivos específicos con uncarácter sintético y orientado al objetivo general (Ejesde Discusión).
3. Recomendaciones
Deberán expresar señalamientos concretos de posiblessoluciones en relación a la justificación del estudioconteniendo elementos de juicio que contribuyan a latoma de decisiones dirigida a la aplicación práctica dedichas recomendaciones.
Hay autores que no consideran las recomendacionescomo parte del proceso, consideramos realmente que elproceso investigativo en sí se inicia con la formulacióndel problema y finaliza en las conclusiones, sinembargo, incluimos la fase exploratoria del problema ylas recomendaciones como primera y última etaparespectivamente, por razones didácticas.
El éxito no es que un vendedor
logre que alguien descalzo
compre un par de zapatos,
sino que alguien que se cree
coleccionista de ellos le
compre un nuevo par.
¿Qué tal si a Colón le hubiesen dicho, Cris, cariño,
no vayas ahora, espera a que resolvamos
primero los problemas más importantes: la
guerra, la pobreza y el crimen, la contaminación
y la enfermedad, el odio racial?
Bill Gates.