expresiÓn y anÁlisis de datos · caso de variables cualitatitivas ... negro rosa verde i i i i i...

82
EXPRESIÓN Y ANÁLISIS DE DATOS

Upload: ngoduong

Post on 01-Oct-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

EXPRESIÓN Y ANÁLISIS DE

DATOS

Análisis de datos

Estadística descriptiva:

Se encarga de la recolección, organización, presentación y análisis de los datos de una población.

Se encarga de analizar la información

presentada por la estadística descriptiva

mediante técnicas que nos ayuden a conocer,

con determinado grado de confianza, a la

población. Lo que nos permite tomar

decisiones.

Estadística inferencial:

Vigilancia Epidemiológica

Recolección

Expresión y Análisis

Interpretación

Diseminación

Conceptos básicos

Población:

Conjunto definido de TODOS los INDIVIDUOS, de

donde se observa cierta característica.

Al número de integrantes de la población se llama

tamaño de la población y se representa con la

letra N.

Población Estadística:

Conjunto de TODOS los DATOS que se obtienen al

realizar la medición de una variable en los

elementos de una población.

Muestra:

Subconjunto de una población, que intenta reflejar

las características de la población lo mejor posible.

El número de individuos que integran la muestra,

llamado tamaño de la muestra se representa con

la letra n.

Individuo:

Es el elemento de la población o de la muestra que

aporta información sobre lo que se estudia.

Variable:

Característica o propiedad de los individuos que se

desea estudiar y se puede medir o calificar;

cambia o varía con el tiempo en un individuo dado,

o cambia o varía de elemento a elemento.

Ej. Edad, peso, sexo, estado civil, número de hijos, etc.

Dato:

Valor que se obtiene al realizar la medición de la

característica de la variable en estudio.

Pueden ser univariados, bivariados o multivariados.

La naturaleza de los datos pueden ser datos

cuantitativos o datos cualitativos.

Expresan distintas cualidades, características o

modalidad

Cada modalidad que se presenta se denomina atributo

o categoría

Las variables cualitativas pueden ser dicotómicas cuando

sólo pueden tomar dos valores posibles, como sí y no,

hombre y mujer o ser politómicas cuando pueden adquirir

tres o más valores

Datos Cualitativos

(categorías):

Se obtienen al calificar la característica en cuestión

como el sexo, estado civil, grado máximo de

estudios.

Variable cualitativa nominal En esta

variable los valores no pueden ser

sometidos a un criterio de orden, como

por ejemplo los colores

Variable cualitativa ordinal o variable casi cuantitativa La variable puede

tomar distintos valores ordenados siguiendo una escala establecida, aunque

no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo:

leve, moderado, severo.

Datos Cuantitativos (números):

Valores obtenidos al medir peso,

estatura, temperatura, número

de hijos.

Son las variables que toman como argumento

cantidades numéricas, son variables matemáticas.

En la variable CUANTITATIVA se pueden distinguir dos

tipos: continua y discreta.

Variable Continua:

Si la variable puede tomar cualquier

número real entre dos valores dados

(decimal o entero).

Ej. El peso de un individuo.

Variable Discreta:

Si la variable sólo puede tomar

números enteros.

Ej. El número de hijos de un individuo.

Qué es la Expresión de Datos??

Expresión

Declaración con palabras u otros signos de algo para darlo a entender

Datos

Información amplia o

concreta que permite una deducción

Tipos de Expresión

•Tablas

De Frecuencia Absoluta

De Frecuencia Acumulada

•Gráficas

Gráfico de Barras

Gráfico Circular

Histograma y Polígono de frecuencias

Tabla de Frecuencia

Orden de datos

La ordenación es el proceso mediante el cual los

datos están acomodados de tal manera que se

establece un orden (ascendente o descendente)

entre ellos.

Hay dos métodos comunes:

• Listado en orden ascendente

• Método de tallo y hojas

Listado en orden ascendente

El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg)

42 40 48 51 49

56 44 43 55 52

52 62 44 50 59

63 50 56 55 45

57 66 63 51 58

Peso de 25 estudiantes (en kg)

40 42 43 44 44

45 48 49 50 50

51 51 52 52 5555 5656 57 58

59 62 63 63 66

Método de tallo y hojas

Si los números de los datos están formados por

dos dígitos, se hace una columna con el primer

dígito (decenas) y a la derecha de cada uno

de ellos se escribe, en fila, sólo el segundo

dígito (unidades) de cada uno de los datos

que tengan el mismo primer dígito.

Datos sin ordenar:

Datos ordenados:

4

5

6

4

5

6

0,2,3,4,4,5,8,9

0,0,1,1,2,2,5,5,6,6,7,8,9

2,3,3,6

Peso de 25 estudiantes (en kg)

42 40 48 51 49

56 44 43 55 52

52 62 44 50 59

63 50 56 55 45

57 66 63 51 58

2,0,8,9,4,3,4,5

1,6,5,2,2,0,9,0,6,5,7,1,8

2,3,6,3

Medidas resumen

Cuando los datos son cuantitativos, las

observaciones individuales se corresponden con

cantidades numéricas y resulta conveniente

complementar la distribución de frecuencias con

algunas medidas resumen:

Tendencia central o centralización (medias, mediana y

moda),que indican el valor medio de los datos.

Medidas de dispersión (desviación típica y coeficiente

de variación), que expresan su variabilidad.

Caso de variables cualitatitivas

El procedimiento es:

Se identifican todos los valores diferentes y se

acomodan en columna.

Se agrega una segunda columna en donde se van

registrando, mediante una línea vertical, la veces

que aparece el valor dado.

rosa azul blanco azul rosa

gris blanco café negro blanco

rosa azul café blanco blanco

gris azul blanco rosa gris

gris blanco café negro verde

Color Frecuencia

Azul

Blanco

Café

Gris

Negro

Rosa

Verde

I I I I

I I I I I I

I I I

I I I I

I I

I I I I

I

Considera que la variable de estudio es el color

de playera de 25 estudiantes.

Los colores se encuentran en la siguiente tabla:

Tabla de Frecuencia de Datos

Una vez que se tenga ordenados los datos, se

acomodan en la “Tabla de distribución de

frecuencias o tabla de frecuencias”.

La tabla es básicamente una tabla de valores

x-y, dónde “x” representa el dato y “y”

representa la frecuencia.

La frecuencia es el número de veces que aparece

cada dato.

Hay dos clases de tablas de frecuencias:

Para datos NO agrupados.

Para datos agrupados.

Tabla de frecuencias para

datos NO agrupados

Está formada por dos columnas: una para la

variable “xi” y la otra para su frecuencia “f”, a

esta frecuencia se le llama frecuencia absoluta o

frecuencia observada.

Ejemplo

Tabla de frecuencias de los pesos en kg de 25

alumnos.

Peso de 25 estudiantes (en kg)

40 42 43 44 44

45 48 49 50 50

51 51 52 52 5555 5656 57 58

59 62 63 63 66

xi f

40

42

43

44

45

48

49

50

51

xi f

52

55

56

57

58

59

62

63

66

Total

1

1

1

2

1

1

1

2

2

2

2

2

1

1

1

1

2

1

25

Frecuencia relativa y acumulada

Por lo regular, se agregan dos columnas: la de la

frecuencia relativa “fr” y la de la frecuencia

acumulada “fa”.

La frecuencia relativa se obtiene mediante el

cociente de la frecuencia y el número total de

datos, esto es fr = f/n.

La frecuencia acumulada se obtiene sumando las

frecuencias anteriores a las frecuencias de un dato

dado.

Ejemplo

xi f fr fa

40 1

42 1

43 1

44 2

45 1

48 1

49 1

50 2

51 2

xi f fr fa

52 2

55 2

56 2

57 1

58 1

59 1

62 1

63 2

66 1

Total 25

0.04

0.04

0.04

0.04

0.04

0.04

0.04

0.04

0.04

0.04

0.04

0.08

0.08

0.08

0.08

0.08

0.08

0.08

1/25

2/25

1

2

3

5

6

7

8

10

12

14

16

18

19

20

21

22

24

25

1

Siempre

es el

número

total

Siempre es 1

Intervalo de clase

En ocasiones es conveniente acomodar los

datos en pequeños grupos de igual tamaño,

llamados intervalos de clase.

El punto medio o marca de clase “xi”, se

obtiene con:

Marca de clase = Límite inferior + límite superior

2

Ejemplo

Intervalo de clase Punto medio “xi”

38 – 42 40

43 – 47 45

48 – 52 50

53 – 57 55

58 – 62 60

63 – 67 65

Límite inferior Límite superior Lím inf + Lim sup2

Tabla de distribución de

frecuencias para datos agrupados

Se elabora con los intervalos de clase, sus puntos

medios y las frecuencias correspondientes para

cada uno de los intervalos.

xi f

40 1

42 1

43 1

44 2

45 1

48 1

49 1

50 2

51 2

52 2

55 2

56 2

57 1

58 1

59 1

62 1

63 2

66 1

Total 25

Da

tos

sin

ag

rup

ar

Intervalo de

clase

Punto medio

“xi”

f

38 – 42 40

43 – 47 45

48 – 52 50

53 – 57 55

58 – 62 60

63 - 67 65

Total

Datos agrupados

2

4

8

5

3

3

25

Se agregan las columnas de frecuencia relativa “fr”

y frecuencia acumulada “fa”:

Intervalo

de clase

Punto

medio “xi”

f fr Fa

38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63- 67 65 3

Total 25

0.08

0.16

0.32

0.20

0.12

0.12

1

2

6

14

19

22

25

2/25

4/25

8/25

Por último se agregan las columnas:

Frecuencia porcentual, “f%” ó “%f”, se obtiene

multiplicando la frecuencia relativa “fr” x 100.

Frecuencia relativa acumulada “fra”, se obtiene

sumando las frecuencias relativas anteriores a un

dato dado.

Frecuencia porcentual acumulada, “f%a”, se

obtiene sumando las frecuencias porcentuales

acumuladas a un dato dado.

Tablas de frecuencias absoluta,

relativa y acumulada

Intervalo

de clase

Punto medio

“xi”

f fr f% fa fra f%a

38 – 42 40 2 0.08 2

43 – 47 45 4 0.16 6

48 – 52 50 8 0.32 14

53 – 57 55 5 0.20 19

58 – 62 60 3 0.12 22

63- 67 65 3 0.12 25

Total 25 1

8

16

32

20

12

12

100

0.08

0.24

0.56

0.76

0.88

1

8

24

56

76

88

100

0.08 x

100

2/25

0.08 x

100

Gráfica de Datos

Existen dos tipos de gráficas mas usuales:

Polígono de Frecuencias

Histograma

Otros gráficos:

Gráfica de barras

Pictograma

Gráfico Circular o de pastel.

Polígono de Frecuencias

Es la representación mediante un gráfico de

línea. En él se muestra la distribución de

frecuencias y está formado por segmentos de

línea que unen los puntos correspondientes a la

frecuencia de cada una de las clases.

El eje “x” representa el dato “xi”

y el eje “y” las frecuencias.

Ejemplo

Intervalo de

clase

Punto medio

“xi”

f

38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63 - 67 65 3

Total 25

0

1

2

3

4

5

6

7

8

9

35 40 45 50 55 60 65 70

f

xi

Polígono de Frecuencias

El eje “y” puede ser sustituido por las frecuencias

relativas o porcentuales.

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

35 40 45 50 55 60 65 70

fr

xi

Polígono de Frecuencia Relativa

0

5

10

15

20

25

30

35

35 40 45 50 55 60 65

% f

xi

Polígono de Frecuencia Porcentual

Histograma

Es la representación gráfica de

los datos mediante una sucesión

de rectángulos.

Está formado por rectángulos cuya anchura

representa a cada uno de los intervalos y la

altura corresponde a la frecuencia.

Histograma y Polígono de Frecuencias

Gráfica de Barras Múltiples

Curva Epidémica

Pirámide Poblacional

Una variante en el histograma es colocar en el

eje “x” de tal manera que las columnas

quedarán en forma horizontal, es muy común

en datos poblacionales.

Ojiva

Es la representación gráfica de las frecuencias

acumuladas mediante un gráfico de línea. Se

muestra la distribución de frecuencias

acumuladas de los datos.

En el eje “x” estarán los puntos medios y en el

eje “y” las frecuencias acumuladas.

Ejemplo

02

6

14

19

22

25

0

5

10

15

20

25

30

35 40 45 50 55 60 65

fa

xi

Ojiva

Interval

o de

clase

Punto

medio

“xi”

f fr fa

38 – 42 40 2 0.08 2

43 – 47 45 4 0.16 6

48 – 52 50 8 0.32 14

53 – 57 55 5 0.20 19

58 – 62 60 3 0.12 22

63- 67 65 3 0.12 25

Total 25 1

Gráfico Circular

También es llamado gráfico de pastel.

Sólo se representan datos de frecuencias relativas

o frecuencias porcentuales.

Se debe dividir el área del círculo de manera

proporcional a las frecuencias.13%

17%

57%

13%PERRO

PAJARO

HAMSTER

GATO

Agregaremos una columna a nuestra tabla de

frecuencias “Frecuencia relativa al círculo”,

multiplicando (fr)(360°), para mostrar la parte

proporcional de círculo medida en grados que

corresponde a cada intervalo.

Ejemplo 1

Intervalo

de clase

Punto medio

“xi”

f fr (fr ) (360°)

38 – 42 40 2 0.08

43 – 47 45 4 0.16

48 – 52 50 8 0.32

53 – 57 55 5 0.20

58 – 62 60 3 0.12

63- 67 65 3 0.12

Total 25 1

28.8°

0.08 x

360°

0.16 x

360°

57.6°

115.2°

72°

43.2°

43.2°

360°

408%

4516%

5032%

5520%

6012% 65

12%

Gráfico Circular

Otros Gráficos

La gráfica de barras se traza similar al

Histograma, sólo que las barras se dibujan

separadas unas de otras.

La escala en el eje “x” es para mostrar

categorías o intervalos de números NO

consecutivos.

811

8

3 36

11

Elección de Carrera

Gráfica de Barras Simples

Pictograma

Similar al de barras, sólo que se sustituyen por

figuras, generalmente relacionadas con la variable

estudiada.

ANáLISISDE DATOS

¿Qué es análisis?

Distinción y separación

de las partes de un todo

hasta llegar a conocer

los principios o elementos

de este.

¿Qué es el análisis de datos?

El análisis de datos es un proceso de

inspeccionar, limpiar y transformar datos con el

objetivo de resaltar información útil, lo que

sugiere conclusiones, y apoyo a la toma de

decisiones.

Tipos de análisis de datos

Metodología Cualitativas

Metodología Cuantitativas

Metodología cualitativa

Tiene como objetivo la descripción de las cualidades

de un fenómeno. Busca un concepto que pueda

abarcar una parte de la realidad.

No se trata de probar o de medir en qué grado una

cierta cualidad se encuentra en un cierto

acontecimiento dado, sino de descubrir tantas

cualidades como sea posible.

Características principales de la

metodología cualitativa

Es inductiva.

Tiene una perspectiva holística.

Se trata de estudios en pequeña escala.

Hace énfasis en la validez de las investigaciones a través de la proximidad a la realidad empírica que brinda esta metodología.

No suele probar teorías o hipótesis.

Características principales de la

metodología cualitativa

No tiene reglas de procedimiento.

La base está en la intuición.

En general no permite un análisis estadístico.

Se pueden incorporar hallazgos que no se habían previsto.

Los investigadores cualitativos participan en la investigación a través de la interacción con los sujetos que estudian, es el instrumento de medida.

Analizan y comprenden a los sujetos y fenómenos desde la perspectiva de los dos últimos; debe eliminar o apartar sus prejuicios y creencias.

Metodología cuantitativa

La Metodología Cuantitativa

es aquella que permite

examinar los datos de manera

numérica, especialmente en

el campo de la estadística.

Características principales de la

metodología cuantitativo

La objetividad es la única forma de alcanzar el conocimiento.

El objeto de estudio es el elemento singular Empírico.

La teoría es el elemento fundamental de la investigación social.

Comprensión explicativa y predicativa de la realidad, bajo una concepción objetiva, unitaria, estática y reduccionista.

Concepción lineal de la investigación a través de una estrategia deductiva.

Es de método Hipotético – Deductivo.

Limitaciones cuantitativas

Diferencias entre investigación cualitativa y cuantitativa

Investigación cualitativa Investigación cuantitativa

Centrada en la fenomenología y

comprensión

Basada en la inducción probabilística

del positivismo lógico

Observación naturista sin control Medición penetrante y controlada

Subjetiva Objetiva

Inferencias de sus datos Inferencias más allá de los datos

Exploratoria, inductiva y

descriptiva

Confirmatoria, inferencial, deductiva

Orientada al proceso Orientada al resultado

Datos "ricos y profundos" Datos "sólidos y repetibles"

No generalizable Generalizable

Holista Particularista

Realidad dinámica Realidad estática

Ventajas e inconvenientes de los métodos cualitativos vs

cuantitativos.

Métodos cualitativos Métodos cuantitativos

Propensión a "comunicarse con" los

sujetos del estudio

Propensión a "servirse de" los sujetos

del estudio

Se limita a preguntar Se limita a responder

Comunicación más horizontal...

entre el investigador y los

investigados... mayor naturalidad y

habilidad de estudiar los factores

sociales en un escenario natural

Son fuertes en términos de validez

interna, pero son débiles en validez

externa, lo que encuentran no es

generalizable a la población

Son débiles en términos de validez

interna -casi nunca sabemos si miden

lo que quieren medir-, pero son

fuertes en validez externa, lo que

encuentran es generalizable a la

población

Preguntan a los cuantitativos:

¿Cuan particularizables son los

hallazgos?

Preguntan a los cualitativos: ¿Son

generalizables tus hallazgos?

Inferencia estadistica

Estadística Inferencial se refiere al proceso de

lograr generalizaciones acerca de las propiedades

del todo, población, partiendo de lo específico,

muestra

la Inferencia distingue:

la Estimación

la Contrastación de Hipótesis

Estimación

Hipótesis

Las pruebas de hipótesis son reglas objetivas que

nos permiten rechazar o no una hipótesis planteada

de antemano sobre la población usando la

información contenida en la muestra.

Los componentes de una prueba de hipótesis son: la

hipótesis nula (H0), la hipótesis alternativa (H1), el

error de tipo I o error α, el error de tipo II o error

β, el grado de significación o valor p y la potencia

de la prueba.

¿Qué análisis de los datos pueden

efectuarse?

Los análisis que vayamos a practicar a los datos

dependen de tres factores:

a. El nivel de medición de las variables

b. La manera como se hayan formulado las hipótesis

c. El interés del investigador.

Usualmente el investigador busca, en primer

término describir sus datos y posteriormente

efectuar análisis estadístico para relacionar sus

variables. Es decir, realiza análisis de

estadística descriptiva para cada una de sus

variables y luego describe la relación entre

éstas.

Los tipos o métodos de análisis son variados

y pero cabe señalar que el análisis no es

indiscriminado, cada método tiene su razón

de ser y un propósito especifico, no deben

hacerse más análisis de los necesarios.

La estadística no es un fin es sí misma, es

una herramienta para analizar los datos.

Los principales análisis que pueden efectuarse son:

• Estadísticas descriptivas para las variables, tomadas individualmente

• Puntuaciones “Z”

• Razones y tasas

• Cálculos y razonamientos de estadísticas inferencia

• Pruebas paramétricas

• Pruebas no paramétricas

• Análisis multivariados

Cuando un determinado resultado es diferente del

esperado, esto puede deberse a tres posibilidades:

1. Que sea debido a la existencia de fuente deerror al momento de la recolección oprocesamiento de la información.

2. Hasta cierto limite, es posible explicar, ladiferencia obtenida por razones de azar. Paraconocer si es explicable por el azar, se utilizanmétodos estadísticos diseñados para tal fin.

3. Que la diferencia encontrada sea real. A estadeterminación se llega por exclusión de las otrasdos posibilidades.

Por tanto, para aceptar la negación de las

hipótesis y considerar los resultados como

reales, debemos descartar las posibles

fuentes de error y el azar, esto nos permite

poder identificar nuevas hipótesis que sean

punto de partida para nuevos estudios.

Es importante tener presente que a partir

del momento en que obtenemos los

resultados, pasamos nuevamente a un

trabajo donde predominan los aspectos

teóricos y metodológicos que conforman un

solo momento que incluyen tres nuevas

etapas que se explican a continuación.

1.Discusión de los resultados

Una vez obtenidos los resultados del trabajo, llegamos a unaetapa de discusión.

Como se puede observar, en este momento recurrimos a lateoría para la interpretación de los resultados obtenidosencaminados a la obtención de las conclusiones.

Hacemos énfasis en que el abordaje teórico debe ser elmismo señalado al inicio (marco teórico) y que sirvió de basepara determinar las unidades de análisis, las variables, susrespectivos valores y relaciones, las hipótesis y los principios oconceptos básicos que constituirán nuestros puntos de partidapara la discusión de los resultados obtenidos.

La descripción de los resultados deberáagruparse en función de los objetivos específicosde la investigación, en cambio, para la discusiónde los mismos, la teoría juega un papelfundamental abordándose en forma global.

De acuerdo a este esquema la Discusión de losresultados se ordena por EJES DE DISCUSION,cada eje conlleva a la interpretación de ungrupo de resultados a partir de criterios teóricosde referencia, lo cual da lugar al establecimientode valoraciones correspondientes orientadas alObjetivo General de la Investigación.

2. Conclusiones

Las conclusiones serán una síntesis obtenido de ladiscusión de los resultados a partir del abordajeteórico en que se basa el estudio y deberánencaminarse a dar respuesta al problema planteadode acuerdo a lo expresado en el objetivo general.

Deberá tenerse cuidado en que los argumentos quefundamentan las conclusiones están contenidos en ladiscusión de los resultados, éstos tienen una orientaciónvertical y se realiza por cada objetivo especifico y ladiscusión tiene una orientación horizontal en función deejes de integración de los objetivos específicos con uncarácter sintético y orientado al objetivo general (Ejesde Discusión).

3. Recomendaciones

Deberán expresar señalamientos concretos de posiblessoluciones en relación a la justificación del estudioconteniendo elementos de juicio que contribuyan a latoma de decisiones dirigida a la aplicación práctica dedichas recomendaciones.

Hay autores que no consideran las recomendacionescomo parte del proceso, consideramos realmente que elproceso investigativo en sí se inicia con la formulacióndel problema y finaliza en las conclusiones, sinembargo, incluimos la fase exploratoria del problema ylas recomendaciones como primera y última etaparespectivamente, por razones didácticas.

El éxito no es que un vendedor

logre que alguien descalzo

compre un par de zapatos,

sino que alguien que se cree

coleccionista de ellos le

compre un nuevo par.

¿Qué tal si a Colón le hubiesen dicho, Cris, cariño,

no vayas ahora, espera a que resolvamos

primero los problemas más importantes: la

guerra, la pobreza y el crimen, la contaminación

y la enfermedad, el odio racial?

Bill Gates.

GRACIAS POR SU

ATENCIÓN!!