¡ya sé como es!

50
Estadística Aplicada: “Didáctica de la Estadística y Métodos Estadísticos en Problemas Socioeconómicos. Universidad Nacional de Colombia. Sede Medellín Enseñanza de la Estadística como parte de la Metodología de Investigación Dr. Ignacio Méndez Ramírez. IIMAS-UNAM y IASI Medellín Colombia 20 de julio de 2010 1

Upload: dinhcong

Post on 06-Jan-2017

217 views

Category:

Documents


0 download

TRANSCRIPT

Estadística Aplicada: “Didáctica de la

Estadística y Métodos Estadísticos en

Problemas Socioeconómicos.

Universidad Nacional de Colombia.

Sede Medellín

Enseñanza de la Estadística como parte de la

Metodología de Investigación

Dr. Ignacio Méndez Ramírez.

IIMAS-UNAM y IASI

Medellín Colombia 20 de julio de 2010

1

Panorama de la Plática

Universidad Nacional de

Colombia . sede Medellín

2

1. Tres Preguntas Básicas:

2. Filosofía de la ciencia. Método científico. Objetividad

3. Modelos estadísticos.

4. Papel de la estadística y el diseño en el Apoyo a

relaciones causales

1. Contrastación de hipótesis.

2. Explicaciones Alternativas.

3. Factores de Confusión.

4. Significancia Estadística.

5. Estrategia de modelado.

5. Consideraciones Didácticas

3Universidad Nacional de

Colombia . sede Medellín

1.- Hacer ciencia es ser totalmente objetivo

4Universidad Nacional de

Colombia . sede Medellín

2.- Las estaturas de los seres humanos tienen distribución

normal

5Universidad Nacional de

Colombia . sede Medellín

3.- En una investigación se tienen dos grupos de

personas, uno realizó ejercicio físico vigoroso EFV,

durante un año y el otro (testigo o control) no lo

hizo. Al término del año se midieron los ácidos

grasos en suero.

Los resultados son:

Se efectúa una prueba de “t” y se tiene P <0.001.

Se concluye “el EFV disminuye los valores de

ácidos grasos”.

Grupo n Media Desv. Est.

EFV 100 12.3 2.8

Control 100 18.6 3.1

6

Universidad Nacional de Colombia . sede Medellín

La respuesta en las tres

preguntas es .

NO

• Es necesario evaluarlas a la luz de

consideraciones filosóficas,

metodológicas y estadísticas.

7Universidad Nacional de

Colombia . sede Medellín

En todo trabajo de Investigación, setiene un marco epistémico.

En muchas áreas de investigación“tradicionales” como la Biología,Medicina, Agronomía, etc., este marcoes tácito, es decir, se asumeinconscientemente.

8Universidad Nacional de

Colombia . sede Medellín

1.- No se puede ser totalmente objetivo.

Además es muy común que sea un marcototalmente erróneo,a partir de la filosofía delPositivismo o Empirísmo Lógico.

El uso de este marco hace que lainvestigación sea muy rígida, pretendiendoser totalmente objetiva y racional.

Los filósofos modernos han rechazadounánimemente este marco epistémico, y hanpostulado entre otras cosas, que la cienciano es totalmente objetiva, que hay actos enel proceso de investigación científica, que nopueden ser justificados totalmente de formaracional. 9Universidad Nacional de

Colombia . sede Medellín

<Positivismo>

*Objetivo

*Empírico

*Racionalidad en el método

*Reduccionista

*Certeza.

*La Matemática es la realidad

*Causalidad Determinística

<Nueva Filosofía>

*Objetividad intersubjetiva

*Constructivismo

*Racionalidad en el científico

*Sistémico

*Minimizar errores

*La matemática aproxima la realidad

*Causalidad Probabilística

¡Ya sé

como

es!

¡Así se

debe

hacer!

Tengo una

teoría que

funciona

bien.

Este

método

funciona

10

La estadística cuando se aplica a otra disciplina, lo

que pretende es contribuir a que el conocimiento

que se adquiere sobre un aspecto de la realidad, esté

en la medida de lo posible libre de errores, o que

éstos sean pequeños.

Representación

11Universidad Nacional de

Colombia . sede Medellín

Epistemología, Metodología

Estadística y las Ciencias Fácticas

Para contribuir al objetivo de tener conocimiento

válido (libre de errores y sancionado por la

comunidad de científicos), es necesario contemplar

los aspectos epistemológicos de las disciplinas

involucradas, diseñar la forma de captar la

información más económica, factible y además que

sea “científica” en el sentido de minimizar errores.

12Universidad Nacional de

Colombia . sede Medellín

Cita

"Modern statistics--concerned with discovering

patterns and structures in nature, with unearthing

relationships which defy unaided perception and

with providing powerful tools for us to improve our

understanding of the world around us-- ought to

be regarded by the general public as one of the

most exciting of disciplines."

David J. Hand. ”Breaking misconceptions--

statistics and its relationship to mathematics”

The Statistician, 1998: 47, pert2, pp. 245-25013Universidad Nacional de

Colombia . sede Medellín

“La estadística moderna encargada de descubrir

patrones y estructuras en la naturaleza, de

desenterrar relaciones que desafían la percepción

normal y de proveernos con herramientas

poderosas para que mejorar el entendimiento del

mundo que nos rodea debería ser considerada

por el público en general como la más excitante

de las disciplinas”

14Universidad Nacional de

Colombia . sede Medellín

Los razonamientos con consideraciones

estadísticas intervienen en todas las

etapas del proceso.

El estadístico debe entender y colaborar

en todos los aspectos de la investigación.

Es un científico más de un grupo de

trabajo 15Universidad Nacional de Colombia . sede Medellín

ASPECTOS EPISTEMOLÓGICOS

.- Interesa principalmente cómo es el mundo y no

tanto por qué es así.

.- El encontrar, cómo es el mundo, tiene relación

con la explicación de por qué es así.

.- En la medida de tener mejores explicaciones, se

pueden encontrar nuevas regularidades, esto

constituye el complejo teórico metodológico con el

que construimos el conocimiento.

.- No hay objetividad Absoluta. Hay Objetividad

intersubjetiva.

.- La matemática está en la mente, no en la

realidad. Ningún modelo es “verdadero”, pero hay

algunos muy útiles. 16Universidad Nacional de

Colombia . sede Medellín

.- No existe un método científico infalibley obligado. El “enfoque científico”consiste en una búsqueda comprometida,exhaustiva e integral de metodologíasque minimicen o eviten los errores en laadquisición del conocimiento

.- No se puede ser totalmente racional,en el sentido de que todo los que se haceesta basado en premisas lógicas

.- No hay hechos puros. Hayinterpretaciones de hechos a la luz deteorías y subjetividad, considerandosiempre el diseño de investigación.

17Universidad Nacional de

Colombia . sede Medellín

Elaboración de proyectos

.- Se pueden considerar dos ciclos ligados en el

proceso de elaboración de un proyecto (protocolo).

C1.- Problema – Marco Teórico – Hipótesis –

Variables.

C2.- Hipótesis – Diseño-

Diseño: Poblaciones, métodos de muestreo,

mediciones, intervenciones, seguimiento.

Antes de realizar una investigación, se debe efectuar

una critica fuerte a todo el proyecto. Se busca

coherencia entre las partes y la minimización de

errores.18

Universidad Nacional de Colombia . sede Medellín

Tipos de diseños, mediciones,

modelos, supuestos, análisis,

etc..

Problema, marco teórico,

hipótesis. Conceptos, objetivos,

poblaciones, elementos, etc.Encuestas, cohortes,

experimentos, etapas,

estratos, bloques,

apareamiento, modelos de

regresión logísticos,

generalizados, discriminante,

factores, ecuaciones

estructurales, etc

Instrumentos, limitaciones

prácticas, trabajo de campo,

tiempo, dinero, etc.

19Universidad Nacional de

Colombia . sede Medellín

Realización de la investigación

Conducción – Obtención de Información- Análisis

Exploratorio – Construcción, verificación y selección

de modelos – Interpretación – Discusión –

Conclusiones y recomendaciones – Reporte.

Hay indivisibilidad del método de estudio con las

explicaciones (teoría) que se tienen sobre el propio

objeto estudiado.Método Teoría

Objeto Teoría

Interpretación 20Universidad Nacional de

Colombia . sede Medellín

La visón rígida de la ciencia positiva y su

adhesión en forma acrítica produce:

.- Poca creatividad en la metodología.

.- Se copian diseños y procedimientos.

.- Búsqueda de objetividad, que puede paralizar.

.- Fe ciega en la matemática.

logP/(1-P) = XB21

Universidad Nacional de Colombia . sede Medellín

Enfoque dogmático en Agronomía:

n=4 es parte del método científico.

Un experimento busca minimizar el error experimental

Uso de bloques frecuentemente inadecuado

Para cualquier experimento un coeficiente de

variación mayor a 20% indica que está mal el estudio.

Un tamaño óptimo de parcela experimental para un

cultivo, válido para todo tipo de tratamientos y

condiciones de experimentación. Pseudorepetición

Uso dogmático (mágico) del 5% de significación

No hay crítica para los diseños y los análisis

La distribución normal existe en la naturaleza

¡Buen

Experimento!

22

Universidad Nacional de Colombia . sede Medellín

2. Las estaturas de los seres humanos tienen distribución

normal

Con elevada frecuencia biólogos, matemáticos,

agrónomos, etc. ; con menor frecuencia sicólogos,

sociólogos, etc., contestan Verdadero

0)0( YP

Niños

HombresMujeres

La Normal es una propiedad

objetiva de la naturaleza,

existe por si sola. Sólo hay

que descubrirla.¡Existe una estatura negativa! Se ignora el diseño, ¿a qué

población de humanos se

refiere? ¿todos los que

existen? ¿a mujeres de 30 a

50 años , clase media, que

viven en México, D.F.?Basquetbolistas

23

)/()/( noXYPXYP

X1

X2

X3

Xk

Y2

Y1

Y3

Yp

24

Universidad Nacional de Colombia . sede Medellín

H ~ Hipótesis

D ~ Diseño

E ~ Esperado ( condicionado a H , D y SA)

SA ~ Supuestos Adicionales para el funcionamiento de H

con diseño D. 25

Universidad Nacional de Colombia . sede Medellín

Práctica: D: ocurre O (Resultado Observado)

¿Concordancia (contrastación) E con O?

*

a).- Concuerdan E con O : se apoya H

b).- No concuerdan E con O : No se apoya H

¿Cómo se define

la concordancia?

Teoría: H, D, SA E*

26Universidad Nacional de

Colombia . sede Medellín

3. En una investigación se tienen dos grupos de

personas, uno realizó ejercicio físico vigoroso EFV,

durante un año y el otro (testigo o control) no lo

hizo. Al término del año se midieron los ácidos

grasos en suero.

Los resultados son:

Se efectúa una prueba de “t” y se tiene P <0.001.

Se concluye “el EFV disminuye los valores de

ácidos grasos

Grupo n Media Desv. Est.

EFV 100 12.3 2.8

Control 100 18.6 3.1

27

Universidad Nacional de Colombia . sede Medellín

Con elevada frecuencia biólogos, matemáticos,

agrónomos, etc. ; con menor frecuencia sicólogos,

sociólogos, etc., contestan en pregunta 3:

Verdadero

28Universidad Nacional de

Colombia . sede Medellín

3. En una investigación se tienen dos grupos de personas, uno

realizó ejercicio físico vigoroso EFV, durante un año y el otro

(testigo o control) no lo hizo. Al término del año se midieron

los ácidos grasos en suero. Preguntas Básicas

¿ Cómo eran las personas en características

inherentes a ellas, tales como sexo, edad, tipo de

alimentación, raza, estado de salud, etc.?

¿Cómo se asignó el EFV? ¿Lo eligieron las

personas, fue con incentivos, fue al azar, etc.?

¿Cómo se define EFV y NoEFV?

¿En qué condiciones se realizó el EFV y el noEFV,

cambios climáticos, de salud, de organización,

sociales, alimenticios, etc.?

¿Cómo se midieron los ácidos grasos, fue igual

para ambos grupos?29

Universidad Nacional de Colombia . sede Medellín

Grupo Media

EFV 12.3

Control 18.6

P <0.001

30

¿ qué

papel

juega?

Explicaciones alternativas A, B,...Q. Niegan

H, y explican la cercanía de E con O de otro

modo. Son “de Nulidad”

Teoría:

H, D, SAH E

Q, D, SAQ E

B, D, SAB E

A, D, SAA E

.................

Práctica: D ocurre O

a) Concuerdan O con E. Se apoyan por igual H, A, B, ... Q

b) No concuerdan O con E. No se apoyan H, A, B, ... Q. 31

Universidad Nacional de Colombia . sede Medellín

Explicaciones alternativas A, B,...Q. Niegan H, y explican

la cercanía de E con O de otro modo. Son “de Nulidad”

Grupo Edad Media

EFV 20-25 años 12.3

Control 47-62 años 18.6

Ac.

grasos

edad

EFV

o no

SA: Supuestos adicionales:

La edad y el EFV están

asociados. La edad produce

cambios en ác. Grasos.

La edad es un Factor de

Confusión en la relación

EFV Ac grasos 32

Universidad Nacional de Colombia . sede Medellín

Explicación

alternativa: Las

diferencias en ac.

grasos de deben

a la edad y no al

EFV

Universidad Nacional de Colombia . sede Medellín

33

Etapa de planeación: Cambiar el diseño D o

cambiar la hipótesis empírica H, de manera

que los SA de las explicaciones alternativas,

no operen, o sean improbables.

Etapa de análisis y discusión: Mostrar

debilidad teórica, poca plausibilidad o

imposibilidad de los SA de las explicaciones

alternativas.

34Universidad Nacional de

Colombia . sede Medellín

“Control” de factores de confusión

1. Homogeneización.- Que los factores de confusión

no varíen en todos los elementos del estudio.

2. Formación de bloques o estratos homogéneos.-

Comparaciones dentro de los bloques y sus

promedios. No interacción.

3. Aleatorización.- Se asignan al azar a los

elementos de estudio las variantes del posible factor

causal o tratamientos. Tiende a homogenizar la

distribución de todas las variables presentes en los

elementos de estudio.

4. Análisis estadístico:- Se modela la influencia

conjunta de tratamientos y factores de confusión. Se

obtienen los “Efectos ajustados”35

Universidad Nacional de Colombia . sede Medellín

3.En una investigación se tienen 200 hombres de 25-

50 años, se asignan al azar 100 de ellos para que

se sometan a ejercicio físico vigoroso (EFV),

durante un año y el resto (testigo o control) no lo

haga (noEFV).

Se vigila que las condiciones de vida sean

semejantes en ambos grupos durante el año.

Al término del año, de cada individuo se toma una

muestra de sangre y se congela de inmediato, para

que en todas después del mismo tiempo de frío y

con los mismos instrumentos se miden los ácidos

grasos en suero.

36

Universidad Nacional de Colombia . sede Medellín

3. En una investigación se tienen dos grupos de

personas, uno realizó ejercicio físico vigoroso EFV,

durante un año y el otro (testigo o control) no lo

hizo. Al término del año se midieron los ácidos

grasos en suero.

Los resultados son:

Se efectúa una prueba de “t” y se tiene P <0.001.

Se concluye “el EFV disminuye los valores de

ácidos grasos

Grupo n Media Desv. Est.

EFV 100 12.3 2.8

Control 100 18.6 3.1

37

Universidad Nacional de Colombia . sede Medellín

Con elevada frecuencia biólogos, matemáticos,

agrónomos, etc. ; con menor frecuencia sicólogos,

sociólogos, etc., contestan en 3 : Verdadero

38Universidad Nacional de

Colombia . sede Medellín

Explicación alternativa A.-

Hipótesis de Nulidad Estadística

No es cierta H y ocurre O “cercano” a E por azar.

SAA: Hay variación natural en ác. grasos en los

humanos, aunque sean semejantes (la misma

población), pueden darse por azar promedios bajos en

los de EFV y altos en los de noEFV. Bajo A, ambos

grupos son muestras de la misma población de sujetos.39

.....

EFVμ

Explicación alternativa A: noEFVEFV μμ

Se espera que los promedios muestrales sean iguales, EA

noEFVEFV YY Se efectúa el diseño, D y se obtiene O (observado):

)()( EODifEODifYY AnoEFVEFV

.....

noEFVμ

40

Universidad Nacional de Colombia . sede Medellín

Se mide

Yi

Ac graso

Se mide

Yi

Ac graso(Riqueza conceptual: poblaciones,

medias poblacionales, etc.)

¿La discrepancia entre O y EA, Dif, es compatible

con la hipótesis alternativa del Azar , A?

¿La discrepancia entre YEFV y YnoEFV es factible o

probable por azar o es improbable.?

Fisher: 0.05 o 0,01

41Universidad Nacional de

Colombia . sede Medellín

De las posibles Explicaciones alternativas A,

B,...Q. Niegan H, y esperan E de otro modo.

Son “de Nulidad”, si hay significancia estadística,

se considera que A: “El azar produce E” esta

eliminada, pero subsisten B,...Q

42Universidad Nacional de

Colombia . sede Medellín

Teoría:

H, D, SAH E

Q, D, SAQ E

B, D, SAB E

A, D, SAA E Improbable

..........

La significancia estadística sólo eliminó una

explicación alternativa, el azar. ¡Sólo esto!

Se puede decir que , pero no a que se

debe la diferencia , ya que subsisten explicaciones

alternativas (B, …, Q) 43

noEFVEFV

En la búsqueda de apoyo a hipótesis de causalidad

probabilística, se buscan diseños y modelos que

representen bien la realidad, y que permitan valorar si

hay cambios en la distribución de la variable de

respuesta o efecto Y, al cambiar los valores de la

variable causal, condicionado a valores fijos de

variables que representan explicaciones alternativas.

)....,,/()....,,/( * QBAXYfQBAXYf

Donde X y X* son diferentes valores de la variable

“causal” y A,B,...Q son situaciones fijas de las

explicaciones alternativas. Son los “efectos corregidos” o

“efectos de X sobre Y ajustados por A, B, ...Q 44

Universidad Nacional de Colombia . sede Medellín

En estadística es común que se plantee un modelo para

explicar las características de generación de los datos.

El modelo puede representar la situación esperada de

una hipótesis de causalidad, o puede ser el modelo de

negación de una hipótesis.

Se evalúa la concordancia entre los datos observados, O

y los esperados E, si el modelo es cierto.

Usualmente esta discordancia se valora de acuerdo a la

probabilidad de una discordancia como la obtenida o

aún mayor suponiendo cierto el modelo.

Es el ”Valor de P”. 45Universidad Nacional de

Colombia . sede Medellín

M1. Modelo mayor, con más parámetros

M2.- Modelo menor, o modelo reducido, con menos

parámetros.

Se obtiene a partir de M1, al especificar el valor de

uno o más parámetros, o establecer relaciones entre

ellos.

Se obtiene una medida de la discrepancia entre E1 y

O, Disc (M1); también la discrepancia entre E2 y O,

Disc (M2).46Universidad Nacional de

Colombia . sede Medellín

Disc (M2) es mayor que Disc (M1), pero ¿es mucho

mayor o no?

La diferencia entre el “ajuste” de ambos modelos, se

valora en términos de la probabilidad (P) de una

diferencia como esa o mayor si M2 es cierto.

Si P< 0.05 se adopta M1, si P>0.05 se considera M2

como bueno. (Principio de Parsimonia o “Navaja de

Ockam”)47Universidad Nacional de

Colombia . sede Medellín

48

La gran dificultad en la enseñanza es que se dan los

conceptos de probabilidad y de estadística desligados entre

si. Vg. después de 3 o 4 clases sobre probabilidades de

ciertos resultados en juegos de azar, o urnas, (espacios

equiprobables), se pasa a la prueba de hipótesis sobre una

media, a comparar dos medias, donde ahora se usa otro

concepto de probabilidad. !Con razón los alumnos sufren y

no entienden¡. Otro gravísimo problema es que no se toca

el hecho de que la estadística se usa como parte del

proceso de adquisición de conocimientos en muchas

disciplinas y como tal, deben contemplarse los diseños de

investigación de donde surgen los datos. Los datos nunca

son “datos puros”, están ligados a un propósito y a un

diseño. Debe contemplarse la estadística como parte de la

metodología de investigación

Universidad Nacional de Colombia . sede Medellín

49

1. Enfatizar que la estadística aplicada se convierte en

parte de la metodología de investigación.

2. Minimizar temas de Estadística descriptiva. Si es

importante, pero se debe ligar a la caracterización

de una población. El concepto de población(es) en

estudio es fundamental .

3. Presentar los conceptos de probabilidad clásica y

subjetiva, pero con mas énfasis el de probabilidad

frecuentista. Regularidad Estadística como

estabilización de frecuencias relativas al incrementar

el tamaño de la muestra. Limite de frecuencias

relativas. Ley de los grandes números. Modelos de

distribución de eventos en las poblaciones.

Universidad Nacional de

Colombia . sede Medellín

50

4.-“Distribuciones derivadas del muestreo” .

Distribuciones para “estadísticos”, estimadores y

estadísticas de prueba. Teorema Central del

Limite. Regularidad Estadística de segundo nivel.

Error estándar

5.- Intervalos de confianza y pruebas de hipótesis.

6.-Liga de los conceptos con investigaciones reales.

7.-Debe quedar muy claro que la inferencia es para

conocer algo de la regularidad estadística de una

medición en una o más poblaciones. Esto se

inserta en las hipótesis de la investigación