distribución normal

23
Aguirre C. Carlos - Jara A. Camila – San Martín H. Ingrid – Vásquez R. Ximena – Zambrano S. Juan. DOCENTE | FERNANDO DONOSO Distribución Normal METODOS CUANTITATIVOS UNIVERSIDAD TECNOLÓGICA DE CHILE, SEDE IQUIQUE INGENIERÍA COMERCIAL Métodos cuantitativos.

Upload: juancarlos-zambrano-sepulveda

Post on 11-Jan-2016

38 views

Category:

Documents


0 download

DESCRIPTION

Unidad estadística para alumnos de primer año.

TRANSCRIPT

Aguirre C. Carlos - Jara A. Camila – San Martín H. Ingrid – Vásquez R. Ximena – Zambrano S. Juan. DOCENTE | FERNANDO DONOSO

Distribución Normal METODOS CUANTITATIVOS

UNIVERSIDAD TECNOLÓGICA DE CHILE, SEDE IQUIQUE INGENIERÍA COMERCIAL Métodos cuantitativos.

1

Índice

________________________________________________________________

Contenido Introducción: ......................................................................................................................................... 2

Antecedentes Históricos: ...................................................................................................................... 3

Aplicaciones:.......................................................................................................................................... 4

Propiedades y restricciones: ................................................................................................................. 5

Parámetros de la distribución Normal y su Gráfica: ............................................................................. 7

Cálculo de probabilidades asociadas a una curva normal específica .................................................... 8

Conclusión ........................................................................................................................................... 11

Bibliografía .......................................................................................................................................... 12

Evaluaciones y Autoevaluaciones ....................................................................................................... 13

2

Introducción: _____________________________________________________________________________________________

Tras siglos de haber sido descubierta, la distribución normal se ha convertido en una potente

herramienta de la estadística contemporánea la cual ha servido para interpretar múltiples fenómenos y

características de nuestra vida cotidiana mediante razones y áreas debajo de una campana, denominada

“la campana de Gauss”.

En el siguiente informe daremos a conocer una breve reseña histórica de cómo fue evolucionando y

desenvolviéndose el método desde siglo XVIII en donde fue estudiada y optimizada por muchos teóricos

analíticos de las probabilidades, y la aplicación que se le ha dado con el correr de los siglos. Dentro de

sus aplicaciones tenemos efectos cotidianos, de carácter fisiológico, psicológico, etc. Por otra parte,

también procederemos al análisis e interpretación de sus propiedades, como también sus restricciones

que condicionan los parámetros en los cuales se da la curva.

Conceptos como la desviación estándar, la media son los principales parámetros que analizaremos en

donde se explicaran desde su base matemática y la influencia en la forma de la campana, como también

el comportamiento de la distribución de los datos respecto a su número de desviaciones.

Una vez finalizado el análisis teórico y condicional de cómo se supedita el tema respecto a sus

propiedades y comportamientos, se aplicará un ejercicio para explicar todo lo antes mencionado y de

esta forma clarificar y demostrar la importancia de su aplicación y la factibilidad del uso de esta

herramienta estadística.

Antecedentes Históricos: ___________________________________________________________________________________________

La distribución normal se conoce como la curva de Gauss o campana de Gauss, famoso matemático

alemán del siglo XIX.

Su origen viene de la observación de un estadístico francés del siglo XVIII, Abraham de Moivre, que,

entre otras cosas, actuaba como consultor para temas de juegos. Observó,

que al lanzar una moneda, la probabilidad de obtener “cara” o “cruz” en N

tirada tenía una representación gráfica con una curva suave a medida

que N se hacía grande.

La distribución normal fue presentada por primera vez por Abraham de

Moivre en un artículo del año 1733, que fue reimpreso en la segunda

edición de su The Doctrine of Changes, de 1738. En el contexto de cierta

aproximación de la distribución binomial para grandes valores de n. Su

resultado fue ampliado por Laplace en su libro Teoría Analítica de las

Probabilidades (1812), y en la actualidad se llama Teorema de De-

Moivre-Laplace (Pierre Laplace).

Laplace usó la distribución en el análisis de errores de experimentos. El importante método de mínimos

cuadrados fue introducido por Legendre en 1805.

Gauss, que afirmaba haber usado el método desde 1794, lo justificó rigurosamente en 1809 asumiendo

una distribución normal de los errores. El nombre de Gauss (Carl Gauss) se ha asociado a esta

distribución porque la usó con profusión cuando analizaba datos astronómicos y algunos autores le

atribuyen un descubrimiento independiente del De Moivre. Esta atribución del nombre de la distribución

a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler.

El nombre de “campana” viene de Esprit Jouffret que usó el término “bell surface” (superficie campana)

por primera vez en 1872 para una distribución normal bivariante de componentes independientes. El

nombre de “distribución normal” fue otorgado independientemente por Charles S. Peirce, Francis Galton

y Wilhelm Lexis hacia 1875. A pesar de esta terminología, otras distribuciones de probabilidad podrían

ser más apropiadas en determinados contexto.

Distribución Normal o de Gauss:

La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754).

Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la

ecuación de la curva; de ahí que también se le conozca, más comúnmente, como la “campana de

Gauss”.

Variable aleatoria continua, X, cuya función de densidad presenta la siguiente estructura:

4

Aplicaciones: _________________________________________________________________________________________

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica

su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos

tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas

presentan una función de densidad cuya gráfica tiene forma de campana.

En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas

variables asociadas a fenómenos naturales que siguen el modelo de la normal.

Posiblemente ya estamos familiarizados con la denominada distribución normal (o curva normal): la

distribución simétrica y de forma acampanada que nos indica que la mayoría de los sujetos (u objetos)

de una población determinada no se aparta mucho de la media: en la medida en que los sujetos se van

apartando más de la media (porque se pasan o porque no llegan) van siendo menos y menos. Si

representamos esta distribución mediante un histograma simplificado, tendríamos algo parecido a lo que

vemos en la figura:

Lo primero que debemos captar es que la distribución normal nos remite a nuestra propia experiencia. Si

nos fijamos en la estatura de la gente que nos encontramos por la calle, vemos que la mayoría de la

gente es de estatura normal, y aquí llamamos normal a lo más frecuente; de hecho si vemos a alguien

que se aparta mucho de la media (de lo habitual) no pasa desapercibido y nos llama la atención. En la

experiencia de cada día, normal y frecuente, aplicado a cualquier rasgo, son expresiones casi sinónimas.

Cuando decimos que alguien es muy abierto y sociable, lo que queremos decir es que es más abierto y

sociable de lo que es normal, de lo que solemos encontrar habitualmente, de la misma manera que

decimos que una persona es muy callada cuando habla mucho menos que la mayoría de la gente. Casi

sin darnos cuenta estamos haciendo juicios relativos a lo que es normal encontrar en la generalidad de

las personas: el mucho y el poco, o el muy, sobre todo aplicados a las características de las personas,

dependen de lo que es más frecuente encontrar en nuestro medio. Si el muy abunda mucho, deja de ser

muy para pasar a ser normal o frecuente y ya no merece el muy que solemos reservar para lo

excepcional que viene a ser lo raro o infrecuente. Estos juicios, y esta distribución normal, son relativos a

cada población: un pigmeo de una estatura normal, cercana a la media de su población y muy frecuente

en su propio grupo, pasa a ser muy bajito y excepcional si lo incluimos en una población de

escandinavos: se aparta mucho de la media de esa población y será muy difícil encontrar un

5

escandinavo con esa estatura. Sin embargo ese pigmeo tiene una estatura normal, que no se aparta

mucho de la estatura media de su grupo. En ambos grupos, escandinavos y pigmeos, encontraremos

una distribución normal en estatura, aunque las medias de los dos grupos sean muy distintas. Esta

consideración (la normalidad es relativa a cada población) nos llevará más adelante a una serie de

aplicaciones relevantes en la investigación psicológica y educacional, no solamente para poder valorar si

un resultado o dato individual es atípico (si se aparta mucho de lo normal o esperado), sino, por ejemplo,

para determinar si unos sujetos que han pasado por una determinada experiencia pueden considerarse

normales en la población de los que no han pasado por esa experiencia (en ese caso es posible que iesa

experiencia haya sido inútil). La distribución normal que representamos mediante la curva normal, es un

modelo matemático teórico al que de hecho tienden a aproximarse las distribuciones que encontramos

en la práctica: estadísticas biológicas, datos antropométricos, sociales y económicos, mediciones

psicológicas y educacionales, errores de observación, etc.; es un modelo muy útil por su relación con el

cálculo de probabilidades que nos va a permitir hacer inferencias y predicciones.

Dentro de un sinfín de aplicaciones que tiene la distribución normal tenemos:

Caracteres morfológicos: de individuos (personas, animales, plantas,…) de una especie, por. Ejemplo:

Tallas, pesos, envergaduras, diámetros, perímetros, etc.

Caracteres fisiológicos: Por ejemplo; efecto de una misma dosis de un fármaco, o de una misma

cantidad de abono.

Caracteres sociológicos: Por ejemplo: consumo de cierto producto por un mismo grupo de

individuos, puntuaciones de examen.

Caracteres psicológicos: Por ejemplo: cociente intelectual, grado de adaptación a un medio……

Propiedades y restricciones:

Algunas propiedades de la distribución normal son:

1. Es simétrica respecto de su media, μ;

2. La moda y la mediana son ambas iguales a la media, μ;

3. Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.

4. Distribución de probabilidad en un entorno de la media:

a- en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el 68,26% de

la distribución;

b- en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la

distribución;

c- por su parte, en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida,

aproximadamente, el 99,74% de la distribución. Estas propiedades son de gran utilidad

para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que

prácticamente la totalidad de la distribución se encuentre a tres desviaciones típicas de

la media justifica los límites de las tablas empleadas habitualmente en la normal

estándar.

6

El hecho de que existan 3 desviaciones por lado, asegura casi una totalidad por extremo hacia el infinito

negativo y el infinito positivo asegura casi el 100% de los datos agrupados dentro de la campana. El

hecho de que existieran datos fuera de estas desviaciones da parámetros de datos que son Atípicos

dentro de la muestra pero es muy pocos casos sucede este fenómeno.

5. Si X ~ N (μ, σ2) y a y b son números reales, entonces (aX + b) ~ N (aμ + b, a

2).

6. Si X ~ N( μx, σx2) e Y ~ N( μy, σy

2) son variables aleatorias normales independientes, entonces:

Su suma está normalmente distribuida con U = X + Y ~ N (μx + μy, σx2 + σy

2)

(demostración). Recíprocamente, si dos variables aleatorias independientes tienen una

suma normalmente distribuida, deben ser normales (Teorema de Crámer).

7

Parámetros de la distribución Normal y su Gráfica: _______________________________________________________________________________________

Está caracterizada por dos parámetros:

1- la media, μ. Podemos interpretar la media como un factor de traslación.

2- y la desviación típica, σ. En donde σ>o. Y la desviación típica como un factor de escala, grado

de dispersión,

En realidad, como señalaremos también para otras distribuciones, no se trata de una única distribución

sino que corresponde a toda una familia caracterizada por sus parámetros media, μ , y desviación típica,

σ . Como puede observarse en la figura, su forma de «campana» es más apuntada cuanto menor es su

desviación típica.

Parámetros frente a Gráficas:

Tiene forma de campana, es asintótica al eje de las abscisas (para x = ±∞ ) Los puntos de inflexión

tienen como abscisas los valores µ ± σ.

Simétrica con respecto a la media (µ) donde coinciden la mediana (Mn) y la moda (Mo).

Los puntos de inflexión tienen como abscisas los valores µ ± σ.

8

μ

Distinto

σ

En la gráfica siguiente se muestra la altura de campana y su abertura depende dela magnitud de

su desviación, esto quiere decir que a menor desviación del eje X, más estrecha y alta será y a

mayor grado de desviación, será más ancha y con menor altura.

Lo cual muestra los parámetros que tiene la distribución en función a su curva y amplitud. Otro de los

parámetros es que σ sea > que 0.

Cálculo de probabilidades asociadas a una curva normal específica

_______________________________________________________________________

Dado que tanto µ como σ pueden asumir infinitos valores, es impracticable tabular las probabilidades

para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribución normal

reducida o tipificada.

Se define una variable Z:

Demostraremos con un ejercicio práctico como utilizar los valores.

Ejemplo: Al recolectar 850 datos con una distribución normal, se obtuvo una media de x = 27 y una

desviación estándar s = 5.34. Calcular el número de datos aproximados que hay entre la media y el dato

nominal x = 20

9

Reemplazando:

En este caso el valor de z es negativo, lo que significa que el dato nominal x = 20 está a la izquierda de

la media aritmética, pero en las tablas se busca simplemente como z.

= 1 31; le corresponde un porcentaje de área de 40.49%, representado gráficamente.

-4 -3 -2 -1 0 1 2 3 4

X= 27

X= 20

Z = 0 Z = -1,31

40,49%

10

Dado que son 850 datos en total, sacando proporciones tenemos:

100%= 850 y 40,49% = x por lo tanto nos queda:

850*40,49/100 = 344,165.

O hay 344 o hay 345 aproximadamente, pero no una fracción de ellos. De manera que lo correcto es

redondear y expresarlo no como que “es igual”, sino como “aproximadamente”. La solución entonces se

expresa así:

“Hay aproximadamente 344 datos entre la media y el dato nominal.”

11

Conclusión ___________________________________________________________________________________________

.

Hoy en día la distribución normal nos permite poder determinar y conocer la probabilidad de que se de

una determinada magnitud expresada en puntuaciones típicas. Dichas probabilidades las podemos

encontrar en las tablas de distribución normal, en donde permite visualizar la proporción de casos que

caen por debajo o encima de la puntuación típica.

A pesar de su simpleza y raciocinio al dominar las propiedades del sistema, es una potente herramienta

para determinar poblaciones, número de personas y x variables en ciertas zonas o áreas que podrían

darnos información muy valiosa a la hora de hacer algún estudio.

Dentro de la distribución normal se trabaja con una serie de aplicaciones estadísticas las cuales

presentan una función de densidad y se grafica en forma de campana (campana de gauss) y hace

referencia a una serie de propiedades que la identifica y alude que son el fundamento de los

procedimientos de inferencia, cosa que es muy importante ya que la mayor parte de las variables

aleatorias de los fenómenos naturales presentan un comportamiento al de la distribución.

El hecho de conocer las variables (varianza, población, promedio, media, etc.) nos permiten resolver

distintas áreas para un mismo problema y así poder determinar múltiples variables para una misma

muestra.

La tabla Z e inferir áreas respecto al número de desviaciones de la Media son herramientas que aportan

mucho a nuestros conocimientos y que sin duda alguna, nos aportarán soluciones viables y certeras a la

hora de determinar análisis más rigurosos frente a variables múltiples.

12

Bibliografía

Morales Vallejo, Pedro. Estadística aplicada a las ciencias sociales. España: Universidad Pontificia Comillas, 2008. ProQuest ebrary. Web. 13 July 2015. Pág.383 – 450.

García Perez, Alfonso. La Interpretación de los Datos, Una Introducción a la Estadística Aplicada. Universidad Nacional de Educación a Distancia, Madrid 2014.Capitulo 2: Modelización y Estimación “La Distribución Normal”. www.uned.es/publicaciones

Lacourdy, Nancy. Introducción a la Estadística. Capítulo 1:” El pensamiento estadístico”. “Herramienta para la formación de profesores de matemáticas” de la Universidad de Chile, 2011.

13

Evaluaciones y Autoevaluaciones

_____________________________________________________________________________________

Nombre de

Integrante: Juan Zambrano

Criterios De auto Evaluación (Marcar con

X)

Totalmente de

acuerdo De acuerdo Suficiente Insuficiente No

1. Respete y aporte opiniones

constructivas en lo que respecta a la

participación y la construcción de la

investigación.

x

2. Participé en la elaboración de temas y

desarrollo. x

3. Mantuve una actitud proactiva respecto

a las responsabilidades. x

4. Aporte en gran medida al desarrollo del

informe. x

5. Aporté ideas significativas las cuales se

aplicaron dentro del informe. x

6. Me preocupe por trabajar en los plazos

establecidos. x

7. Domino el tema después de haber

finalizado el informe. x

14

Integrantes del grupo

Criterios De Evaluación (Notas del 1 al 7) Darío Aguirre Camila Jara Ingrid San

Martín

Ximena

Vázquez Juan Zambrano

1. Cumplió con las tareas o materiales

asignados por el grupo. 7 6,5 6,5 6,5 -

2. Participó activamente en el trabajo

grupal. 7 6,5 6,5 6 -

3. Contribuyó para tener un buen ambiente

de trabajo. 7 7 7 7 -

4. Respetó y valoró las ideas de sus

compañeros de grupo. 7 7 7 7 -

5. Contribuyó para que el trabajo del grupo

fuera exitoso. 7 6,5 6,5 6,5 -

6. Se mostró responsable y ordenado. 7 7 7 6 -

7. Está totalmente de acuerdo con el

desempeño y trabajaría nuevamente con

él/ella.

6,5 6 6 6 -

Promedios 6,93 6,64 6,64 6,43 -

15

Nombre de

Integrante:

Ingrid San Martin H.

Criterios De auto Evaluación (Marcar con

X)

Totalmente de

acuerdo De acuerdo Suficiente Insuficiente No

1. Respete y aporte opiniones

constructivas en lo que respecta a la

participación y la construcción de la

investigación.

x

2. Participé en la elaboración de temas y

desarrollo. x

3. Mantuve una actitud proactiva respecto

a las responsabilidades. x

4. Aporte en gran medida al desarrollo del

informe. x

5. Aporté ideas significativas las cuales se

aplicaron dentro del informe. x

6. Me preocupe por trabajar en los plazos

establecidos. x

7. Domino el tema después de haber

finalizado el informe. x

16

Integrantes del grupo.

Criterios De Evaluación (Notas del 1 al 7) Darío Aguirre Camila Jara Ingrid San

Martín

Ximena

Vázquez Juan Zambrano

1. Cumplió con las tareas o materiales

asignados por el grupo. 7 7 7 7

2. Participó activamente en el trabajo

grupal. 7 7 7 7

3. Contribuyó para tener un buen ambiente

de trabajo. 7 7 7 7

4. Respetó y valoró las ideas de sus

compañeros de grupo. 7 7 7 7

5. Contribuyó para que el trabajo del grupo

fuera exitoso. 7 7 7 7

6. Se mostró responsable y ordenado. 7 7 7 7

7. Está totalmente de acuerdo con el

desempeño y trabajaría nuevamente con

él/ella.

7 7 7 7

Promedios 7 7

7 7

17

Nombre de

Integrante:

Ximena Vásquez Rodríguez

Criterios De auto Evaluación (Marcar con

X)

Totalmente de

acuerdo De acuerdo Suficiente Insuficiente No

1. Respete y aporte opiniones

constructivas en lo que respecta a la

participación y la construcción de la

investigación.

x

2. Participé en la elaboración de temas y

desarrollo. x

3. Mantuve una actitud proactiva respecto

a las responsabilidades. x

4. Aporte en gran medida al desarrollo del

informe. x

5. Aporté ideas significativas las cuales se

aplicaron dentro del informe. x

6. Me preocupe por trabajar en los plazos

establecidos. x

7. Domino el tema después de haber

finalizado el informe. x

18

Integrantes del GRUPO

Criterios De Evaluación (Notas del 1 al 7) Darío Aguirre Camila Jara Ingrid San

Martín

Ximena

Vásquez Juan Zambrano

1. Cumplió con las tareas o materiales

asignados por el grupo. 7 7 7 7

2. Participó activamente en el trabajo

grupal. 7 7 7 7

3. Contribuyó para tener un buen ambiente

de trabajo. 7 7 7 7

4. Respetó y valoró las ideas de sus

compañeros de grupo. 7 7 7 7

5. Contribuyó para que el trabajo del grupo

fuera exitoso. 7 7 7 7

6. Se mostró responsable y ordenado. 7 7 7 7

7. Está totalmente de acuerdo con el

desempeño y trabajaría nuevamente con

él/ella.

7 7 7 7

Promedios 7 7 7

7

19

Nombre de

Integrante:

Camila Jara Acevedo

Criterios De auto Evaluación (Marcar con

X)

Totalmente de

acuerdo De acuerdo Suficiente Insuficiente No

1. Respete y aporte opiniones

constructivas en lo que respecta a la

participación y la construcción de la

investigación.

x

2. Participé en la elaboración de temas y

desarrollo. x

3. Mantuve una actitud proactiva respecto

a las responsabilidades. x

4. Aporte en gran medida al desarrollo del

informe. x

5. Aporté ideas significativas las cuales se

aplicaron dentro del informe. x

6. Me preocupe por trabajar en los plazos

establecidos. x

7. Domino el tema después de haber

finalizado el informe. x

20

Integrantes del grupo.

Criterios De Evaluación (Notas del 1 al 7) Darío Aguirre Camila Jara Ingrid San

Martín

Ximena

Vázquez Juan Zambrano

1. Cumplió con las tareas o materiales

asignados por el grupo. 7 7 7 7

2. Participó activamente en el trabajo

grupal. 7 7 7 7

3. Contribuyó para tener un buen ambiente

de trabajo. 7 7 7 7

4. Respetó y valoró las ideas de sus

compañeros de grupo. 7 7 7 7

5. Contribuyó para que el trabajo del grupo

fuera exitoso. 7 7 7 7

6. Se mostró responsable y ordenado. 7 7 7 7

7. Está totalmente de acuerdo con el

desempeño y trabajaría nuevamente con

él/ella.

7 7 7 7

Promedios 7 7 7 7

21

Nombre de

Integrante:

Carlos Darío Aguirre

Criterios De auto Evaluación (Marcar con

X)

Totalmente de

acuerdo De acuerdo Suficiente Insuficiente No

1. Respete y aporte opiniones

constructivas en lo que respecta a la

participación y la construcción de la

investigación.

x

2. Participé en la elaboración de temas y

desarrollo. x

3. Mantuve una actitud proactiva respecto

a las responsabilidades. x

4. Aporte en gran medida al desarrollo del

informe. x

5. Aporté ideas significativas las cuales se

aplicaron dentro del informe. x

6. Me preocupe por trabajar en los plazos

establecidos. x

7. Domino el tema después de haber

finalizado el informe. x

22

Integrantes del GRUPO

Criterios De Evaluación (Notas del 1 al 7) Darío Aguirre Camila Jara Ingrid San

Martín Ximena Vásquez Juan Zambrano

1. Cumplió con las tareas o materiales

asignados por el grupo. 7 7 7 7

2. Participó activamente en el trabajo

grupal. 7 7 7 7

3. Contribuyó para tener un buen ambiente

de trabajo. 7 7 7 7

4. Respetó y valoró las ideas de sus

compañeros de grupo. 7 7 7 7

5. Contribuyó para que el trabajo del grupo

fuera exitoso. 7 7 7 7

6. Se mostró responsable y ordenado. 7 7 7 7

7. Está totalmente de acuerdo con el

desempeño y trabajaría nuevamente con

él/ella.

7 7 7 7

Promedios 7 7 7 7