representación numérica v1.1

21
Estadística básica Unidad 2. Representación numérica y gráfica de datos ESAD Página Contenido I. Presentación de la unidad.............................2 II.Organización de datos y distribución de frecuencias. . .3 a. Introducción........................................... 3 b. Frecuencias............................................ 3 i. Frecuencia o Frecuencia absoluta......................4 ii.Frecuencia absoluta acumulada.........................4 iii....................................Frecuencia Relativa 4 iv.Frecuencia Relativa Acumulada.........................5 v. Ejemplo de organización de frecuencias................6 c. Intervalos............................................. 7 d. Construcción de una tabla con intervalos de clase......7 e. Tablas de datos........................................ 9 f. Tablas de frecuencias.................................10 g. Tablas por intervalos de clase........................10 h. Tablas de doble entrada...............................11 III. Representación gráfica de los datos.................12 a. Introducción.......................................... 12 b. Histograma............................................ 12 c. Gráfica de barras.....................................12

Upload: rodrigo-jesus-ramirez-tomasini

Post on 29-Jun-2015

655 views

Category:

Documents


0 download

DESCRIPTION

Principios de estadística descriptiva

TRANSCRIPT

Page 1: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Contenido

I. Presentación de la unidad..............................................................2

II. Organización de datos y distribución de frecuencias.....................3

a. Introducción.....................................................................................3

b. Frecuencias......................................................................................3

i. Frecuencia o Frecuencia absoluta.................................................4

ii. Frecuencia absoluta acumulada....................................................4

iii. Frecuencia Relativa.......................................................................4

iv. Frecuencia Relativa Acumulada....................................................5

v. Ejemplo de organización de frecuencias.......................................6

c. Intervalos.........................................................................................7

d. Construcción de una tabla con intervalos de clase..........................7

e. Tablas de datos................................................................................9

f. Tablas de frecuencias....................................................................10

g. Tablas por intervalos de clase........................................................10

h. Tablas de doble entrada.................................................................11

III. Representación gráfica de los datos..........................................12

a. Introducción...................................................................................12

b. Histograma.....................................................................................12

c. Gráfica de barras............................................................................12

d. Gráfica de líneas............................................................................13

e. Gráfica de áreas o de pastel.....................................................................................13

Page 2: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Representación numéricay gráfica de datos

I. Presentación de la unidad

Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para obtener los datos deseados. Existen muchos métodos para recolectar información, pero los más frecuentes son:

Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, revisa en qué consisten.

Un experimento es una prueba que se realiza para determinar las características o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos te parecen más salados.

También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las características o comportamientos del fenómeno que se analiza.

La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es que la velocidad de la luz en el vacío es de 300 000 km/seg.

Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error experimental.

Page 3: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados de acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.

II. Organización de datos y distribución de frecuencias

a. Introducción

La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área sólo describe, resume, organiza y representa los datos obtenidos de una población o muestra de la población, sin elaborar inferencias ni obtener conclusiones.La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y distribución de estos datos. A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

Page 4: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

b. Frecuencias

Page 5: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

i. Frecuencia o Frecuencia absoluta

La frecuencia o frecuencia absoluta es el número de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendrías:

Dato Frecuencia2 2 (porque se repite 2 veces)3 3 (porque se repite 3 veces)4 2 (porque se repite 2 veces)5 4 (porque se repite 4 veces)

Total de datos (N) 11

ii. Frecuencia absoluta acumulada

La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el renglón i, se representa como Fi. También es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior:

Dato Frecuencia Frecuencia acumulada2 2 2 (hasta aquí tienes 2 datos

3 35 (la suma de la frecuencia del primer dato con la

del segundo dato 2+3)5 2 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5)

7 411 (frecuencia de 2+frecuencia de 3+frecuencia de 5

frecuencia de 7)Total de datos (N)

11

iii. Frecuencia Relativa

La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el número total de datos (N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato también puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior:

Dato FrecuenciaFrecuencia acumulada

Frecuancia relativa

2 2 2 0.181 (se divide 2/11)

Page 6: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

3 3 5 0.272 (se divide 3/11)4 2 7 0.181 (se divide 2/11)5 4 11 0.363 (se divide 4/11)

Total de datos (N)

11

iv. Frecuencia Relativa Acumulada

La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el renglón i. Se representa como Hi, observa el ejemplo:

Dato FrecuenciaFrecuencia acumulada

Frecuencia relativa

Frecuencia relativa acumulada

2 2 2 0.18180.1818 (hasta este

renglón sólo tienes esta frecuencia relativa)

3 3 5 0.2727

0.4545 (se suma la frecuencia relativa del primer dato con la del

segundo dato 0.1818+0.2727)

5 2 7 0.1818

0.6363 (la frecuencia relativa de 2+la

frecuencia relativa de 3+la frecuencia relativa

de 5)

7 4 11 0.3636

0.9999 (la frecuencia relativa de 2+la

frecuencia relativa de 3+la frecuencia relativa

de 5+la frecuencia relativa de 7)

Total de datos (N)

11

Page 7: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

v. Ejemplo de organización de frecuencias

En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos presentados son los siguientes:

18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

No. Renglón

Datos obtenidos

de la variable

Frecuencia fi

Frecuencia Acumulada

Fi

Frecuencia Relativa hi

Frecuencia Relativa Acumulada

Hi

1 7 f1 = 2 f1 = F1 = 2 h1=f1/N=0.0625 h1=H1=0.0625

2 18 f2 = 6f1 +f2 = F2

=8h2=f2/N=0.1875

h1+h2=H2=0.2500

3 23 f3 = 8f1 +f2 +f3

= F3 = 16

h3=f3/N=0.2500h1+h2+h3=H3=0.5000

4 41 f4 = 4 F4 = 20 h4=f4/N=0.1250h1+h2+h3+h4=H4=0.6250

5 47 f5 = 7 F5 = 27 h5=f5/N=0.2187h1+h2+h3+

h4+h5=H5=0.8430

6 52 f6 = 5 F6 = 32 h6=f6/N=0.1563h1+h2+h3+h4+h5+h6=H6=1.0000

Total N=32

Page 8: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

c. Intervalos

Otro concepto muy utilizado en estadística descriptiva es el de intervalo. Conoce qué es y los demás conceptos asociados.

Intervalos

Conjunto de valores agrupados entre dos números, conocidos como límites, en este caso, límites del intervalo.

Intervalo de clase

Se llama intervalo de clase a la expresión que denota un intervalo.

Amplitud del intervaloLa amplitud del intervalo es la distancia que hay entre los límites superior e inferior

del intervalo. Se calcula restando el valor del límite inferior al valor del límite superior.

Frontera de claseSon los puntos medios entre los límites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el

límite inferior del siguiente.Marca de Clase

También conocida como punto medio de clase, es el resultado de la suma de los límites inferior y superior del intervalo, dividido entre dos

d. Construcción de una tabla con intervalos de clase

Datos

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Se acomodan los datos de menor a mayor: 3, 7, 11, 13, 13, 15, 15, 17, 20, 22, 24, 25, 26, 27, 28, 28, 29, 31, 32, 32, 33, 34, 34, 34, 35, 35, 36, 36, 37, 38, 38, 38, 39, 39, 41, 42, 43, 44, 47, 48

Calculamos el rango primero se localizan los valores mayor y menor de la distribución

En este caso son: 3 y 48

Page 9: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Ahora se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos de queramos poner.Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso son: 48 – 3 = 45, el rango es 45.Si queremos 10 intervalos o clases, incrementamos el número hasta 50 (que es un múltiplo de 10) y dividimos el nuevo rango entre el número de clases 50 /10 = 5.Esta es la amplitud del intervalo. Se simboliza con k = 5.

Otra forma es redondear al final el número. Es decir, tomamos el 45, en lugar de incrementar a 50; dividimos el rango original 45/10 = 4.5.

Si hacemos k = 4 entonces no serán suficientes las clases para nuestros datosya que 4*10 =40 y el dato mayor es 48, por tanto redondeamos y nuevamente obtenemos k=5.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

Identificamos el límite que pertenece con un corchete [ y al que no con un paréntesis ). Los intervalos quedan de la siguiente forma:

[0,5); [5,10); [10,15); [15,20); [20,25); [25,30); [30,35); [35,40); [40,45); [45,50)

O bien se pueden escribir de la siguiente manera sin ser tan formales en cuanto al lenguaje matemático

0-4; 5-9; 10-14; 15-19; 20-24; 25-29; 30-34; 35-39; 40-44; 45-49.

Como se puede observar al restar el límite superior menos el límite inferior (Ls – Li) en todos los casos obtenemos 5 que es la longitud o amplitud del intervalo.

En la siguiente tabla se muestran los intervalos; los límites de la clase inferior (Li) y superior (Ls); las fronteras de las clases o límites reales de clase (Lr) y los representantes de clase o marca de clase o punto medio de clase (Ci).

Page 10: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Intervalo Li Ls Lr Ci

0-4 0 4 (4+5)/2= 4.5 (0+4)/2= 2

5-9 5 9 (9+10)/2= 9.5 (5+9)/2= 7

10-14 10 14 (14+15)/2= 14.5 (10+14)/2= 12

15-19 15 19 (19+20)/2= 19.5 (14+19)/2= 17

20-24 20 24 (24+25)/2= 24.5 (20+24)/2= 22

25-29 25 29 (29+30)/2= 29.5 (25+29)/2= 27

30-34 30 34 (34+35)/2= 34.5 (30+34)/2= 32

35-39 35 39 (39+40)/2= 40.5 (35+39)/2= 37

40-44 40 44 (44+45)/2= 44.5 (40+44)/2= 42

45-49 45 49 (45+49)/2= 47

e. Tablas de datos

Existen diferentes tipos de tablas para presentar datos, las más utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qué consiste cada una:

Tablas de datosUna tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos.

Ejemplo:Imagina que la medición de temperatura a lo largo del día da como resultado los siguientes valores (en grados Celsius): 20.4°, 21.2°, 22.1°, 23.9°, 25.3°, 26.9°, 27.7°

A partir de estos valores construyes la siguiente tabla:

Page 11: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

f. Tablas de frecuencias

Las tablas de frecuencia aportan mayor información que las tablas de datos, ya que están construidas con las categorías de la variable que se está midiendo y su frecuencia.

Ejemplo:

Un experimento da como resultado los siguientes valores:

1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2

Si agrupas los datos por categorías, según la frecuencia o número de veces que aparece cada dato, tendrías la siguiente tabla:

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

g. Tablas por intervalos de clase

En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable.

Ejemplo: En una encuesta sobre el desempleo en el área metropolitana de la ciudad de México, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

Page 12: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

h. Tablas de doble entrada

Estas tablas proporcionan información referente a dos variables o eventos relacionados entre sí. La información se distribuye poniendo en los renglones de la tabla la información de una de las variables y en las columnas la información de la otra variable. 

Ejemplo: Se cuenta el número de cirugías realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

1

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un líquido con respecto al tiempo de calentamiento. En el renglón colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

1 En el ejemplo las variables relacionadas son la edad y el número de cirugías.

Page 13: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

III. Representación gráfica de los datos

a. Introducción

Las gráficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de información que se quiere representar.

b. Histograma

El histograma es la representación gráfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medición o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras serán proporcionales a las frecuencias.

El histograma permite apreciar visualmente la distribución y dispersión de las mediciones.

c. Gráfica de barras

Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En éstas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.

La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Page 14: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Importante: Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separación entre las barras.

d. Gráfica de líneas

Una gráfica de líneas también se construye en un sistema coordenado rectangular y muestra la relación entre las variables mediante puntos conectados por líneas continuas. La frecuencia de cada valor medido es representada por la altura del punto.  

En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obteniéndose la gráfica de línea.

e. Gráfica de áreas o de pastel

Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta gráfica muestra la relación entre las variables dividiendo un círculo (o pastel) en sectores (o rebanadas). También, se utilizan para representar la distribución de frecuencias, pero es el área de cada sector la proporcional a los valores medidos.

Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categoría.

Page 15: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Ejemplo

DatosMedición en cm Frecuecia Frecuencia Acumulada Porcentaje

30 3 3 3 %

30.1 7 10 6 %

30.2 12 22 10 %

30.3 18 40 15 %

30.4 23 63 19 %

30.5 21 84 18 %

30.6 17 101 14 %

30.7 11 112 9 %

30.8 5 117 4 %

30.9 1 118 1 %

HistogramaEn esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

Page 16: Representación numérica v1.1

Estadística básicaUnidad 2. Representación numérica y gráfica de datos

ESAD

Página

Gráfica de pastelEn la gráfica de pastel se muestra dentro de cada “rebanada” la medición en cm y el porcentaje que corresponde a la frecuencia relativa.

Gráfica de líneaEn esta figura se muestra la frecuencia acumulada mediante una gráfica de línea.