que es estadística

Post on 12-Jan-2016

216 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Trabajo sobre que es la estadistica

TRANSCRIPT

Que es estadística

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado de la estadistica con la investigación científica.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.

Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

La estadística se divide en dos grandes áreas:

1. Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

2. Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. La estadística inferencial, por su parte, se divide en estadística paramétrica y estadística no paramétrica.

Hay también una disciplina llamada estadística matemática, la que se refiere a las bases teóricas de la materia.

La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, entre otros.

Origen

El término alemán Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refería al análisis de datos del Estado, es decir, la «ciencia del Estado» (o más bien, de la ciudad-estado). También se llamó aritmética política de acuerdo con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico sir John Sinclair (1754-1835).

Orígenes en probabilidad

Los métodos estadístico-matemáticos emergieron desde la teoría de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento científico que se conoce a la materia. El Ars coniectandi (póstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemáticas.1 En la era moderna, el trabajo de Kolmogórov ha sido un pilar en la formulación del modelo fundamental de la Teoría de Probabilidades, el cual es usado a través de la estadística.

Estado actual

Durante el siglo XX, la creación de instrumentos precisos para asuntos de salud pública (epidemiología, bioestadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales en las prácticas estadísticas.

Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras áreas. La estadística es entendida generalmente no como un sub-área de las matemáticas sino como una ciencia diferente «aliada». Muchas universidades tienen departamentos académicos de matemáticas y estadística separadamente. La estadística se enseña en departamentos tan diversos como psicología, educación y salud pública.

Estudios experimentales y observacionales

Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadísticos para estudiar causalidad: estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una

variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo.

Descriptiva

La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar a un conjunto de datos, con el fin de describir apropiadamente las características de este. Este análisis es muy básico. Aunque hay una tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo,

Estadística y Los Conceptos

La Estadística es la ciencia que se encarga de recolectar datos de una población o muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la antigüedad, las primeras culturas recopilaban datos poblacionales por medio de censos como los realizados en Egipto por Moisés (según consta la Biblia) y el empadronamiento que fue efectuado por los romanos en Judea.

A partir del siglo XIX , entre otros, con el aporte de Adolphe Quetelet (1796-1874), se crearon diferentes métodos de cálculo de probabilidades para determinar y analizar el tipo de datos que regulan algunos fenómenos.

La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase).

Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

La Estadística descriptiva registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que describen el conjunto estudiado.

Inferencial

La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una pequeña parte de la misma. La estadística inferencial comprende como aspectos importantes:

La toma de muestras o muestreo, que se refiere a la forma adecuada de considerar una muestra que permita obtener conclusiones estadísticamente válidas y significativas.

La estimación de parámetros o variables estadísticas, que permite estimar valores poblacionales a partir de muestras de mucho menor tamaño.

El contraste de hipótesis, que permite decidir si dos muestras son estadísticamente diferentes, si un determinado procedimiento tiene un efecto estadístico significativo, etc.

El diseño experimental. La inferencia bayesiana. Los métodos no paramétricos

Planteamiento del problema

Un problema de inferencia estadística suele iniciarse con una fijación de objetivos o algunas preguntas del tipo:

¿cuál será la media de esta población respecto a tal característica?

¿Se parecen estas dos poblaciones?

¿Hay alguna relación entre ... ?

En el planteamiento se definen con precisión la población, la característica a estudiar, las variables, etc.

Elaboración de un modelo

En caso de establecer un modelo teórico, se replantea el procedimiento y se llega a una conclusión lógica.

Los posibles modelos son distribuciones de probabilidad.

Extracción de la muestra

Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.

Tratamiento de los datos

En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media muestral, la varianza muestral

Los métodos de esta etapa están definidos por la estadística descriptiva.

Estimación de los parámetros

Con determinadas técnicas se realiza una predicción sobre cuáles podrían ser los parámetros de la población

Contraste de hipótesis

Artículo principal: Contraste de hipótesis

Los contrastes de hipótesis son técnicas que permiten simplificar el modelo matemático bajo análisis. Frecuentemente el contraste de hipótesis recurre al uso de estadísticos muestrales.

Conclusiones

Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para tomar decisiones o hacer predicciones.

El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico que permite conocer cada vez mejor la población y características de estudio.

Población

Población estadística, en estadística, también llamada universo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. También es el conjunto sobre el que estamos interesados en obtener conclusiones (inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la extracción de una muestra de ésta.

El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

Destacamos algunas definiciones:

"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística y en nuestro caso social, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos.

Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de habitantes de una comarca.

Cuando la población es muy grande, es obvio que la observación y/o medición de todos los elementos se multiplica la complejidad, en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.

Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo denominada muestra.

Población: Es la colección de datos que corresponde a las características de la totalidad de individuos, objetos, cosas o valores en un proceso de investigación.

Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.

Poblaciones Finitas: Constan de un número determinado de elementos, susceptible a ser contado. Ejemplo: Los empleados de una fábrica, elementos de un lote de producción, etc.

Poblaciones Infinitas: Tienen un número indeterminado de elementos, los cuales no pueden ser contados. Ejemplo: Los números naturales.

Así también las poblaciones pueden ser clasificadas en Reales e Hipotéticas, las reales son aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores de una empresa. Mientras que las hipotéticas, son las formas imaginables en que se podría presentar un suceso. Ejemplo: Estimaciones de la población económicamente activa dentro de diez años.

En toda investigación lo ideal sería contar con observaciones o características de todos los elementos de nuestro grupo de interés, pero en muchas ocasiones eso sería muy caro y/o muy tardado o simplemente imposible, es por ello que se toman muestras.

Muestra

Muestra: “Es una parte representativa de la población que es seleccionada para ser estudiada, ya que la población es demasiado grande para ser estudiada en su totalidad” Allen Webster.

Ya que se ha definido que es población y muestra, se procede a definir dos conceptos que se encuentran íntimamente relacionados a ellos:

En estadística, una muestra es un subconjunto de casos o individuos de una población estadística.

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).

Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.

El número de sujetos que componen la muestra suele ser bastante inferior a la población total, aunque suficiente grande como para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

Espacio muestral

El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.

Parámetro o Estadístico muestral

Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a partir de la muestra, como por ejemplo la media, varianza o una proporción, que describe a una población y puede ser estimado a partir de una muestra. Un estadístico muestral es un tipo de variable aleatoria, y que como tal, tiene una distribución de probabilidad concreta, frecuentemente caracterizada por un conjunto finito de parámetros.

Estimación

Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro referido a la población, a partir de los estadísticos muestrales calculados a partir de los elementos de la muestra. Si se estima el suficiente número de parámetros puede aproximarse de manera razonable la distribución de probabilidad de la población para ciertas variables aleatorias.

Nivel de confianza

El nivel de confianza de una aseveración basada en la inferencia estadística es una medida de la bondad de la estimación realizada a partir de estadísticos muestrales. Usualmente se usan niveles de confianza para intervalos de confianza o bien p-valores que miden la probabilidad de errores de tipo I (probabilidad de rechazar una cierta hipótesis siendo que esta era correcta).

Ejemplo

Se tiene una población de 222.222 habitantes y se quiere conocer cuantos de ellos son hombres y cuantos de ellos son mujeres. Se conjetura que cerca del 50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra para determinar cuantos hombres y mujeres hay en la muestra y a partir de ahí inferior el porcentaje exacto de hombres y mujeres en la población total. La descripción de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo mostrado en el siguiente ejemplo:

Dimensión de la población: 222.222 habitantesProbabilidad del evento: Hombre o Mujer 50%Nivel de confianza: 90%Desviación tolerada: 5%Resultado 196Tamaño de la muestra: 270

La interpretación de esos datos sería la siguiente:

1. La población a investigar tiene 222.222 habitantes y queremos saber cuántos son hombres o mujeres.

2. Estimamos en un 50% para cada sexo y para el propósito del estudio es suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.

3. Generamos una tabla de 280 números al azar entre 1 y 222.222 y en un censo numerado comprobamos el género para los seleccionados.

Variable

Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de una teoría. En este caso se las denomina constructos o construcciones hipotéticas.

Existen diferentes tipos de variables: -cuantitativa -cualitativa -cualitativa discreta -cuantitativa discreta

Variables cualitativas

Son el tipo de variables que como su nombre lo indica expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores.

Variables cuantitativas

Son las variables que toman como argumento, cantidades numéricas, son variables matemáticas. Las variables cuantitativas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista un valor entre dos variables.

Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra variable. La variable independiente se representa en el eje de abscisas.

Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.

Variables dependientes

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una función se suele representar por y. La variable dependiente se representa en el eje ordenadas. Son las variables de respuesta que se observan en el estudio y que podrían estar influidas por los valores de las variables independientes.

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Variables intervinientes

Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Y es muy similar a la variable moderadora aunque no son iguales solo son muy similares a la forma de relacionarlas.

Variables moderadoras

Según Tuckman: Representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.

Nombre: Zuceli Yanira Tunche Canel

Maestro: Javier abarca

Grado: 4to Bachillerato en computación con orientación comercial

Colegio: Imanol

Días: martes

Fecha: 25/08/2015

top related