estadÍstica.monografia.docxterminado.docxo.docx

21
MARCO TEÓRICO DESARROLLO DEL TEMA 1. HISTORIA La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas. La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas. Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los Nuragas, las primeros habitantes de la isla; estos monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servían para llevar la cuenta del ganado y la caza. Página 1

Upload: luis-gustavo-flores

Post on 01-Oct-2015

14 views

Category:

Documents


7 download

TRANSCRIPT

MARCO TERICODESARROLLO DEL TEMA1. HISTORIALa palabra Estadstica procede del vocablo Estado, pues era funcin principal de los Gobiernos de los Estados establecer registros de poblacin, nacimientos, defunciones, impuestos, cosechas. La necesidad de poseer datos cifrados sobre la poblacin y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas.Es difcil conocer los orgenes de la Estadstica. Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Su origen empieza posiblemente en la isla de Cerdea, donde existen monumentos prehistricos pertenecientes a los Nuragas, las primeros habitantes de la isla; estos monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servan para llevar la cuenta del ganado y la caza. Hacia el ao 3.000 a.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y los gneros vendidos o cambiados mediante trueque. Los egipcios ya analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides. En los antiguos monumentos egipcios se encontraron interesantes documentos en que demuestran la sabia organizacin y administracin de este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacan censos. Tal era su dedicacin por llevar siempre una relacin de todo que hasta tenan a la diosa Safnkit, diosa de los libros y las cuentas. Todo esto era hecho bajo la direccin del Faran y fue a partir del ao 3050 a.C. En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Nmeros, el censo que realiz Moiss despus de la salida de Egipto. Textualmente dice: "Censo de las tribus: El da primero del segundo ao despus de la salida de Egipto, habl Yavpe a Moiss en el desierto de Sina en el tabernculo de la reunin, diciendo: "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel. En el llibro bblico Crnicas describe el bienestar material de las diversas tribus judas. En China existan los censos chinos ordenados por el emperador Tao hacia el ao 2.200 a.C. Posteriormente, hacia el ao 500 a.C., se realizaron censos en Roma para conocer la poblacin existente en aquel momento. Se erigi la figura del censor, cuya misin consista en controlar el nmero de habitantes y su distribucin por los distintos territorios. En la Edad Media, en el ao 762, Carlomagno orden la creacin de un registro de todas sus propiedades, as como de los bienes de la iglesia. Despus de la conquista normanda de Inglaterra en 1.066, el rey Guillermo I, el Conquistador, elabor un catastro que puede considerarse el primero de Europa. Los Reyes Catlicos ordenaron a Alonso de Quintanilla en 1.482 el recuento de fuegos (hogares) de las provincias de Castilla.2. CONCEPTOSi bien no hay una definicin de estadstica exacta, se puede decir que la "estadstica es el estudio de los mtodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias cientficas partiendo de tales datos".Esta definicin cubre gran parte de la actividad del cientfico. Es importante observar que el objeto del que realiza el anlisis estadstico son los datos y las observaciones cientficas por s mismos, mas que el material qumico que interviene en el estudio.Por lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica.La estadstica se puede dividir en 2 categoras, la "estadstica descriptiva" y la "inferencia estadstica".La estadstica descriptiva implica la abstraccin de varias propiedades de conjuntos de observaciones, mediante el empleo de mtodos grficos, tabulares numricos. Entre estas propiedades, estn la frecuencia con que se dan varios valores en la observacin, la nocin de un valor tpico o usual, la cantidad de variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 mas variables.El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan deducir de conjuntos de datos. La estadstica descriptiva sirve como mtodo para organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones.La inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose en informacin incompleta.Por ejemplo, Mendel al estudiar la manera como diferan entre s las plantas de guisantes en altura, color de las semillas, color de las vainas y color de las flores, tuvo que hacer sus conclusiones necesariamente basndose en un grupo de plantas relativamente poco numeroso comparado con toda la poblacin de plantas de guisantes de un tipo particular.[footnoteRef:2] [2: GUERRA PEALOZA, Jos y Guerra Sato, Ana Mara (1996). historia y concepto de la estadistica, 1 Edicin, Lima: Editorial RODHAS.]

Al hacer un enunciado, como por ejemplo, sobre el color de las flores, las conclusiones de Mendel dependan de la muestra particular de plantas disponibles para este estudio.En la terminologa estadstica, el procedimiento inductivo implica el hacer inferencias acerca de una poblacin adecuada universo a la luz de lo averiguado en un subconjunto aparte o muestra.La inferencia estadstica se refiere a los procedimientos mediante los cuales se pueden hacer tales generalizaciones inducciones.Es importante por todo lo dicho anteriormente, que el proceso de la inferencia cientfica, implica el grado mas elevado de cooperacin entre la estadstica y el estudio experimental.Los grficos se han de explicar enteramente por s mismos. El contenido de un grfico deber ser tan completo como sea posible.Las escalas vertical y horizontal estarn rotuladas con claridad dando las unidades pertinentes. La mayoras de los grficos presentan informacin numrica con escalas, que deben rotularse para describir completamente la variable presentada en la escala y para variables de medida se dirn las unidades de medicin.No se debe tratar de abarcar demasiada informacin en un solo grfico. Es mejor hacer varios grficos que comprimir toda la informacin en uno solo. Una regla prctica segura es evitar grficos que contengan ms de 3 curvas.Los grficos tienen que dar una visin general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas.Las tablas se explicarn por s mismas enteramente. como los grficos, se ha de dar suficiente informacin en el ttulo y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique fcilmente su contenido.Como el ttulo ser por lo general lo primero que se lee en detalle, deber suministrar toda la informacin esencial sobre el contenido de la tabla y deber especificar el tiempo, lugar, material estudio experimental y relaciones que se presenten en la tabla. Para cada variable numrica se han de dar las unidades. La funcin del rayado es dar claridad de interpretacin. Las anotaciones de numricas del cero se han de escribir explcitamente. Una anotacin numrica no debe comenzar con una punto decimal. Los nmeros que indican valores de la misma caracterstica se han de dar con el mismo nmero de decimales.

3. IMPORTANCIA

La estadstica es una de las ramas de la ciencia matemtica que se centra en el trabajo con datos e informaciones que son ya de por s numricos o que ella misma se encarga de transformar en nmeros. La estadstica, si bien es una ciencia de extraccin exacta, tiene una injerencia directa en cuestiones sociales por lo cual su utilidad prctica es mucho ms comprensible que lo que sucede normalmente con otras ciencias exactas como la matemtica. Podemos decir que la funcin principal de la estadstica es justamente la recoleccin y agrupamiento de datos de diverso tipo para construir con ellos informes estadsticos que nos den idea sobre diferentes y muy variados temas, siempre desde un punto de vista cuantitativo y no cualitativo. Esto es muy importante remarcarlo ya que la estadstica se convierte entonces en una ciencia que nos habla de cantidades (por ejemplo, cuntas personas viven en un pas por metro cuadrado) pero no nos da informacin directa sobre la calidad de vida de esas personas. [footnoteRef:3] [3: BASADRE AYULO, Jorge (1978).importancia de la estadstica, 1 Edicin, Lima: Editorial Tipografa y Offset Peruana S.A.]

Lo interesante de la estadstica como ciencia es que en muchos casos, la informacin cuantitativa que nos brinda nos permite conocer a ese nivel mucho mejor a una sociedad, por ejemplo cuntas personas viven en un pas, cul es la tasa de desempleo, cul es la tasa de indigencia o pobreza, cul es el nivel promedio de educacin de esa sociedad, etc. Todos estos datos numricos son utilizados por los responsables del Estado a travs de sus distintos organismos y secretaras para luego realizar proyectos de diferente tipo que tengan que ver con mejorar esa situacin o mantenerla en el caso de que sea buena. En algunos casos, aunque no directamente, la estadstica tambin nos permite inferir (no conocer) la calidad de vida de una poblacin ya que si encontramos altas tasas de desempleo, pobreza y marginalidad podremos suponer que la calidad de vida es muy baja. La estadstica tiene una utilidad no slo en aspectos sociales si no que tambin sirve para todo tipo de investigacin cientfica si se tiene en cuenta que los datos estadsticos son el resultado de varios casos de entre los cuales se toma un promedio. As, una estadstica puede servir para una investigacin cientfica al demostrar que un porcentaje determinado de los casos observados represent un resultado particular y no otro. 4. CLASESLa Estadstica es la ciencia que trata la teora y aplicacin de mtodos apropiados para coleccionar, representar, resumir y analizar datos, as como realizar inferencias a partir de los mismos A partir de esta definicin, podemos considerar dos partes o vertientes de la Estadstica, en lo que se refiere fundamentalmente a su enfoque, esta son la: Descriptiva e Inferencial.A) Estadstica Descriptiva: Se define como la ciencia que sistematiza, recoge, ordena y presenta los datos referentes a un asunto, fenmeno o problema de investigacin, sin pretender extender las conclusiones que puedan extraerse de los datos a otros grupos distintos o ms amplios. Se calcula a partir de los datos de una muestra o de una poblacin. Ejemplo: El nivel promedio de inteligencia obtenido mediante la prueba Stanford Binet, result ser 104 para el grupo dos de estudiantes de Psicologa. Durante los ltimos dos das se han informado un total de ocho homicidios. En una entrevista a 1100 electores, se obtuvo la siguiente informacin: el candidato delPartido Conservador obtuvo la preferencia de un 44% de los encuestados, mientras que un 45% opt por el candidato del Partido Liberal y an se mantiene un 11% indeciso.B) Estadstica Inferencial: Su objetivo parte de la deduccin de leyes que rigen los diferentes fenmenos estudiados, para de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.Es decir, que para un anlisis estadstico inferencial se requiere utilizar tcnicas, procesamientos y anlisis estadsticos ms avanzados con los datos estadsticos obtenidos de la muestra, para as confirmar la veracidad de las inferencias que se haga sobre la respectiva poblacin a que corresponde la muestra.Generalmente, este tipo de anlisis emplea como herramienta bsica el clculo de probabilidades y se lleva cabo para exponer relaciones de causa y efecto, as como probar hiptesis y teoras cientficas.Ejemplo: Los estudiantes de Psicologa que obtuvieron un IQ de inteligencia sobre 120, probablemente obtendrn sobre 700 puntos en cada rea de la prueba de admisin para ingreso a la universidad. Si an hay un 11% de los electores indecisos y si la poblacin electoral es de cerca de 88 millones electores, quiere decir que an hay cerca de 10 millones de electores quienes realmente decidirn cul va a ser el candidato ganador.5. USOS DE LA ESTADSTICAS Los complejos problemas de la sociedad actual y el incesante avance de la tecnologa requieren cada vez en mayor grado el auxilio de la estadstica. esta ciencia se aplica a la fsica, la biologa, la medicina, problemas industriales o empresariales tales como estudio del mercado y control de calidad, censo de poblacin, sondeos de opinin pblica, estudios del comportamiento humano, etc.Aunque comnmente se asocie a estudios demogrficos, econmicos y sociolgicos, gran parte de los logros de la estadstica se derivan del inters de los cientficos por desarrollar modelos que expliquen el comportamiento de las propiedades de la materia y de los caracteres biolgicos. La medicina, la biologa, la fsica y, en definitiva, casi todos los campos de las ciencias emplean instrumentos estadsticos de importancia fundamental para el desarrollo de sus modelos de trabajo. Campos de aplicacin La estadstica es una ciencia de aplicacin prctica casi universal en todos los campos cientficos: En las ciencias naturales: se emplea con profusin en la descripcin de modelos termodinmicos complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o en la teora cintica de los gases, entre otros muchos campos. En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada. En economa: suministra los valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y microeconmicos. En las ciencias mdicas: permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera.

6. APLICACIN E IMPORTANCIA EN LA MINERA La minera de datos utiliza tcnicas de estadsticas y aprendizaje de las mquinas para construir modelos que predigan el comportamiento de futuro de los consumidores. Hoy, la tecnologa automatiza el proceso de minera la integra a los ya difundidos data Warehouse y la presenta como una herramienta relevante y til para la organizacin actual.

La minera de datos consiste en descubrir informacin interesante dentro de las bases de datos existentes en la organizacin pero que se encuentra escondida debido a la gran cantidad de datos almacenados.

Tcnicas analticas.

Existen distintas tcnicas para el anlisis de datos. Hay maneras convencionales como el OLAP, herramientas estadsticas, y , una de las ms nuevas, la minera de datos. El valor que entrega la minera de datos puede ser mejor entendida cuando se compara con otras tcnicas ms convencionales.Hiptesis utilizada por las tcnicas convencionales.Los modelos estadsticos son los ms tradicionales y comunes para hacer anlisis predictivos.Asumamos que se quiere predecir el ingreso de una determinada persona en funcin de su edad. La figura muestra que efectivamente existe una relacin entre edad e ingreso.La desventaja de la estadstica.Los modelos estadsticos tiene el trasfondo en el que uno debe asumir la forma del modelo a priori . La mayora de las bases de datos contienen mucha informacin sobre los clientes, a veces almacenadas en varios cientos de variables. Cuando se quiere construir un modelo, se debe seleccionar qu variables se van a utilizar e incorporar en el modelo, y que relacin entre las variables debiera existir; debido a esta condicin, muchas relaciones interesantes son pasadas por alto.[footnoteRef:4] [4: CATALANO, Edmundo F. (1999). Curso de estadstica de Mineria, 5 Edicin, Buenos Aires: Zavalia Editor. 2. GARCA MONTUFAR, Guillermo y FRANCISKOVIC INGUNZA, Militza (1999). Importancia de datos de la mineria, 1 Edicin, Lima: Grfica Horizonte S.A]

Por ejemplo, una analista podra querer determinar el factor de riesgo que se debe usar respecto de cada cliente asegurado en una compaa que asegura autos. El analista podra suponer que los conductores hombres son de alto riesgo y revisar las bases de datos para corroborar (o refutar por supuesto) ese supuesto.Si el supuesto no es corroborado por la base de datos, l podra ver si existe una relacin con otros factores como sexo y edad juntos como mejores predictores de riesgo.En otras palabras, la estadstica genera series de patrones hipotticos y relaciones que refuta o corrobora usando herramientas tambin estadsticas. Pero, qu pasa cuando el nmero de variables a ser analizada es del orden de los cientos?., en esos casos se hace mucho ms difcil (y desde luego demoroso) el encontrar buenas hiptesis, que por lo dems pueden pasar por alto informacin valiosa.La minera de datos revela informacin escondida.La minera de datos es muy distinta de la estadstica ya que, lejos de verificar patrones hipotticos, usa los mismos datos para descubrir los patrones existentes. Por ejemplo, supongamos que el analista que quera descubrir los factores de riesgo en el caso de la aseguradora de autos utiliza herramientas de minera de datos.El resultado sera que los hombres bajo los 24 aos son de alto riesgo pero adems le dara patrones que al analista no se le haba ocurrido pensar; como por ejemplo que el tipo de auto, en combinacin con la edad y el sexo tambin es un factor que debe determinar el coeficiente buscado.Aproximadamente un 5% de las relaciones totales podrn ser conocidas mediante los mtodos analticos tradicionales (como se ve en la figura anterior).La minera de datos, en cambio, descubre el otro 95 % de las relaciones existentes que no haban sido descifradas.[footnoteRef:5] [5: ]

En otras palabras, se podra decir que los mtodos tradicionales hablan a las bases de datos, mientras que la minera de datos escucha a la base datos. En los mtodos tradicionales, si no se hace la pregunta adecuada, nunca se escucharan respuestas satisfactorias; en cambio la minera de datos, explora al interior de las bases de datos desde cientos de puntos de vista diferente; logrando obtener las relaciones buscadas de los clientes.

As, en el ejemplo anterior, en vez de preguntar a la base de datos los hombres jvenes que manejan autos deportivos, constituyen un alto riesgo?; el usuario pregunta: Cules son los clientes que presentan mayor riesgo?.

Es la misma tecnologa de minera de datos la que se preocupa de formular las hiptesis como: los conductores jvenes en autos deportivos han incrementado el riesgo en accidentes u otras por el estilo.

Supongamos que la organizacin descubre por medio de la minera de datos que los conductores hombres de Santiago, con un ingreso mayor a los $800.000 son de bajo riesgo. Como la competencia no tiene esta informacin, la empresa puede realizar campaas de marketing orientadas a atraer a este tipo de clientes con interesantes beneficios para la organizacin y el cliente.

La minera de datos no reemplaza a la estadstica tradicional; es ms bien una extensin de la misma, que forma parte de un resultado que ha sido formado por la comunidad estadstica cambiando de manera radical ciertos aspectos.

El incremento en el poder de las computadoras y los bajos costos, unidos a la necesidad de analizar enormes bases de datos que contienen millones de filas, han permitido el desarrollo de nuevas tcnicas basadas en la exploracin a fuerza bruta de las posibles soluciones.

El punto clave es que la minera de datos es la aplicacin de stas y otras tcnicas estadsticas de inteligencia artificial a problemas de negocios en una manera tal, que son alcanzables tanto a usuarios de negocios como para expertos estadistas.

CONCLUSINSe le da un agradecimiento al profesor por haber dejado esta investigacin ya que gracias a ella pude saber que la estadstica provino desde antes de Cristo en el pas de Egipto, Persia, babilonia desde que Moiss levanto un censo del pueblo y cuando a avanzado, primer censo en Amrica fue llevado a cabo por los Incas y como muchos matemticos, filsofos, telogos, han experimentado y aplicado la estadstica hasta hoy en da que la seguimos utilizando y aplicando para la sociedad, ya que es un potente auxiliar de muchas ciencias y actividades humanas: sociologa, sicologa, geografa humana, economa, etc.Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer ms fcil su comprensin y entendimientos ya que la estadstica es la ciencia que trata de entender, organizar y tomar decisiones que estn de acuerdo con los anlisis efectuados

RECOMENDACIONES Es recomendable tomar en cuenta que la estadstica es muy importante en la vida social y laboral del hombre ya que generaliza informacin. Gracias a ello el anlisis de cualquier dato puede ser ms razonable y exacto. Es una herramienta indispensable para la toma de decisiones. Tambin es ampliamente empleada para mostrar los aspectos cuantitativos de una situacin

ANEXOS

BIBLIOGRAFA http://maralboran.org/wikipedia/index.php/Introducci%C3%B3n._M%C3%A9todos_estad%C3%ADsticos http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html humanidades.cchs.csic.es/cchs/web_UAE/historia/historia.htm www.slideshare.net/difariney/historia-y-conceptos-Estados Unidos http://www.eumed.net/libros/ Algunos libros.

Pgina 3