estadística para administración y...

1087

Upload: others

Post on 29-Dec-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

  • a

  • Estadística para Administracióny Economía

  • a

  • Estadística para Administracióny EconomíaSEXTA EDICIÓN

    Paul NewboldUniversity of Nottingham

    William L. CarlsonSt. Olaf College

    Betty M. ThorneStetson University

    TraducciónEsther Rabasco Espáriz

    Revisión TécnicaLuis TohariaUniversidad de Alcalá de Henares

    Prentice Hall, Upper Saddle River, New Jersey 07458 Madrid

  • Datos de catalogación bibliográfica

    Paul Newbold, William L. Carlson y Betty M. ThorneEstadística para Administración y Economía

    PEARSON EDUCACIÓN, S.A., Madrid, 2008

    ISBN: 978-84-8322-403-8Materia: 519.5 Métodos estadísticos

    Formato 195 # 250 mm Páginas: 1088

    Todos los derechos reservados.Queda prohibida, salvo excepción prevista en la Ley, cualquier forma de reproducción, distribución,comunicación pública y transformación de esta obra sin contar con autorización de los titularesde propiedad intelectual. La infracción de los derechos mencionados puede ser constitutivade delito contra la propiedad intelectual (arts. 270 y sgts. Código Penal).

    Authorized translation from the English language edition, entitled STATISTICS FOR BUSINESSAND ECONOMICS, 6th Edition by NEWBOLD, PAUL; CARLSON, WILLIAM; THORNE, BETTY,published by Pearson Education, Inc, publishing as Prentice Hall, Copyright 5 2007.

    All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means,electronic or mechanical photocopying, recording or by and information storage retrievalsystem, without permission from Pearson Education, Inc.

    Spanish language edition published by PEARSON EDUCATION S.A., Copyright 5 2008

    DERECHOS RESERVADOS5 2008 por PEARSON EDUCACIÓN, S.A.Ribera del Loira, 2828042 Madrid (España)

    Paul Newbold, William L. Carlson y Betty M. ThorneEstadística para Administración y Economía

    ISBN: 978-84-8322-403-8Depósito legal:

    PEARSON PRENTICE HALL es un sello editorial autorizado de PEARSON EDUCACIÓN, S.A.

    Equipo editorial:Editor: Alberto CañizalTécnico editorial: Elena Bazaco

    Equipo de producción:Director: José Antonio ClaresTécnico: José Antonio Hernán

    Diseño de cubierta: Equipo de diseño de PEARSON EDUCACIÓN, S.A.

    Composición: COPIBOOK, S.L.

    Impreso por:

    IMPRESO EN ESPAÑA - PRINTED IN SPAINEste libro ha sido impreso con papel y tintas ecológicos

  • Dedico este libro a mi mujer Charlotte, a nuestros hijos Andrea,Douglas y Larry y a nuestros nietos Ezra, Savanah,

    Rellana, Anna, Eva Rose y Emily

    William L. Carlson

    Dedico este libro a mi marido Jim y a nuestra familiaJennie, Ann, Renee, Jon, Chris, Jon, Marius, Mihaela,

    Cezara y Anda

    Betty M. Thorne

  • a

  • SOBRE LOS AUTORES

    Bill Carlson es profesor emérito de economía en St. Olaf College,donde lleva 31 años enseñando, ha sido varias veces director de de-partamento y ha desempeñado diversas funciones administrativas,entre las que se encuentra la de Director del Centro de Cálculo.También ha ocupado diversos cargos en la administración pública deEstados Unidos y en la Universidad de Minnesota, además de pro-nunciar conferencias en numerosas universidades. Fue elegidomiembro honorario de Phi Beta Kappa. También trabajó 10 años enel sector privado y en empresas de consultoría antes de iniciar su ca-rrera en St. Olaf. Se licenció en ingeniería en la Michigan Technolo-gical University (BS), realizó un Máster (MS) en el Illinois Instituteof Technology y se doctoró (Ph.D.) en Administración Cuantitativade Empresas en la Rackham Graduate School de la Universidad deMichigan. Entre sus investigaciones, se encuentran numerosos estu-dios sobre la administración de empresas, la seguridad vial y la ense-ñanza de la estadística. Ha publicado anteriormente dos libros detexto de estadística. Ha sido profesor encargado de numerosos gru-pos de estudiantes que han realizado estancias de estudio en diversospaíses de todo el mundo. Entre los cargos que ocupa actualmente seencuentran el de Director Ejecutivo del Cannon Valley Elder Colle-gium. Disfruta con sus nietos y con la ebanistería, y le encantaviajar, leer y que le encarguen trabajos en la parte septentrional delestado de Wisconsin.

    Betty M. Thorne, autora, investigadora y profesora galardonada conpremios a la docencia, es profesora de Ciencias de la Decisión y Di-rectora de Estudios de Grado en la School of Business Administra-tion de Stetson University en DeLand (Florida). Galardonada con elMcEniry Award for Excellence in Teaching de la Stetson University,el máximo premio que se concede a un profesor de la Stetson Uni-versity, también ha recibido el Outstanding Teacher of the YearAward y el Professor of the Year Award de la School of BusinessAdministration en Stetson. Enseña asimismo en el programa de vera-no de Stetson University en Innsbruck (Austria); el College of Law

  • de Stetson University; el programa de MBA Ejecutivo de Stetson University, y el ExecutivePassport Program de Stetson University. En 2004 y 2005, fue nombrada mejor profesora delprograma JD/MBA del College of Law de Stetson. Se licenció en Geneva College e hizo elMáster y el Doctorado en la Universidad de Indiana. Es miembro del comité de planificación ySecretaria/Tesorera de las jornadas tituladas Making Statistics More Effective in Schools andBusiness, en las que se reúne anualmente con estadísticos para debatir sobre cuestiones de in-vestigación y enseñanza. También es miembro del Decision Sciences Institute, de la AmericanSociety for Quality y de la American Statistical Association. Participa en un estudio quinquenaltitulado North American Fareston versus Tamoxifen Adjuvant (NAFTA) Trial sobre el cáncerde mama (http://www.naftatrial.com).

    Ella y su marido, Jim, tienen cuatro hijos. Viajan mucho, asisten a clases de teología, parti-cipan en organizaciones internacionales dedicadas a ayudar a niños desfavorecidos y hacen tra-bajo apostólico en Rumanía.

    viii Contenido

  • CONTENIDO ABREVIADO

    Capítulo 1. ¿Por qué estudiar estadística? ................................................................ 1

    Capítulo 2. Descripción gráfica de los datos ........................................................... 9

    Capítulo 3. Descripción numérica de los datos ........................................................ 49

    Capítulo 4. Probabilidad ............................................................................................ 83

    Capítulo 5. Variables aleatorias discretas y distribuciones de probabilidad ........... 145

    Capítulo 6. Variables aleatorias continuas y distribuciones de probabilidad ......... 201

    Capítulo 7. Muestreo y distribuciones en el muestreo ............................................ 249

    Capítulo 8. Estimación: una población ..................................................................... 295

    Capítulo 9. Estimación: otros temas ......................................................................... 325

    Capítulo 10. Contraste de hipótesis ............................................................................ 353

    Capítulo 11. Contraste de hipótesis II ........................................................................ 393

    Capítulo 12. Regresión simple .................................................................................... 431

    Capítulo 13. Regresión múltiple ................................................................................. 487

    Capítulo 14. Otros temas del análisis de regresión .................................................... 575

    Capítulo 15. Estadística no paramétrica ..................................................................... 627

    Capítulo 16. Contrastes de la bondad del ajuste y tablas de contingencia ............... 655

    Capítulo 17. Análisis de la varianza ........................................................................... 681

    Capítulo 18. Introducción a la calidad ....................................................................... 729

    Capítulo 19. Análisis de series temporales y predicción ........................................... 763

    Capítulo 20. Otros temas relacionados con el muestreo ............................................ 811

    Capítulo 21. Teoría estadística de la decisión ............................................................ 855

  • a

  • CONTENIDO

    PRÓLOGO ....................................................................................................................................... xix

    CAPÍTULO 1. ¿Por qué estudiar estadística? ........................................................................ 11.1. La toma de decisiones en un entorno incierto ........................................ 21.2. El muestreo ............................................................................................... 31.3. Estadística descriptiva e inferencial ......................................................... 4

    Descripción de los datos .............................................................................. 5Realización de inferencias ............................................................................ 6

    CAPÍTULO 2. Descripción gráfica de los datos ..................................................................... 92.1. Clasificación de las variables ................................................................... 10

    Categóricas o numéricas ............................................................................... 10Niveles de medición .................................................................................... 10

    2.2. Gráficos para describir variables categóricas .......................................... 13Tablas ......................................................................................................... 13Gráficos de barras y gráficos de tarta ............................................................ 14Diagramas de Pareto .................................................................................... 16

    2.3. Gráficos para describir datos de series temporales ................................. 202.4. Gráficos para describir variables numéricas ........................................... 24

    Distribuciones de frecuencias ....................................................................... 24Histogramas y ojivas .................................................................................... 27Diagramas de tallo y hojas ........................................................................... 30

    2.5. Tablas y gráficos para describir relaciones entre variables .................... 32Diagramas de puntos dispersos ..................................................................... 33Tablas cruzadas ........................................................................................... 34

    2.6. Errores en la presentación de datos ......................................................... 39Histogramas engañosos ................................................................................ 40Gráficos de series temporales engañosos ....................................................... 42

    CAPÍTULO 3. Descripción numérica de los datos ................................................................. 493.1. Medidas de la tendencia central .............................................................. 50

    Media, mediana, moda ................................................................................. 50Forma de la distribución .............................................................................. 52

    3.2. Medidas de la variabilidad ....................................................................... 55Rango y rango intercuartílico ....................................................................... 55

  • Varianza y desviación típica ......................................................................... 57Teorema de Chebychev y regla empírica ...................................................... 59Coeficiente de variación ............................................................................... 61

    3.3. Media ponderada y medidas de datos agrupados .................................... 643.4. Medidas de las relaciones entre variables ............................................... 693.5. Obtención de relaciones lineales ............................................................. 75

    CAPÍTULO 4. Probabilidad ...................................................................................................... 834.1. Experimento aleatorio, resultados, sucesos ............................................. 844.2. La probabilidad y sus postulados ............................................................ 92

    Probabilidad clásica ..................................................................................... 92Frecuencia relativa ....................................................................................... 95Probabilidad subjetiva .................................................................................. 96

    4.3. Reglas de la probabilidad ......................................................................... 102Probabilidad condicionada ............................................................................ 104Independencia estadística ............................................................................. 108

    4.4. Probabilidades bivariantes ........................................................................ 116Ventaja (odds) ............................................................................................. 120Cociente de «sobreparticipación» .................................................................. 121

    4.5. El teorema de Bayes ................................................................................ 128

    CAPÍTULO 5. Variables aleatorias discretas y distribuciones de probabilidad ................ 1455.1. Variables aleatorias .................................................................................. 1465.2. Distribuciones de probabilidad de variables aleatorias discretas ........... 1485.3. Propiedades de las variables aleatorias discretas .................................... 151

    Valor esperado de una variable aleatoria discreta .......................................... 151Varianza de una variable aleatoria discreta .................................................... 153Media y varianza de funciones lineales de una variable aleatoria ................... 156

    5.4. Distribución binomial ............................................................................... 1615.5. Distribución hipergeométrica ................................................................... 1705.6. La distribución de Poisson ....................................................................... 173

    Aproximación de Poisson de la distribución binominal .................................. 176Comparación de la distribución de Poisson y la distribución binomial ............ 177

    5.7. Distribución conjunta de variables aleatorias discretas .......................... 179Aplicaciones informáticas ............................................................................. 183Covarianza .................................................................................................. 183Correlación .................................................................................................. 184Funciones lineales de variables aleatorias ...................................................... 186Análisis de carteras ...................................................................................... 189

    CAPÍTULO 6. Variables aleatorias continuas y distribuciones de probabilidad ............... 2016.1. Variables aleatorias continuas .................................................................. 202

    La distribución uniforme .............................................................................. 2056.2. Esperanzas de variables aleatorias continuas .......................................... 2086.3. La distribución normal ............................................................................. 211

    Gráficos de probabilidades normales ............................................................. 2206.4. La distribución normal como aproximación de la distribución

    binomial .................................................................................................... 225Variable aleatoria proporcional ..................................................................... 229

    xii Contenido

  • 6.5. La distribución exponencial ..................................................................... 2316.6. Distribución conjunta de variables aleatorias continuas ......................... 234

    Combinaciones lineales de variables aleatorias .............................................. 238

    CAPÍTULO 7. Muestreo y distribuciones en el muestreo ..................................................... 2497.1. Muestreo de una población ...................................................................... 2507.2. Distribuciones de las medias muestrales en el muestreo ........................ 254

    Teorema del límite central ........................................................................... 260Intervalos de aceptación ............................................................................... 265

    7.3. Distribuciones de proporciones muestrales en el muestreo .................... 2727.4. Distribuciones de las varianzas muestrales en el muestreo .................... 277

    CAPÍTULO 8. Estimación: una población .............................................................................. 2958.1. Propiedades de los estimadores puntuales ............................................... 296

    Estimador insesgado .................................................................................... 297Estimador consistente ................................................................................... 298Estimador eficiente ...................................................................................... 298

    8.2. Intervalos de confianza de la media: varianza poblacional conocida .... 302Intervalos basados en la distribución normal ................................................. 304Reducción del margen de error ..................................................................... 307

    8.3. Intervalos de confianza de la media: varianza poblacional desconocida .... 309Distribución t de Student .............................................................................. 310Intervalos basados en la distribución t de Student .......................................... 312

    8.4. Intervalos de confianza de proporciones de la población (grandesmuestras) ................................................................................................... 315

    CAPÍTULO 9. Estimación: otros temas ................................................................................... 3259.1. Intervalos de confianza de la diferencia entre las medias de dos

    poblaciones normales ............................................................................... 326Muestras dependientes ................................................................................. 326Muestras independientes, varianzas poblacionales conocidas .......................... 328

    9.2. Intervalos de confianza de la diferencia entre las medias de dospoblacionales normales cuando las varianzas poblacionales sonconocidas ................................................................................................... 331Muestras independientes, varianzas poblacionales que se supone que soniguales ........................................................................................................ 331Muestras independientes, varianzas poblacionales que no se supone que seaniguales ........................................................................................................ 334

    9.3. Intervalos de confianza de la diferencia entre dos proporcionespoblacionales (grandes muestras) ............................................................ 337

    9.4. Intervalos de confianza de la varianza de una distribución normal ....... 3409.5. Elección del tamaño de la muestra .......................................................... 344

    Media de una población que sigue una distribución normal, varianzapoblacional conocida .................................................................................... 344Proporción poblacional ................................................................................. 346

    CAPÍTULO 10. Contraste de hipótesis ...................................................................................... 35310.1. Conceptos del contraste de hipótesis ..................................................... 35410.2. Contrastes de la media de una distribución normal: varianza

    poblacional conocida .............................................................................. 360

    Contenido xiii

  • p-valor ...................................................................................................... 362Hipótesis alternativa bilateral ...................................................................... 369

    10.3. Contrastes de la media de una distribución normal: varianzapoblacional desconocida ......................................................................... 372

    10.4. Contrastes de la proporción poblacional (grandes muestras) ............... 37610.5. Valoración de la potencia de un contraste ............................................ 380

    Contrastes de la media de una distribución normal: variable poblacionalconocida .................................................................................................... 380Potencia de los contrastes de proporciones poblacionales (grandes muestras) ... 383

    CAPÍTULO 11. Contraste de hipótesis II .................................................................................. 39311.1. Contrastes de la diferencia entre dos medias poblacionales ................ 394

    Dos medias, datos pareados ........................................................................ 395Dos medias, muestras independientes, varianzas poblacionales conocidas ..... 398Dos medias, poblaciones independientes, varianzas desconocidas que sesupone que son iguales .............................................................................. 401Dos medias, muestras independientes, varianzas poblacionales desconocidasque se supone que no son iguales ............................................................... 404

    11.2. Contrastes de la diferencia entre dos proporciones poblacionales(grandes muestras) .................................................................................. 408

    11.3. Contrastes de la varianza de una distribución normal .......................... 41211.4. Contrastes de la igualdad de las varianzas entre dos poblaciones

    distribuidas normalmente ....................................................................... 41611.5. Algunas observaciones sobre el contraste de hipótesis ........................ 420

    CAPÍTULO 12. Regresión simple ............................................................................................... 43112.1. Análisis de correlación ........................................................................... 432

    Contraste de hipótesis de la correlación ...................................................... 43312.2. Modelo de regresión lineal .................................................................... 43712.3. Estimadores de coeficientes por el método de mínimos cuadrados ..... 442

    Cálculo por ordenador del coeficiente de regresión ...................................... 44512.4. El poder explicativo de una ecuación de regresión lineal .................... 448

    El coeficiente de determinación R2 ............................................................. 45012.5. Inferencia estadística: contrastes de hipótesis e intervalos de

    confianza ................................................................................................. 456Contraste de hipótesis del coeficiente de la pendiente poblacional utilizandola distribución F ........................................................................................ 463

    12.6. Predicción ............................................................................................... 46612.7. Análisis gráfico ....................................................................................... 472

    CAPÍTULO 13. Regresión múltiple ............................................................................................ 48713.1. El modelo de regresión múltiple ........................................................... 488

    Especificación del modelo .......................................................................... 488Desarrollo del modelo ................................................................................ 491Gráficos tridimensionales ........................................................................... 494

    13.2. Estimación de coeficientes ..................................................................... 496Método de mínimos cuadrados ................................................................... 497

    13.3. Poder explicativo de una ecuación de regresión múltiple .................... 504

    xiv Contenido

  • 13.4. Intervalos de confianza y contrastes de hipótesis de coeficientes deregresión individuales ............................................................................. 511Intervalos de confianza .............................................................................. 513Contrastes de hipótesis ............................................................................... 515

    13.5. Contrastes de los coeficientes de regresión ........................................... 525Contrastes de todos los coeficientes ............................................................ 525Contraste de un conjunto de coeficientes de regresión ................................. 528Comparación de los contrastes F y t ........................................................... 529

    13.6. Predicción ............................................................................................... 53313.7. Transformaciones de modelos de regresión no lineales ....................... 535

    Transformaciones de modelos cuadráticos ................................................... 536Transformaciones logarítmicas .................................................................... 539

    13.8. Utilización de variables ficticias en modelos de regresión .................. 545Diferencias entre las pendientes .................................................................. 548

    13.9. Método de aplicación del análisis de regresión múltiple ..................... 553Especificación del modelo .......................................................................... 553Regresión múltiple ..................................................................................... 555Efecto de la eliminación de una variable estadísticamente significativa ........ 558Análisis de los residuos .............................................................................. 559

    CAPÍTULO 14. Otros temas del análisis de regresión ............................................................ 57514.1. Metodología para la construcción de modelos ...................................... 576

    Especificación del modelo .......................................................................... 577Estimación de los coeficientes .................................................................... 577Verificación del modelo ............................................................................. 578Interpretación del modelo e inferencia ........................................................ 579

    14.2. Variables ficticias y diseño experimental .............................................. 579Modelos de diseño experimental ................................................................. 583

    14.3. Valores retardados de las variables dependientes como regresores ..... 59114.4. Sesgo de especificación .......................................................................... 59614.5. Multicolinealidad .................................................................................... 59914.6. Heterocedasticidad .................................................................................. 60214.7. Errores autocorrelacionados ................................................................... 608

    Estimación de las regresiones con errores autocorrelacionados ..................... 612Errores autocorrelacionados en los modelos con variables dependientesretardadas .................................................................................................. 616

    CAPÍTULO 15. Estadística no paramétrica .............................................................................. 62715.1. Contraste de signos e intervalo de confianza ........................................ 628

    Contraste de signos de muestras pareadas o enlazadas ................................. 628Aproximación normal ................................................................................ 631Contraste de signos de una mediana poblacional ......................................... 633Intervalo de confianza de la mediana .......................................................... 634

    15.2. Contraste de Wilcoxon basado en la ordenación de las diferencias .... 636Minitab (contraste de Wilcoxon) ................................................................. 637Aproximación normal ................................................................................ 638

    15.3. Contraste U de Mann-Whitney .............................................................. 64115.4. Contraste de la suma de puestos de Wilcoxon ..................................... 64515.5. Correlación de orden de Spearman ........................................................ 649

    Contenido xv

  • CAPÍTULO 16. Contrastes de la bondad del ajuste y tablas de contingencia ..................... 65516.1. Contrastes de la bondad del ajuste: probabilidades especificadas ....... 65616.2. Contrastes de la bondad del ajuste: parámetros poblacionales

    desconocidos ........................................................................................... 661Un contraste de normalidad ........................................................................ 663

    16.3. Tablas de contingencia ........................................................................... 666Aplicaciones informáticas ........................................................................... 669

    CAPÍTULO 17. Análisis de la varianza ..................................................................................... 68117.1. Comparación de las medias de varias poblaciones ............................... 68217.2. Análisis de la varianza de un factor ...................................................... 684

    Modelo poblacional en el caso del análisis de la varianza de un factor ......... 69117.3. El contraste de Kruskal-Wallis .............................................................. 69517.4. Análisis de la varianza bifactorial: una observación por celda, bloques

    aleatorizados ........................................................................................... 69817.5. Análisis de la varianza bifactorial: más de una observación por

    celda ........................................................................................................ 709

    CAPÍTULO 18. Introducción a la calidad ................................................................................. 72918.1. La importancia de la calidad ................................................................. 730

    Los líderes de la calidad ............................................................................ 730Variación .................................................................................................. 732

    18.2. Gráficos de control de medias y desviaciones típicas .......................... 735Una estimación de la desviación típica del proceso ..................................... 736Gráficos de control de medias .................................................................... 738Gráficos de control de desviaciones típicas ................................................. 740Interpretación de los gráficos de control ...................................................... 741

    18.3. Capacidad de un proceso ....................................................................... 74518.4. Gráfico de control de proporciones ....................................................... 74918.5. Gráficos de control del número de ocurrencias .................................... 754

    CAPÍTULO 19. Análisis de series temporales y predicción .................................................... 76319.1. Números índice ....................................................................................... 764

    Índice de precios de un único artículo ......................................................... 766Índice de precios agregado no ponderado .................................................... 767Índice de precios agregado ponderado ......................................................... 768Índice de cantidades agregado ponderado .................................................... 769Cambio del periodo base ............................................................................ 770

    19.2. Un contraste no paramétrico de aleatoriedad ........................................ 77319.3. Componentes de una serie temporal ...................................................... 77719.4. Medias móviles ....................................................................................... 780

    Extracción del componente estacional por medio de medias móviles ............ 78319.5. Suavización exponencial ........................................................................ 789

    Modelo de predicción por medio de la suavización exponencial con elmétodo Holt-Winters .................................................................................. 792Predicción de series temporales estacionales ............................................... 796

    19.6. Modelos autorregresivos ......................................................................... 80119.7. Modelos autorregresivos integrados de medias móviles ....................... 807

    xvi Contenido

  • CAPÍTULO 20. Otros temas relacionados con el muestreo .................................................... 81120.1. Pasos básicos de un estudio realizado por muestreo ............................ 81220.2. Errores de muestreo y errores ajenos al muestreo ................................ 81720.3. Muestreo aleatorio simple ...................................................................... 819

    Análisis de los resultados de un muestreo aleatorio simple .......................... 82020.4. Muestreo estratificado ............................................................................ 825

    Análisis de los resultados de un muestreo aleatorio estratificado .................. 827Afijación del esfuerzo muestral a los distintos estratos ................................ 833

    20.5. Elección del tamaño de la muestra ........................................................ 837Tamaño de la muestra para el muestreo aleatorio simple: estimación de lamedia o el total poblacional ....................................................................... 838Tamaño de la muestra para el muestreo aleatorio simple: estimación de laproporción poblacional ............................................................................... 839Tamaño de la muestra para un muestreo aleatorio estratificado con un gradode precisión especificado ............................................................................ 840

    20.6. Otros métodos de muestreo .................................................................... 843Muestreo por conglomerados ...................................................................... 843Muestreo bietápico ..................................................................................... 847Métodos de muestreo no probabilísticos ...................................................... 850

    CAPÍTULO 21. Teoría estadística de la decisión ..................................................................... 85521.1. La toma de decisiones en condiciones de incertidumbre ..................... 85621.2. Soluciones que no implican la especificación de probabilidades:

    criterio maximin, criterio de la pérdida de oportunidades minimax .... 859Criterio maximin ....................................................................................... 860Criterio de la pérdida de oportunidades minimax ......................................... 862

    21.3. Valor monetario esperado; TreePlan ..................................................... 864Árboles de decisión ................................................................................ 866La utilización de TreePlan para resolver un árbol de decisión ...................... 868Análisis de sensibilidad .............................................................................. 872

    21.4. Información muestral: análisis y valor bayesianos ............................... 876Utilización del teorema de Bayes ................................................................ 876El valor de la información muestral ............................................................ 881El valor de la información muestral visto por medio de árboles de decisión .... 884

    21.5. Introducción del riesgo: análisis de la utilidad ..................................... 890El concepto de utilidad .............................................................................. 891Criterio de la utilidad esperada para tomar decisiones .................................. 895

    TABLAS DEL APÉNDICE1. Función de distribución acumulada de la distribución normal estándar ... 8992. Función de probabilidad de la distribución binomial .............................. 9013. Probabilidades binomiales acumuladas .................................................... 9064. Valores de e.j ........................................................................................... 9105. Probabilidades de Poisson individuales .................................................... 9116. Probabilidades de Poisson acumuladas ..................................................... 9197. Puntos de corte de la función de distribución ji-cuadrado ...................... 9278. Puntos de corte de la distribución t de Student ....................................... 9289. Puntos de corte de la distribución F ......................................................... 929

    Contenido xvii

  • 10. Puntos de corte de la distribución del estadístico de contraste deWilcoxon .................................................................................................... 932

    11. Puntos de corte de la distribución del coeficiente de correlación deorden de Spearman .................................................................................... 933

    12. Puntos de corte de la distribución del estadístico de contraste deDurbin-Watson ........................................................................................... 934

    13. Constantes de los gráficos de control ....................................................... 93614. Función de distribución acumulada del estadístico del contraste de

    rachas ......................................................................................................... 937

    RESPUESTAS A ALGUNOS EJERCICIOS PARES .................................................................. 939

    ÍNDICE ANALÍTICO ....................................................................................................................... 1051

    xviii Contenido

  • PRÓLOGO

    AUDIENCIA A LA QUE VA DIRIGIDOEstadística para los negocios y la economía (6.a edición) se ha escrito para satisfacer lanecesidad de un libro de texto que ofrezca una buena introducción a la estadística para losnegocios que permita comprender los conceptos y haga hincapié en la resolución de pro-blemas poniendo ejemplos realistas del mundo de la empresa y de la economía.

    Programas de máster o de licenciatura que enseñen estadística para los negocios.Programas de doctorado y de licenciatura de economía.Programas de MBA ejecutivo.Cursos de doctorado de estadística empresarial.

    CONTENIDOHemos escrito este libro con el fin de ofrecer una buena introducción a los métodos esta-dísticos aplicados para que sus lectores puedan realizar un sólido análisis estadístico enmuchas situaciones empresariales y económicas. Hemos hecho hincapié en la comprensiónde los supuestos que son necesarios para realizar un análisis profesional. Con los ordenado-res modernos, es fácil calcular a partir de los datos las salidas necesarias para muchos mé-todos estadísticos. Es tentador, pues, aplicar meramente sencillas «reglas» utilizando estassalidas, enfoque que se adopta en numerosos libros de texto. El nuestro es combinar losconocimientos con muchos ejemplos y ejercicios y mostrar que la comprensión de los mé-todos y de sus supuestos es útil para entender los problemas empresariales y económicos.

    NUEVO EN ESTA EDICIÓNHemos actualizado y ampliado la sexta edición de este libro para satisfacer mejor las nece-sidades de los usuarios y ofrecer más flexibilidad. En esta edición, hemos introducido im-portantes cambios y novedades. Éstos son:

    Un nuevo diseño para la presentación de la estadística descriptiva.En cada apartado, hemos añadido ejercicios básicos antes de los ejercicios aplicados.Hemos introducido nuevos ejercicios aplicados que colocan a los estudiantes en si-tuaciones empresariales reales poniendo el énfasis en las aplicaciones informáticas.

  • Hemos dividido el análisis de los intervalos de confianza y del contraste de hipótesisen un capítulo dedicado a una población y otro dedicado a dos poblaciones en res-puesta a las sugerencias de los usuarios y de los revisores.Presentaciones revisadas y más claras de los métodos de regresión simple y múltiple.Presentamos el análisis de cartera utilizando valores correlacionados con un extensonúmero de ejercicios aplicados.Hemos adoptado nuevos enfoques para presentar los datos utilizando imágenes grá-ficas.

    A LOS ESTUDIANTESEl CD-ROM que acompaña a este libro contiene todos los ficheros de datos utilizados enel libro que son necesarios para hacer los problemas y los ejercicios, así como el programaTreePlan y su documentación. El PowerPoint y otros ficheros relevantes pueden encontrar-se en la página web del libro (www.prenhall.com/newbold).

    A LOS PROFESORESLos ficheros de las soluciones de los capítulos y las presentaciones en PowerPoint de estelibro se encuentran en formato digital descargable. Visite el Instructor Resource Center enel catálogo de Prentice Hall (www.prenhall.com). Para registrarse con el fin de utilizar losrecursos del Instructor Resource Center se necesita un código de acceso como educador dePearson.

    Cada vez mejor

    Una vez que se registre, no tendrá que rellenar más formularios o recordar múltiples nom-bres de usuario y contraseñas para acceder a nuevos títulos y/o ediciones. Como profesorregistrado, puede acceder directamente a los ficheros de recursos y recibir inmediatamenteel acceso y las instrucciones para instalar en el servidor de su universidad el contenido delgestor del curso.

    ¿Necesita ayuda?

    Contamos con un entregado equipo de apoyo técnico para ayudar a los profesores a re-solver cuestiones relacionadas con el material auxiliar que acompaña a este libro. Visitehttp://247.prenhall.com/ para las respuestas a las preguntas formuladas frecuentemente ylos números de teléfono gratuitos de ayuda.

    AGRADECIMIENTOSNos gustaría dar las gracias a las siguientes personas que han revisado el libro y han hechoperspicaces sugerencias para esta edición:

    Mr. C. Patrick Kohrman-Penn State University, Berks CampusJames Thorson-Southern Connecticut State UniversityMamnoon Jamil-Rutgers University, CamdenZhimin Huang-Adelphi University

    xx Prólogo

  • Renee Fontenot-University of Texas, Permian BasinAllen Lynch-Mercer UniversityBulent Uyar-University of Northern IowaDavid Hudgins-University of OklahomaAllan Lacayo-Diablo Valley CollegeJ. Morgan Jones-University of North CarolinaEugene Allevato-Woodbury UniversityPatricia Odell-Bryant UniversityJay DeVore-California Polytechnic State UniversityValerie Bencivenga-University of TexasMyles J. Callan-University of VirginiaAndrew Narwold-University of San DiegoAnthony Smith-Carnegie Mellon UniversityPeter Baxendale-University of Southern CaliforniaSteen Anderson-Aarhus School of Business, DenmarkEric Bentzen-Copenhagen Business School, DenmarkHans Geilnkirchen-Erasmus University, NetherlandsPeter Reiss-Stanford UniversityDavid Hudgins-University of OklahomaRobert Lemke-Lake Forest CollegeMichael Gordinier-Washington UniversityFred Wenstop-Norwegian School of ManagementSheri Aggarwal-University of VirginiaJorgen Lauridsen-University of Southern DenmarkRobert Gillette-University of KentuckyPeter Boatwright-Carnegie MellonMark Kamstra-Simon FraserAlbert Madansky-University of ChicagoJeff Russell-University of ChicagoNick Polsen-University of ChicagoAaron Smith-University of VirginiaYu-Chi Cheng-University of Notre DameProfessor Mohanty-California State, Los AngelesKen Alexander-University of Southern CaliforniaMendy Fygenson-University of Southern CaliforniaMatthew White-Stanford UniversityStefanos Zenios-Stanford UniversityLawrence Brown-Pennsylvania State UniversityAbba Krieger-Pennsylvania State UniversityHarvey Singer-George MasonWilliam Hausman-William and Mary University of IowaJim Swanson-Central Missouri UniversityC. Barry Pfitzner-Randolf-Macon College

    También estamos agradecidos a Annie Puciloski que ha revisado la precisión de estaedición y especialmente a Sandra Krausman, GGS Production Services, por su ayuda ypericia.

    Por lo que se refiere al St. Olaf College, debemos dar las gracias a Priscilla Hall, ayu-dante administrativo de St. Olaf, por la labor realizada en algunas partes del libro y su

    Prólogo xxi

  • dirección del trabajo de varios estudiantes que han colaborado en el libro, entre los quese encuentran Michael Loop, Holly Malcomson, Erin McMurtry, Nelly Schwinghammer,Catharina Zuber. Este libro no habría sido posible sin su colaboración.

    Por lo que se refiere a Stetson University, también damos las gracias a Jim Scheiner,Paul Dascher, Marie Gilotti, Sean A. Thomas, John Tichenor y Emma Astrom y especial-mente a Jennie Bishop (Computer Programmer Analyst II, State of Florida, Volusia Coun-ty Health Department).

    Agradecemos, además, especialmente a nuestras familias su apoyo durante las numero-sas horas dedicadas a este libro. Bill Carlson da las gracias especialmente a su mujer Char-lotte y a sus hijos adultos Andrea, Douglas y Larry. Betty Thorne da las gracias especial-mente a su marido Jim y a sus hijos adultos Jennie Bishop, Ann Thorne, Renee Payne yJon Thorne; así como a Marius, Mihaela, Cezara y Anda Sabou.

    Los autores agradecen las sólidas bases y tradición creadas por el autor original, PaulNewsbold. Paul comprendió la importancia del análisis estadístico riguroso y de sus funda-mentos. Se dio cuenta de que hay algunas complejas ideas que es necesario desarrollar y seesforzó en ofrecer explicaciones claras de difíciles ideas. Además, estas ideas sólo son úti-les cuando se utilizan para resolver problemas realistas. En ediciones anteriores, se in-cluyeron, pues, muchos ejemplos y muchos ejercicios aplicados. Nos hemos esforzado enmantener y ampliar esta tradición para hacer un libro que satisfaga las necesidades de losfuturos líderes empresariales en la era de la información.

    Si el lector tiene alguna sugerencia o corrección, puede ponerse en contacto con losautores a través del correo electrónico en [email protected]; [email protected].

    xxii Prólogo

  • Esquema del capítulo

    1.1. La toma de decisiones en un entorno incierto1.2. El muestreo1.3. Estadı́stica descriptiva e inferencial

    Descripción de los datosRealización de inferencias

    IntroducciónEn nuestra era de la información, el mundo abunda en datos. En los artículos de losperiódicos y en los reportajes de la televisión, se hacen afirmaciones como «El Dow Jo-nes ha caído 6 puntos hoy» o «El índice de precios de consumo subió un 0,8 por cientoel mes pasado» o «la última encuesta indica que la tasa de aprobación del presidente eshoy de un 63 por ciento» o «El 98 por ciento de los pacientes de un estudio clínico noexperimentó ningún efecto secundario significativo con un nuevo medicamento contra elcáncer de mama». Cada vez es más frecuente que para hacer una valoración inteligentede los acontecimientos actuales, necesitemos asimilar e interpretar una cantidad consi-derable de datos. La Administración, las empresas y los investigadores científicos gas-tan miles de millones de dólares en la recogida de datos. La Administración ha contribui-do a ello, tanto recogiendo datos ella misma como obligando a las empresas a darinformación. El sector privado también ha tenido que ver en ello. Las aireadas encuestasGallup de las actitudes de los votantes y los índices de audiencia de Nielsen de los pro-gramas de televisión de la semana no son más que la punta de un enorme iceberg deestudios de mercado. La cantidad de datos recogidos ha aumentado a un ritmo extraor-dinario en los últimos años.

    Debemos explicar todos los datos. La era de la informática nos ha permitido tantoprocesar, resumir y analizar rápidamente los datos como producir y almacenar más da-tos. Los computadores ponen al alcance de la mano muchos datos, como las cotizacio-nes bursátiles. Debemos analizarlos e interpretarlos correctamente.

  • 1.1. La toma de decisiones en un entorno incierto

    Las decisiones a menudo se basan en información incompleta. Por ejemplo, se supone quelos estudiantes universitarios de primer año, cuando son admitidos en la universidad, selec-cionan una carrera. Sin embargo, muchos de estos estudiantes pueden no tener una metaprofesional clara. Por poner otro ejemplo, los enfermos de cáncer pueden ser invitados aparticipar en un estudio clínico para probar un nuevo medicamento experimental (véase re-ferencia bibliográfica 1) cuando aún no se dispone de información sobre los efectos secun-darios, las tasas de supervivencia y las tasas de recurrencia de esta nueva medicación. Asi-mismo, las decisiones empresariales normalmente se toman en un entorno en el que losresponsables de tomarlas no pueden estar seguros de la futura conducta de los factores queacabarán afectando al resultado de las distintas opciones consideradas.

    Cuando un fabricante presenta una oferta para hacerse con un contrato, no está total-mente seguro de cuáles serán los costes totales ni de qué ofertas presentarán los competi-dores. A pesar de esta incertidumbre, debe hacer una oferta. Un inversor no sabe con segu-ridad si los mercados financieros estarán boyantes, estables o deprimidos. No obstante,debe elegir las acciones, los bonos y los instrumentos del mercado de dinero de maneraque su cartera esté equilibrada sin saber cómo evolucionará el mercado en el futuro.

    Consideremos las siguientes afirmaciones:

    «El precio de las acciones de IBM será más alto dentro de seis meses que ahora».«Si el déficit presupuestario público es tan elevado como se prevé, los tipos deinterés se mantendrán altos el resto del año».«La renta anual de un titulado universitario será mayor que la renta anual de una per-sona que no tenga estudios universitarios».

    Cada una de estas afirmaciones contiene un lenguaje que sugiere la existencia de unacantidad espuria de certeza. En el momento en el que se hicieron las afirmaciones, era im-posible estar seguro de que eran ciertas. Aunque un analista crea que lo que ocurrirá en lospróximos meses será tal que se prevé que el precio de las acciones de IBM subirá duranteese periodo, no estará seguro de eso. Por lo tanto, las afirmaciones deben modificarse co-mo indican los siguientes ejemplos:

    «El precio de las acciones de IBM probablemente será más alto dentro de seis mesesque ahora».«Si el déficit presupuestario público es tan elevado como se prevé, es probable quelos tipos de interés se mantengan altos durante el resto del año».«La renta anual de un titulado universitario probablemente será mayor que la rentaanual de una persona sin estudios universitarios».

    Es muy importante pensar bien cómo se dicen las cosas. No es correcto sustituir lasafirmaciones injustificadamente precisas por afirmaciones innecesariamente vagas. Al fin yal cabo, ¿qué significa «probablemente» o «es probable que»? Debe ponerse especial cui-dado en expresar las ideas que se pretende expresar, sobre todo cuando se trata de probabi-lidades o cuando hay incertidumbre.

    EJERCICIOS

    Ejercicios básicos1.1. Modifique las afirmaciones siguientes para que re-

    flejen una posible incertidumbre:

    a) El mejor instrumento para mejorar la cuota demercado de este producto es una campaña pu-blicitaria destinada al grupo de edad 18-24 años.

    2 Estadística para administración y economía

  • b) Si se presenta una oferta de esta cuantía, serámás baja que las del competidor y el contratoestará asegurado.

    c) El coste de la gasolina será más alto en Esta-dos Unidos dentro de 2 meses.

    1.2. Ponga un ejemplo de una decisión de comerciali-zación que debe tomarse en condiciones de incer-tidumbre.

    1.3. Ponga un ejemplo de una decisión financiera quedebe tomarse en condiciones de incertidumbre.

    1.2. El muestreo

    Antes de introducir un nuevo producto en el mercado, su fabricante quiere saber cuál seráel nivel probable de demanda y es posible que realice una encuesta de mercado. Lo que leinteresa, en realidad, son todos los compradores potenciales (la población). Sin embargo,las poblaciones a menudo son tan grandes que es difícil analizarlas; sería imposible oprohibitivo recoger toda la información de una población. Incluso en las circunstancias enlas que parece que se dispone de suficientes recursos, las limitaciones de tiempo obligan aexaminar un subconjunto (muestra).

    Población y muestraUna población es el conjunto completo de todos los objetos que interesan a un investigador. Eltamaño de la población, N, puede ser muy grande o incluso infinito. Una muestra es unsubconjunto observado de valores poblacionales que tiene un tamaño muestral que viene dadopor n.

    Ejemplos de poblaciones son:

    Todos los votantes inscritos en un país.Todos los estudiantes de una universidad.Todas las familias que viven en una ciudad.Todas las acciones que cotizan en una bolsa de valores.Todas las reclamaciones que recibe en un año dado una compañía de seguros médicos.Todas las cuentas pendientes de cobro de una empresa.

    Nuestro objetivo final es hacer afirmaciones basadas en datos muestrales que tengan al-guna validez sobre la población en general. Necesitamos, pues, una muestra que sea repre-sentativa de la población. ¿Cómo podemos lograrlo? Uno de los principios importantes quedebemos seguir en el proceso de selección de la muestra es la aleatoriedad.

    Muestreo aleatorioEl muestro aleatorio simple es un método que se emplea para seleccionar una muestra de nobjetos de una población en el que cada miembro de la población se elige estrictamente alazar, cada miembro de la población se elige con la misma probabilidad y todas las muestrasposibles de un tamaño dado, n, tienen la misma probabilidad de ser seleccionadas. Este méto-do es tan frecuente que generalmente se suprime el adjetivo simple y la muestra resultante sedenomina muestra aleatoria.

    El muestreo se utiliza mucho en todas las áreas de los negocios, así como en otras dis-ciplinas. Para averiguar si un proceso de producción está funcionando correctamente, se se-lecciona una muestra de bienes producidos. Las auditorías de las cuentas pendientes de co-bro generalmente se basan en una muestra. Durante los años de elecciones presidenciales,se hacen estimaciones de las preferencias de los votantes a partir de muestras de votantes;

    Capítulo 1. ¿Por qué estudiar estadística? 3

  • también puede hacerse una encuesta a la salida de los colegios electorales para predecirqué candidato obtendrá más votos. Sin embargo, tomar una muestra es meramente un me-dio para llegar a un fin. Necesitamos estudiar estadística, no para hacer afirmaciones so-bre la muestra sino, más bien, para extraer conclusiones sobre la población en general. Laestadística es el estudio de cómo se toman decisiones sobre una población cuando la infor-mación procede de una muestra. Siempre quedará alguna incertidumbre.

    Supongamos que queremos saber cuál es la edad media de los votantes de un país. Esevidente que el tamaño de la población es tan grande que sólo podríamos tomar una mues-tra aleatoria, por ejemplo, 500 votantes, y calcular su edad media. Como esta media se ba-sa en datos muestrales, se llama estadístico. Si pudiéramos calcular la edad media de todala población, la media resultante se llamaría parámetro. En este libro veremos cómo se to-man decisiones sobre un parámetro, basándose en un estadístico. Debemos darnos cuentade que siempre habrá una cierta incertidumbre, ya que no se conoce el valor exacto delparámetro.

    Parámetro y estadísticoUn parámetro es una característica específica de una población. Un estadístico es una carac-terística específica de una muestra.

    EJERCICIOS

    Ejercicios básicos1.4. Ponga un ejemplo de un parámetro en cada una de

    las siguientes poblaciones:

    a) Las rentas de todas las familias que viven enuna ciudad.

    b) Los rendimientos anuales de todas las accionesque cotizan en una bolsa de valores.

    c) Los costes de todas las reclamaciones que reci-be en un año dado una compañía de segurosmédicos.

    d) Los valores de todas las cuentas pendientes decobro de una empresa.

    1.5. Su universidad ha encuestado a sus estudiantes pa-ra averiguar el tiempo semanal medio que dedicana navegar por Internet.

    a) ¿Cuál es la población?b) ¿Cuál es la muestra?c) ¿Cuál es el estadístico?d) ¿Es el valor de 6,1 horas un parámetro o un es-

    tadístico?

    1.6. Una compañía aérea sostiene que menos de un 1por ciento de los vuelos programados que despe-gan del aeropuerto de Nueva York sale tarde. Seha observado que el 1,5 por ciento de una muestraaleatoria de 200 vuelos salió más tarde de la horaprevista.

    a) ¿Cuál es la población?b) ¿Cuál es la muestra?c) ¿Cuál es el estadístico?d) ¿Es 1,5 por ciento un parámetro o un estadís-

    tico?

    1.3. Estadı́stica descriptiva e inferencial

    Para pensar en términos estadísticos hay que seguir una serie de pasos que van desde ladefinición del problema hasta la toma de decisiones. Una vez identificado y definido elproblema, se recogen datos producidos mediante diversos procesos de acuerdo con un dise-ño y se analizan utilizando uno o más métodos estadísticos. De este análisis se obtiene in-formación. La información se convierte, a su vez, en conocimiento, utilizando los resulta-dos de las experiencias específicas, la teoría y la literatura y aplicando métodos estadísticosadicionales. Para convertir los datos en un conocimiento que lleva a tomar mejores decisio-nes se utiliza tanto la estadística descriptiva como la inferencial.

    4 Estadística para administración y economía

  • Estadística descriptiva e inferencialLa estadística descriptiva está formada por los métodos gráficos y numéricos que se utilizanpara resumir y procesar los datos y transformarlos en información. La estadística inferencialconstituye la base para hacer predicciones, previsiones y estimaciones que se utilizan paratransformar la información en conocimiento.

    Descripción de los datosEn el ejemplo 1.1 vemos una tabla de la producción diaria de una fábrica de cereales.

    EJEMPLO 1.1. Producción de cereales (estadística descriptiva)Un jefe de producción de Cereales de Trigo formó un equipo de empleados para estu-diar el proceso de producción de cereales. Durante la primera fase del estudio, se pesóuna selección aleatoria de cajas y se midió la densidad del producto. A continuación, eljefe quería estudiar datos relacionados con las pautas de producción diaria. Se hallaronlos niveles de producción (en miles) de un periodo de 10 días. Represente estos resulta-dos gráficamente y comente sus observaciones:

    Día 1 2 3 4 5 6 7 8 9 10Cajas (miles) 84 81 85 82 85 84 109 110 60 63

    Solución

    En la Figura 1.1, el jefe de producción puede identificar los días de baja producción, asícomo los días de mayor producción.

    Producción diaria de cereales

    0

    20

    40

    60

    80

    100

    120

    0 2 4 6 8 10 12

    Día

    Caj

    as (

    mile

    s)

    Figura 1.1. Producción diaria de cereales de trigo.

    No parecía que hubiera mucha diferencia en el número de cajas producidas en losseis primeros días. Había variaciones de un día a otro, pero los seis puntos tenían valo-res numéricos muy parecidos. Sin embargo, en los días 7 y 8 el nivel de producción pa-recía que era más alto. En cambio, en los días 9 y 10 parecía que era más bajo. Basán-dose en estas observaciones, el equipo intentó identificar las causas por las que laproductividad era más alta y más baja. Por ejemplo, tal vez en los días 9 y 10 estuvieranausentes trabajadores clave o hubiera cambiado el método de producción o hubierancambiado las materias primas. También se podrían identificar las causas por las queaumentó la productividad en los días 7 y 8.

    Capítulo 1. ¿Por qué estudiar estadística? 5

  • Realización de inferenciasLa estadística inferencial es un proceso, no un mero resultado numérico. Este proceso pue-de consistir en una estimación, un contraste de hipótesis, un análisis de relaciones o unapredicción. En primer lugar, podemos querer estimar un parámetro. Supongamos que Flo-rin’s Flower Mart quiere desarrollar una nueva estrategia de comercialización. Podría serútil la información sobre los hábitos de gasto de los clientes de la floristería. Florin puedequerer:

    Estimar la edad media de los clientes de la tienda.Estimar la diferencia entre la cantidad media que los clientes cargan a una Visa y lacantidad media que cargan a American Express.Estimar la proporción de clientes que están insatisfechos con el sistema de reparto dela tienda.

    En segundo lugar, podemos querer contrastar una hipótesis sobre un parámetro. Porejemplo, Florin puede querer:

    Contrastar si los clientes tienen este año una preferencia por el color de las rosas dis-tinta a la del año pasado.Contrastar si menos del 25 por ciento de los clientes de la tienda son turistas.Contrastar si las ventas son mayores los fines de semana que el resto de los días dela semana.Contrastar si la cantidad media que gastaron los clientes en su última compra superólos 40 $.

    Las respuestas a estos tipos de preguntas pueden ayudar a Florin a lanzar una campañapublicitaria que le permita reducir los costes, incrementar los beneficios y aumentar la sa-tisfacción de los clientes.

    En tercer lugar, podemos querer analizar las relaciones entre dos o más variables. Eldirector financiero de General Motors quiere tomar decisiones estratégicas que afectan atoda la compañía. En esos casos, puede utilizar series de datos macroeconómicos de losque puede disponerse en fuentes como el Bureau of Economic Analysis del Departamentode Comercio de Estados Unidos para analizar las relaciones entre variables como el pro-ducto interior bruto, el tipo de interés, la renta per cápita, la inversión total y la oferta mo-netaria, que indican la situación general de la economía nacional. El director financieropuede hacerse las siguientes preguntas:

    ¿Influye la tasa de crecimiento de la oferta monetaria en la tasa de inflación?Si General Motors sube un 5 por ciento el precio de los automóviles de tamaño inter-medio, ¿cómo afectará la subida a las ventas de estos automóviles?¿Afecta la legislación sobre el salario mínimo al nivel de desempleo?

    ¿Cómo se comienza a responder a la pregunta sobre el efecto que puede producir unasubida de los precios en la demanda de automóviles? La teoría económica básica nos diceque, manteniéndose todo lo demás constante, una subida del precio va acompañada de unareducción de la cantidad demandada. Sin embargo, esa teoría es puramente cualitativa. Nonos dice cuánto disminuye la cantidad demandada. Para avanzar más, hay que recoger in-formación sobre cómo ha respondido la demanda a las variaciones del precio en el pasadoy evaluarla. Estudiando estadística inferencial, aprenderemos a recoger información y aanalizar relaciones.

    En cuarto lugar, podemos necesitar predecir, es decir, hacer predicciones fiables.Las decisiones de inversión deben hacerse mucho antes de que pueda llevarse un nuevo

    6 Estadística para administración y economía

  • producto al mercado y, evidentemente, es deseable tener predicciones de la situación en laque se encontrará probablemente el mercado dentro de unos años. Cuando los productosestán consolidados, las predicciones sobre las ventas a corto plazo son importantes paradecidir los niveles de existencias y los programas de producción. Las predicciones de losfuturos tipos de interés son importantes para una empresa que tiene que decidir si emite ono nueva deuda. Para formular una política económica coherente, el gobierno necesita pre-dicciones de los resultados probables de variables como el producto interior bruto. Las pre-dicciones de los futuros valores dependen de las regularidades descubiertas en la conductaanterior de estas variables. Por lo tanto, se recogen datos sobre la conducta anterior de lavariable que va a predecirse y sobre la conducta de otras variables relacionadas con ella.Utilizaremos la estadística inferencial para analizar esta información y sugerir entonces lastendencias futuras probables.

    EJERCICIOS

    Ejercicios básicos1.7. Suponga que es dueño de una tienda de alimenta-

    ción.a) Ponga un ejemplo de una pregunta que podría

    responderse utilizando la estadística descriptiva.b) Ponga un ejemplo de una pregunta en la que

    sería útil estimar un parámetro.c) Ponga un ejemplo de una pregunta sobre una

    posible relación entre dos variables que tieneninterés para su tienda de alimentación.

    d) Ponga un ejemplo de una cuestión en la quehay que hacer una predicción.

    1.8. Averigüe si debe utilizarse la estadística descripti-va o la inferencial para obtener la siguiente infor-mación:a) Un gráfico que muestra el número de botellas

    defectuosas producidas durante el turno de díaa lo largo de una semana.

    b) Una estimación del porcentaje de empleadosque llegan tarde a trabajar.

    c) Una indicación de la relación entre los añosde experiencia de los empleados y la escala sa-larial.

    RESUMEN

    Las decisiones deben tomarse en condiciones de incer-tidumbre. Todas las áreas de negocios, así como otrasdisciplinas, utilizan la estadística para tomar esas deci-siones. Los contables pueden necesitar seleccionarmuestras para realizar auditorías. Los inversores finan-cieros utilizan la estadística para comprender las fluc-tuaciones del mercado y elegir entre varias inversionesde cartera. Los directivos que quieren saber si los clien-tes están satisfechos con los productos o los serviciosde su compañía pueden utilizar encuestas para averi-guarlo. Los ejecutivos de marketing pueden querer in-

    formación sobre las preferencias de los clientes, sus há-bitos de compra o las características demográficas delos compradores por Internet. En cada una de estas si-tuaciones, debemos definir meticulosamente el proble-ma, averiguar qué datos se necesitan, recogerlos, resu-mirlos y hacer inferencias y tomar decisiones basadasen los datos obtenidos. La teoría estadística es esencialdesde la definición inicial del problema hasta la deci-sión final y puede llevar a reducir los costes, a obtenermás beneficios, a mejorar los procesos y a aumentar lasatisfacción de los clientes.

    TÉRMINOS CLAVE

    estadística descriptiva, 5estadística inferencial, 5estadístico, 4

    muestra, 3muestra aleatoria, 3muestreo aleatorio simple, 3

    parámetro, 4población, 3

    Capítulo 1. ¿Por qué estudiar estadística? 7

  • EJERCICIO Y APLICACIÓN DEL CAPÍTULO

    1.9. Se hizo a una muestra aleatoria de 100 estu-diantes universitarios una serie de preguntas paraobtener datos demográficos sobre su nacionalidad,la especialización cursada, el sexo, la edad, el cur-so en el que están y su nota media hasta ese mo-mento. También se les hizo otras preguntas sobresu grado de satisfacción con el aparcamiento delcampus universitario, las residencias del campus ylos comedores del campus. Las respuestas a estaspreguntas sobre su satisfacción se midieron en unaescala de 1 a 5, donde 5 era el nivel de satisfac-ción más alto. Por último, se les preguntó si, cuan-

    do se graduaran, tenían intención de seguir estu-dios de postgrado en un plazo de 5 años (0: no; 1:sí). Estos datos se encuentran en el fichero de da-tos Findstad and Lie Study.a) Ponga un ejemplo de cómo se aplica la estadís-

    tica descriptiva a estos datos.b) Ponga un ejemplo de una pregunta que conlle-

    ve una estimación a la que podría respondersepor medio de la estadística inferencial.

    c) Ponga un ejemplo de una relación posible entredos variables.

    Bibliografı́a1. The North American Fareston versus Tamoxifen Adjuvant Trial for Breast Cancer.

    www.naftatrial.com.

    8 Estadística para administración y economía

  • Esquema del capítulo2.1. Clasificación de las variables

    Categóricas o numéricasNiveles de medición

    2.2. Gráficos para describir variables categóricasTablasGráficos de barras y gráficos de tartaDiagramas de Pareto

    2.3. Gráficos para describir datos de series temporales2.4. Gráficos para describir variables numéricas

    Distribuciones de frecuenciasHistogramas y ojivasDiagramas de tallo y hojas

    2.5. Tablas y gráficos para describir relaciones entre variablesDiagramas de puntos dispersosTablas cruzadas

    2.6. Errores en la presentación de datosHistogramas engañososGráficos de series temporales engañosos

    IntroducciónUna vez que definimos con cuidado un problema, necesitamos recoger datos. A menudoel número de observaciones recogidas es tan grande que los resultados efectivos delestudio no están claros. Nuestro objetivo en este capítulo es resumir los datos de mane-ra que tengamos una imagen clara y precisa. Queremos reducir lo más posible una ma-sa de datos, evitando al mismo tiempo la posibilidad de ocultar características importan-tes por reducirlos excesivamente. Por desgracia, no existe una única «manera correcta»de describir los datos. La línea de ataque adecuada normalmente es específica de cadaproblema y depende de dos factores: el tipo de datos y el fin del estudio.

    Se ha dicho que una imagen vale más que mil palabras. Asimismo, un gráfico valemás que mil cifras. En este capítulo, introducimos tablas y gráficos que nos ayudan acomprender mejor los datos y que constituyen una ayuda visual para tomar mejoresdecisiones. Los informes mejoran con la inclusión de tablas y gráficos adecuados, comodistribuciones de frecuencia, gráficos de barras, gráficos de tarta, diagramas de Pareto,gráficos de series temporales, histogramas, diagramas de tallo y hojas u ojivas. La vi-sualización de los datos es importante. Siempre debemos preguntarnos qué sugiere elgráfico sobre los datos, qué es lo que vemos.

    La comunicación a menudo es la clave del éxito y la comunicación de datos no esuna excepción. El análisis y la interpretación correctos de los datos son esenciales paracomunicar los resultados de una manera que tenga sentido. Los gráficos y los diagra-mas pueden mejorar nuestra comunicación de los datos a los clientes, los proveedores,los consejos de administración u otros grupos. En capítulos posteriores presentaremosmétodos numéricos para describir los datos.

  • 2.1. Clasificación de las variables

    Las variables pueden clasificarse de varias formas. Uno de los métodos de clasificación serefiere al tipo y la cantidad de información que contienen los datos. Los datos son categóri-cos o numéricos. Otro método consiste en clasificar los datos por niveles de medición, dan-do variables cualitativas o cuantitativas.

    Categóricas o numéricas

    Las variables categóricas producen respuestas que pertenecen a grupos o categorías. Porejemplo, las respuestas a preguntas sí/no son categóricas. Las respuestas a «¿Tiene ustedteléfono móvil?» y «¿Ha estado alguna vez en Oslo?» se limitan a un sí o un no. Una com-pañía de seguros médicos puede clasificar las reclamaciones incorrectas según el tipo deerrores, como los errores de procedimiento y diagnóstico, los errores de información al pa-ciente y los errores contractuales. Otros ejemplos de variables categóricas son las preguntassobre el sexo, el estado civil y la carrera universitaria. A veces, las variables categóricaspermiten elegir entre varias opciones, que pueden ir desde «totalmente en desacuerdo» has-ta «totalmente de acuerdo». Consideremos, por ejemplo, una evaluación del profesorado enla que los estudiantes tienen que responder a afirmaciones como «El profesor de este cursoes un buen profesor» (1: totalmente en desacuerdo; 2: un poco en desacuerdo; 3: ni deacuerdo ni en desacuerdo; 4: un poco de acuerdo; 5: totalmente de acuerdo).

    Las variables numéricas pueden ser variables discretas o variables continuas. Una va-riable numérica discreta puede tener (pero no necesariamente) un número finito de valo-res. Sin embargo, el tipo más frecuente de variable numérica discreta con el que nos en-contraremos produce una respuesta que proviene de un proceso de recuento. Ejemplos devariables numéricas discretas son el número de estudiantes matriculados en una clase, elnúmero de créditos universitarios obtenidos por un estudiante al final de un cuatrimestre,el número de acciones de Microsoft que contiene la cartera de un inversor y el númerode reclamaciones de indemnizaciones presentado tras un huracán.

    Una variable numérica continua puede tomar cualquier valor de un intervalo dado denúmeros reales y normalmente proviene de un proceso de medición (no de recuento).Ejemplos de variables numéricas continuas son la altura, el peso, el tiempo, la distancia yla temperatura. Una persona puede decir que mide 1,89 metros, pero en realidad puede te-ner una estatura de 1,81, 1,79 o algún otro número similar, dependiendo de la precisión delinstrumento utilizado para medir la estatura. Otros ejemplos de variables numéricas conti-nuas son el peso de las cajas de cereales, el tiempo que se hace una persona en una carreray la distancia entre dos ciudades. En todos los casos, el valor podría desviarse dentro de uncierto margen, dependiendo de la precisión del instrumento de medición utilizado. En lasconversaciones diarias tendemos a truncar las variables y a tratarlas como si fueran varia-bles discretas sin pensarlo ni siquiera dos veces. Sin embargo, la diferencia es muy impor-tante en estadística, ya que es uno de los factores de los que depende que un método esta-dístico sea mejor que otro en un determinado caso.

    Niveles de medición

    También podemos dividir los datos en cualitativos y cuantitativos. Con datos cualitativos,la «diferencia» entre los números no tiene ningún significado mensurable. Por ejemplo, si aun jugador de baloncesto se le asigna el número «20» y a otro el número «10», no pode-

    10 Estadística para administración y economía

  • mos extraer la conclusión de que el primero es el doble de bueno que el segundo. Sin em-bargo, con datos cuantitativos la diferencia entre los números tiene un significado mensura-ble. Cuando un estudiante obtiene una puntuación de 90 en un examen y otro obtiene unapuntuación de 45, la diferencia es mensurable y tiene un significado.

    Veremos que los datos cualitativos pueden ser niveles de medición nominales y ordina-les. Los datos cuantitativos pueden ser niveles de medición basados en intervalos y en ra-zones.

    Los niveles de medición nominales y ordinales se refieren a los datos que se obtienencon preguntas categóricas. Las respuestas a preguntas sobre el sexo, el país de origen, laafiliación política y la propiedad de un teléfono móvil son nominales. Se considera que losdatos nominales son el tipo de datos más bajo o más débil, ya que la identificación numéri-ca se elige estrictamente por comodidad.

    Los valores de las variables nominales son palabras que describen las categorías o cla-ses de respuestas. Los valores de la variable sexo son hombre y mujer; los valores de «¿Haestado alguna vez en Oslo?» son «sí» y «no». Asignamos arbitrariamente un código o unnúmero a cada respuesta. Sin embargo, este número no se emplea más que para clasificar.Por ejemplo, podríamos codificar las respuestas sobre el sexo o las respuestas sí/no de laforma siguiente:

    1 % Hombres 1 % Sí2 % Mujeres 2 % No

    Los datos ordinales indican el orden que ocupan los objetos y, al igual que en el casode los datos nominales, los valores son palabras que describen las respuestas. He aquí algu-nos ejemplos de datos ordinales y de códigos posibles:

    1. Valoración de la calidad del producto (1: malo; 2: medio; 3: bueno).2. Valoración de la satisfacción con el servicio de comedor de la universidad (1: muy

    insatisfecho; 2: moderadamente insatisfecho; 3: ninguna opinión; 4: moderada-mente satisfecho; 5: muy satisfecho).

    3. Preferencia de los consumidores entre tres tipos de bebidas refrescantes (1: el quemás se prefiere; 2: segunda opción; 3: tercera opción).

    En estos ejemplos, las respuestas son ordinales, es decir, siguen un orden, pero la «diferen-cia» entre ellas no tiene ningún significado mensurable. Es decir, la diferencia entre la pri-mera opción y la segunda puede no ser igual que la diferencia entre la segunda y la tercera.

    Los niveles de medición basados en intervalos y en razones se refieren a los datos enuna escala ordenada, en la que la diferencia entre las mediciones tiene un significado. Unaescala de intervalos indica el orden y la distancia con respecto a un cero arbitrario medidosen intervalos unitarios. Es decir, se ofrecen datos en relación con un nivel de referenciadeterminado arbitrariamente. La temperatura es un ejemplo clásico de este nivel de medi-ción; los niveles de referencia determinados arbitrariamente se basan, en general, en losgrados Fahrenheit o Celsius. Supongamos que hace 80 grados Fahrenheit en Orlando (Flo-rida) y sólo 20 en St. Paul (Minnesota). Podemos extraer la conclusión de que la diferenciade temperatura es de 60 grados, pero no podemos saber si hace el cuádruple de calor enOrlando que en St. Paul. Supongamos que cuando se estableció la temperatura Fahrenheit,el punto de congelación se fijó en 500 grados. En ese caso, en nuestro ejemplo de la tem-peratura de Orlando y St. Paul, ésta habría sido de 548 grados en Orlando y de 488 en St.Paul (la diferencia sigue siendo de 60 grados). El año es otro ejemplo de un nivel de medi-ción basado en intervalos; en este caso los niveles de referencia se basan en el calendariogregoriano o en el islámico.

    Capítulo 2. Descripción gráfica de los datos 11

  • Los datos basados en una escala de razones sí indican tanto el orden como la distanciacon respecto a un cero natural y los cocientes entre dos medidas tienen un significado. Unapersona que pesa 80 kilos pesa el doble que una que pesa 40; una persona que tiene 40años es el doble de vieja que una que tiene 20.

    Después de recoger datos, primero tenemos que clasificar las respuestas en categóricaso numéricas o según la escala de medición. A continuación, asignamos un número arbitra-rio a cada respuesta. Algunos gráficos se utilizan generalmente para las variables categóri-cas y otros son adecuados para las variables numéricas.

    Obsérvese que los ficheros de datos normalmente contienen «valores perdidos». Porejemplo, los encuestados pueden decidir no responder en un cuestionario a ciertas pregun-tas sobre el sexo, la edad, la renta o algún otro tema delicado. Los valores perdidos requie-ren un código especial en la fase de introducción de los datos. Si no se resuelve correcta-mente la cuestión de los valores perdidos, es posible que el resultado sea erróneo. Lospaquetes estadísticos resuelven la cuestión de los valores perdidos de diferentes formas.

    EJERCICIOS

    Ejercicios básicos2.1. Indique si cada una de las siguientes variables es

    categórica o numérica. Si es categórica, indique elnivel de medición. Si es numérica, ¿es discreta ocontinua?a. Número de mensajes de correo electrónico en-

    viados diariamente por un planificador finan-ciero.

    b) Coste efectivo de los libros de texto de un es-tudiante para un cuatrimestre.

    c) Su factura mensual de electricidad.d) Las categorías de profesores universitarios (pro-

    fesor, profesor asociado, profesor ayudante,profesor colaborador).

    2.2. La oficina de relaciones públicas de un equipo debaloncesto profesional quiere información sobrelos aficionados que acuden a los partidos despuésde la temporada. En los partidos que se celebrandespués de la temporada, se entrega a la entradaun cuestionario a cada aficionado. ¿Es la respuestaa cada una de las siguientes preguntas categórica onumérica? Si es categórica, indique el nivel demedición. Si es numérica, ¿es discreta o continua?a) ¿Tiene usted una entrada de temporada?b) ¿Vive en el condado de Orange?c) ¿Cuánto le costó realmente la entrada para este

    partido de después de temporada?

    2.3. En una facultad universitaria se ha repartido uncuestionario entre los estudiantes para averiguarsu grado de satisfacción con diversas actividades yservicios. Por ejemplo, por lo que se refiere al«método de matriculación para las clases del pró-ximo cuatrimestre», se pide a los estudiantes quepongan una cruz en una de las casillas siguientes:

    $ muy satisfecho$ moderadamente satisfecho$ neutral$ moderadamente insatisfecho$ muy insatisfecho¿Es la respuesta de un estudiante a esta preguntanumérica o categórica? Si es numérica, ¿es discre-ta o continua? Si es categórica, indique el nivel demedición.

    2.4. En una encuesta reciente se pidió al profesoradode una universidad que respondiera a una serie depreguntas. Indique el tipo de datos de cada pre-gunta.a) Indique su nivel de satisfacción con la carga

    docente (muy satisfecho; moderadamente satis-fecho; neutral; moderadamente insatisfecho;muy insatisfecho).

    b) ¿Cuántos artículos ha publicado en revistas conevaluación anónima durante el último año?

    c) ¿Ha asistido a la última reunión del consejo dedepartamento?

    d) ¿Cree usted que el proceso de evaluación de ladocencia debe revisarse?

    2.5. Se ha formulado una serie de preguntas a unamuestra de clientes de una tienda de helados.Identifique el tipo de datos que se pide en cadapregunta.a) ¿Cuál es su sabor favorito?b) ¿Cuántas veces al mes toma helado?c) ¿Tiene hijos de menos de 10 años que vivan

    en casa?d) ¿Ha probado el último sabor de helado?

    2.6. La comunidad de propietarios de viviendas ha for-mulado una serie de preguntas a los residentes de

    12 Estadística para administración y economía

  • una urbanización. Identifique el tipo de datos quese pide en cada pregunta.

    a) ¿Jugó al golf el mes pasado en el nuevo campode golf de la urbanización?

    b) ¿Cuántas veces ha comido en el restaurante dela urbanización en los tres últimos meses?

    c) ¿Tiene usted una caravana?d) Valore el nuevo sistema de seguridad de la

    urbanización (muy bueno, bueno, malo, muymalo).

    Ejercicios aplicados

    2.7. En una universidad se realizó una encuesta alos estudiantes para obtener información sobrevarias cuestiones relacionadas con la biblioteca.Los datos se encuentran en el fichero de datosLibrary.

    a) Ponga un ejemplo de una variable categóricacon respuestas ordinales.

    b) Ponga un ejemplo de una variable categóricacon respuestas nominales.

    c) Ponga un ejemplo de una variable numéricacon respuestas discretas.

    2.8. Un grupo de estudiantes de administración deempresas realizó una encuesta en su campus uni-versitario para averiguar la demanda estudiantil deun producto, un suplemento proteínico para los ba-tidos («Smoothies» en inglés). Encuestó a unamuestra aleatoria de 113 estudiantes y obtuvo datosque podrían ser útiles para desarrollar su estrategiade marketing. Las respuestas a esta encuesta se en-cuentran en el fichero de datos Smoothies.a) Ponga un ejemplo de una variable categórica

    con respuestas ordinales.b) Ponga un ejemplo de una variable categórica

    con respuestas nominales.

    2.2. Gráficos para describir variables categóricas

    Las variables categóricas pueden describirse utilizando tablas de distribución de frecuen-cias y gráficos como gráficos de barras, gráficos de tarta y diagramas de Pareto. Estosgráficos son utilizados habitualmente por los directivos y los analistas de mercado paradescribir los datos procedentes de encuestas y de cuestionarios.

    Distribución de frecuenciasUna distribución de frecuencias es una tabla utilizada para organizar datos. La columna dela izquierda (llamada clases o grupos) contiene todas las respuestas posibles sobre una varia-ble estudiada. La columna de la derecha es una lista de las frecuencias o número de observa-ciones correspondientes a cada clase.

    TablasLas clases que utilizamos para construir tablas de distribución de frecuencias de una varia-ble categórica son sencillamente las respuestas posibles a la variable categórica.

    EJEMPLO 2.1. Las principales empresas de Florida central en 2003(gráficos de barras y de tarta)

    ¿Qué empresas ocuparon los primeros puestos en Florida central en 2003?

    Solución

    El Orlando Sentinel enumera anualmente las principales empresas de Florida central(véase la referencia bibliográfica 7). La Tabla 2.1 es una distribución de frecuencias delas cinco empresas que tenían el mayor número de asalariados en esta zona.

    Capítulo 2. Descripción gráfica de los datos 13

  • Tabla 2.1. Principales empresas de Florida central en 2003.

    Empresa Número de asalariados

    Disney World 51.600Florida Hospital 19.283Publix Supermarkets Inc. 14.995Wal-Mart Stores Ind. 14.995Universal Orlando 12.000

    Gráficos de barras y gráficos de tarta

    Los gráficos de barras y los gráficos de tarta se utilizan normalmente para describir datoscategóricos. Si nuestro objetivo es llamar la atención sobre la frecuencia de cada categoría