revista de muestro y estadística núm1 · 2014. 4. 3. · ahora se supondra que las proporciones...

45
.

Upload: others

Post on 07-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • Bivariada 23.png

    .

  • Revista de Muestreo y Estadı́stica

    Contenido

    Directorio 3

    Presentación 4

    Pluralidad y Diversidad Polı́tica basado en el Índice de Shannon 6

    Aplicación de las Distribuciones Poisson y Binomial Negativa para modelarla distribución de manadas de elefantes 16

    Estratificación por Particiones Sucesivas 28

    Sistemas de Información Geográfica 36

    Número I 2 Marzo 2014

  • DIRECTORIO

    REVISTA DE ESTADÍSTICA Y MUESTREO

    Francisco Sánchez Villarreal.Director.

    Oscar Rosales Vergara. Susana Barrera OcampoMesa de Redacción y apoyo en investigación.

    Guillermo Aarón Espinosa Reyes.Diseño y Elaboración Editorial.

    REVISTA DE ESTADÍSTICA Y MUESTREO. Volumen 1, Número 1. Enero-Marzo de 2014. Es una revistaelectrónica trimestral editada por un grupo de alumnos, ex-alumnos y profesores de Estadı́stica de la Fa-cultad de Ciencias de la UNAM que aborda temas de aplicación de Estadı́stica y Muestreo probabilı́sticoen temas diversos como Actuarı́a, Biologı́a, Control de Calidad, Demografı́a, Economı́a, Ecologı́a, Edu-cación, Investigación de Mercados, Psicologı́a, Sociologı́a, Salud, etc. Sus fines son la exposición y difusiónde métodos y procedimientos que apoyen la enseñanza y aplicación de la Estadı́stica y el Muestreo.

    Responsable de la edición: Francisco Sánchez [email protected]

  • PRESENTACIÓN

    La REVISTA DE ESTADÍSTICA Y MUESTREO es una nueva publicación electrónica de acceso gratuito,producto del entusiasmo y trabajo coordinado de un grupo de profesores, alumnos y ex-alumnos del área deEstadı́stica de la Facultad de Ciencias de la UNAM, con el propósito de difundir conocimientos de las áreasreferidas con una visión preponderante en la aplicación. La Estadı́stica como ciencia en la sociedad actual,autodefinida como sociedad de la información, ha incrementado notablemente su presencia pues proveede métodos y técnicas cientı́ficamente soportados que facilitan la adquisición, organización y análisis dedatos que con el apoyo de modelos formales ayudan a entender en forma sistemática y objetiva una ampliagama de fenómenos naturales y los generados por la intervención de los seres humanos. Los datos quese recolectan de los fenómenos en general son parciales y limitados por diversas causas, sin embargo, enel supuesto de que su recolección se base en procedimientos formales de aleatorización, constituirán unamuestra aleatoria, a partir de la cual la Estadı́stica permitirá inferir, generalizar los resultados a toda lapoblación de referencia y la verificación de hipótesis de causalidad o interdependencia entre las variablesanalizadas.

    La Estadı́stica debe su importancia a la utilidad que significa para las disciplinas cientı́ficas que basan laconstrucción de conocimientos a partir del estudio de hechos y fenómenos sujetos a observación o exper-imentación. Estas disciplinas recurren con mayor frecuencia a los métodos y modelos estadı́sticos paravalidar sus descubrimientos y verificar hipótesis. La tecnologı́a ha impulsado exponencialmente nuevosmétodos y fuentes de datos estadı́sticos y simultáneamente los ha puesto al alcance de cualquier investi-gador o estudiante. La Estadı́stica, excluyéndola de los campos de aplicación, tiene su interés esencial enla identificación, medición y eventualmente el control de los factores que contribuyen a la varianza de losaspectos relevantes de un fenómeno que se identifican genéricamente como variables.

    La enseñanza de la Estadı́stica resulta incompleta si no incorpora ejemplos de aplicaciones que no selimiten a planteamientos simplistas y fuera de contexto que solamente ilustran la mecánica de cálculo,los propios alumnos de los diferentes cursos de estadı́stica reclaman continuamente la aplicación realistade los temas abordados por los profesores, pretendemos a través de este medio llenar parcialmente esanecesidad.

    Invitamos a los lectores a enriquecer y sostener la publicación de este medio con documentos metodológicos,reportes de investigaciones, resúmenes de tesis, etc. Con agrado los incluiremos en los siguientes númerosde la revista, basta comunicarse a nuestro correo electrónico para obtener detalles en el procedimiento decolaboración.

    Francisco Sánchez VillarrealMarzo 2014

  • Francisco Sánchez Villarreal

    Pluralidad y Diversidad Polı́ticaÍndice basado en Entropı́a

  • Revista de Muestreo y Estadı́stica

    PLURALIDAD Y DIVERSIDAD POLÍTICA EN MÉXICOÍNDICE BASADO EN ENTROPÍA DE SHANNON

    Francisco Sánchez Villarreal ∗

    Introducción

    UNO DE LOS ASPECTOS MÁS CARACTERÍSTICOS DE LA EVOLUCIÓN DEMOCRÁTICA de México es lamayor pluralidad o diversidad de propuestas y opiniones polı́ticas que se manifiestan sistemá-ticamente a través de los partidos que con mayor o menor fortuna participan en los eventos elec-torales estatales o nacionales, ya sea en forma independiente o a través de las alianzas y coaliciones. Éstasúltimas permiten sumar fuerzas contra un partido dominante, aumentar las probabilidades de triunfo oal menos garantizar una discreta presencia en la arena polı́tica.

    Los amplios rangos de porcentajes de votaciones que llegan a obtener los partidos en cada elecciónfederal o local en las diversas entidades, municipios y distritos electorales son indicadores de los cambiosde preferencias de los electores, quienes han aprendido a premiar o a castigar en forma muy inmediata eldesempeño de los personajes que obtienen cargos gubernamentales de elección popular.

    La pluralidad polı́tica, que en adelante referiré como diversidad polı́tica, es un fenómeno cuya magnitudse mide en nuestro medio en forma intuitiva, en función de lo cerrado o abierto que se presentan lasdiferencias entre los porcentajes de votos obtenidos, principalmente entre los partidos dominantes, sinembargo, no se dispone de un indicador sistemático y objetivo que se oriente a la medición de tal diversidadcon la inclusión de todos los partidos.

    2. Índice de Entropı́a de Shannon

    En 1948 el Ante la pre-gunta de unperiodistade si lasmáquinaspodı́an pen-sar, Shannonrespondió:¡Natural-mente!¡Usted yyo somosmáquinasy vaya sipensamos!.Falleció deAlzheimer alos 84 años.

    Ante la pre-gunta de unperiodistade si lasmáquinaspodı́an pen-sar, Shannonrespondió:¡Natural-mente!¡Usted yyo somosmáquinasy vaya sipensamos!.Falleció deAlzheimer alos 84 años.

    matemático norteamericano Claude El-wood Shannon, reconocido como el fundador de laTeorı́a de la Información, fallecido recientemente,publicó un artı́culo titulado The Mathematical The-ory of Communication en el Bell System ThechnicalJournal, poco más tarde, él y el sociólogo WarrenWeaver publican el libro The Mathematical Theoryof Communication.

    Entre sus planteamientos se expone un indicadorde la medida de la incertidumbre o entropı́a con-tenida en un mensaje. Con el tiempo se han vertidomúltiples aplicaciones para ese indicador en cam-pos tan distintos como la Economı́a, como medidade concentración de ingresos y en la Ecologı́a, para

    medir el grado de diversidad de especies biológicas.La razón es que la incertidumbre, la diversidad yla concentración conceptualmente tienen mucho encomún.

    Si se tienen dos posibles elementos e1 y e2 con lamisma probabilidad de aparición (0.5), la entropı́ao diversidad asociada al conjunto se puede expresarpor el logaritmo en base 2 de los 2 elementos, estoes log2(2) = 1. Si tenemos p1 = p(e1) y p2 = p(e2)entonces la entropı́a se define como

    H = p1log2(1

    p1) + p2log2(

    1

    p2) (1)

    ∗Francisco Sánchez Villarreal es egresado de la Licenciatura en Actuarı́a, de la UNAM.Actualmente es Profesor del Departamento de Matemticas en la Facultad de Ciencias.Ha colaborado en ponencias y artı́culos cientı́ficos en la Asociación Mexicana deEstadśtica.Es asesor en Muestreo y Estadśtica.

    Número I 1 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Al sustituir los valores p1 = p2 = 0.5 en 1, estoes una distribución uniforme, se obtiene la máximaentropı́a:

    H = 0.5log2(1

    0.5) + 0.5log2(

    1

    0.5) = 1 (2)

    Si las probabilidades son p1 = 0.01 y p2 = 0.99respectivamente el valor de H disminuye sensible-mente.

    H = (0.01)log2(1

    0.01) + 0.99log2(

    1

    0.99) = 0.080793

    (3)

    En el primer caso 2 hay mayor entropı́a o incer-tidumbre para pronosticar la aparición de un ele-mento extraı́do al azar. En el segundo caso 3 eselevada la probabilidad de que el valor observadocorresponda al segundo elemento y en consecuenciahay menor incertidumbre. El valor máximo de H es1 (log2(2) = 1) y se alcanza con p igual a 0.5 y dis-minuye para valores de p mayores o menores de 0.5,como se puede apreciar en la siguiente gráfica. Ellose debe a la dominancia de uno u otro elemento.

    Fig. 1: Comportamiento de la Entropı́a en funciónde p

    La fórmula genérica del Índice de entropı́a H deShannon es la siguiente: Fórmula del

    Índice deentropı́a deShannonH =

    k∑i=1

    pilog21

    pi

    Donde k es el número de categorı́as, y pi es la pro-porción de elementos en la categorı́a i

    2.1 Índice de Diversidad Polı́ticade Shannon

    Si se consideran a las k categorı́as como el númerode partidos registrados para una elección y pi laproporción de electores que votan por el partido i,el ı́ndice de la medida de entropı́a de Shannon sepuede interpretar como un Índice de DiversidadPolı́tica (IDP) y se asocia con la probabilidad depredecir la preferencia del partido polı́tico de unelector extraı́do al azar, a mayor diversidad, menorprobabilidad de lograrlo. El indicador tiene la ven-taja de no depender del número total de electores,sino fundamentalmente del número de partidos reg-istrados y de los porcentajes de votos alcanzados porcada uno, ello da bases para establecer compara-ciones en términos geográficos y temporales.

    El valor máximo alcanzado por H para 2 a 15 ele-

    mentos se presenta en la siguiente tabla:

    Elementos H max Elementos H max2 1.000 9 3.16993 1.585 10 3.32194 2.000 11 3.45945 2.322 12 3.58506 2.585 13 3.70047 2.807 14 3.80748 3.000 15 3.9069

    Cuadro 1: Valores Máximos de la Medida de En-tropı́a

    Consideremos como ejemplo el caso de 5 partidosregistrados y 150 electores potenciales. El estadode máxima incertidumbre, entropı́a o diversidad

    Número I 2 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    polı́tica se darı́a cuando los cinco partidos tuvieranel mismo número de electores, situación que se pre-senta en el cuadro 2

    PartidoNúmero deElectores enel Partido

    Proporciónde ElectoresPi

    pilog2(1pi

    )

    1 30 0.2 0.4643862 30 0.2 0.4643863 30 0.2 0.4643864 30 0.2 0.4643865 30 0.2 0.464386

    Suma 150 1.0 2.321928

    Cuadro 2: Cálculo del IDP con 5 Partidos Polı́ticosHipotéticos distintos

    El estado de máxima diversidad tiene valor H =2.3219281 que equivale al log2(5) = 2.3219281 y quecorresponde a cinco partidos. Este valor se consi-derará como 100%.

    Ahora se supondrá que las proporciones de elec-tores no son homogéneas, esto es que hay dominan-cia de ciertos partidos o menor diversidad de elec-tores. Obsérvese el cambio del IDP en los Cuadros3 y 4 a continuación:

    PartidoNúmero deElectores enel Partido

    Proporciónde ElectoresPi

    pilog2(1pi

    )

    1 65 0.433 0.5227952 50 0.333 0.5283213 20 0.133 0.3875854 10 0.067 0.2604595 5 0.033 0.163563

    Suma 150 1.000 1.862724

    Cuadro 3: Cálculo del IDP con 5 Partidos Polı́ticosHipotéticos distintos

    PartidoNúmero deElectores enel Partido

    Proporciónde ElectoresPi

    pilog2(1pi

    )

    1 105 0.700 0.3602012 30 0.200 0.4643863 7 0.050 0.2160964 5 0.030 0.1517675 3 0.020 0.112877

    Suma 150 1.000 1.305327

    Cuadro 4: Cálculo del IDP con 5 Partidos Polı́ticosHipotéticos distintos

    El valor de H2 = 1.862724 respecto de la H máximadel Cuadro 2 (H = 2.3219) representa el 80.22 %,valor que es intuitivamente más comprensible y quedesde luego refleja menor diversidad debido a ladominancia de los partidos 1 y 2. Puesto que la Hdepende de la diversidad, pero también del númerode partidos, se adopta como IDP el porcentaje querepresenta H de su máximo valor.

    En el Cuadro 4 se presenta la dominancia del par-tido 1 y el efecto que ello provoca en el valor delı́ndice de diversidad polı́tica, que en este caso dis-minuye a 1.30736 y representa el IDP= 56.3% de suvalor máximo.

    El IDP puede ser calculado en base a cualquiercriterio de desagregación. Puede calcularse con re-ferencia al paı́s en su conjunto, por cada una de las32 entidades federativas, por distrito electoral, mu-nicipio, delegación o sección electoral.

    3. Índice de Diversidad Polı́tica

    Como ejemplo de aplicación del Índice de Di-versidad Polı́tica, consideremos los resultados delas elecciones de diputados federales por el prin-cipio de mayor ı́a relativa, realizadas en los años1997 a 2012. Para tener comparabilidad geográfica,además de temporal, el IDP se calculó para lastreinta y dos entidades federativas.

    En 1997 se registraron ocho partidos polı́ticos concandidatos a diputados por mayorı́a relativa paraocupar los trescientos distritos electorales federalesque integran el paı́s, los partidos registrados fueron:PAN, PRI, PRD, PC, PT, PVM, PPS y PDM. Losporcentajes de votos acumulados por partido y en-tidad federativa se presentan en el cuadro 5. Éstos

    Número I 3 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    datos constituyeron la base para el cálculo del IDP.Se consideraron únicamente los votos emitidos porpartidos, esto es, se eliminaron los votos emitidos afavor de candidatos no registrados y los votos anu-lados. El total nacional considerado de esta formafue de 28,913,338 votos y porcentualmente se dis-tribuyeron como se muestra en el cuadro 5, dondese agregan los cálculos para el IDP.

    El valor máximo que puede alcanzar el IDP paraocho partidos es log2(8) = 3. Si se considera 3 como100%, la H de Shannon calculada alcanza 2.00723y el IDP = 66.89% de ese máximo.

    Partido Siglas Porcentajede Votos

    pilog2(1pi

    )

    Partido Acción Nacional PAN 26.62% 0.50829Partido Revolucionario Institucional PRI 39.12% 0.52969Partido de la Revolucin Democrtica PRD 25.72% 0.50386Partido Cardenista PC 01.12% 0.07258Partido del Trabajo PT 02.59% 0.13652Partido Verde Ecologista Mexicano PVEM 03.82% 0.17993Partido Popular Socialista PPS 00.35% 0.02855Partido Demcrata Mexicano PDM 00.66% 0.04781Total 100.00% 2.00723

    Cuadro 5: Elecciones de Disputados Federales porMayorı́a Relativa 1997.

    En el extremo alto del cuadro 6, Tlaxcala alcanzaun IDP= 70.41. El PRI dominó (43.4%), en menorescala el PAN y el PRD se ubicaron en torno al 20%.El PT (5.5%) y el PVEM(4.2%) superaron sus por-centajes nacionales. Solamente el PPS se mantuvodebajo del 1%.

    En Durango, la siguiente entidad entre las demayor diversidad polı́tica, con IDP= 68.89 el PRIdominó las votaciones con 38.2% de los votos, sinembargo, el ı́ndice refleja la notable presencia delPT con 23.66% de votos, porcentaje que superó am-pliamente al PRD (10.76%) y estuvo muy cerca delPAN (24.68%).

    En el Estado de México, tercera posición entre lasde mayor diversidad con IDP= 67.87 dominó el PRI(35.29%), pero con la cercana presencia del PRD(34.22%) y con amplia distancia del PAN (19.97%).El PVEM ( 6.61%) tuvo participación relativa mayora la nacional.

    No. Entidad Federativa PAN PRI PRD PC PT PVEM PPS PDM Total H de Shannon IDP1 Tlaxcala 19.6% 43.4% 23.9% 1.1% 5.5% 4.2% 0.3% 2.1% 100.0% 2.1122 70.412 Durango 24.4% 38.2% 10.8% 0.6% 23.7% 1.7% 0.4% 0.3% 100.0% 2.0668 68.893 Estado de México 20.0% 35.3% 34.2% 1.4% 1.5% 6.6% 0.3% 0.7% 100.0% 2.0360 67.874 Distrito Federal 18.0% 23.6% 45.4% 1.8% 1.6% 8.6% 0.3% 0.5% 100.0% 2.0304 67.685 Guanajuato 43.0% 34.3% 13.0% 1.0% 1.9% 3.6% 0.3% 2.9% 100.0% 1.9567 65.226 Veracruz 21.6% 43.7% 26.9% 1.6% 3.0% 2.2% 0.6% 0.4% 100.0% 1.9518 65.067 Baja California Sur 19.1% 49.5% 12.3% 0.3% 16.0% 2.1% 0.2% 0.3% 100.0% 1.9460 64.878 Morelos 15.8% 36.4% 40.1% 1.1% 1.9% 4.0% 0.2% 0.4% 100.0% 1.9026 63.429 Aguascalientes 36.3% 42.4% 13.0% 1.3% 1.7% 4.2% 0.3% 0.7% 100.0% 1.8909 63.03

    10 Zacatecas 25.8% 50.4% 14.0% 0.5% 6.4% 1.8% 0.7% 0.3% 100.0% 1.8754 62.5111 Puebla 25.7% 48.8% 18.1% 1.0% 1.7% 3.8% 0.5% 0.4% 100.0% 1.8696 62.3212 Michoacan 18.0% 35.8% 40.4% 0.9% 1.3% 2.4% 0.2% 1.0% 100.0% 1.8625 62.0813 Quintana Roo 23.4% 46.9% 23.5% 0.9% 2.3% 2.6% 0.2% 0.2% 100.0% 1.8563 61.8814 Baja California 43.3% 35.9% 13.6% 0.8% 1.8% 4.0% 0.4% 0.4% 100.0% 1.8464 61.5515 Queretaro 45.4% 36.8% 9.4% 2.7% 2.2% 2.6% 0.6% 0.5% 100.0% 1.8438 61.4616 Jalisco 44.7% 35.7% 11.7% 0.9% 1.3% 4.2% 0.2% 1.2% 100.0% 1.8411 61.3717 Tamaulipas 18.7% 48.0% 26.8% 0.6% 4.0% 1.3% 0.2% 0.4% 100.0% 1.8322 61.0718 Coahuila 30.3% 48.6% 14.0% 2.6% 2.0% 1.9% 0.3% 0.3% 100.0% 1.8316 61.0519 Hidalgo 16.2% 50.2% 26.8% 0.9% 2.7% 2.6% 0.3% 0.4% 100.0% 1.8268 60.8920 Sinaloa 30.0% 42.7% 22.7% 0.7% 1.5% 1.6% 0.4% 0.3% 100.0% 1.8260 60.8721 Colima 38.6% 37.4% 19.8% 0.8% 0.8% 1.2% 0.4% 1.0% 100.0% 1.8096 60.3222 Sonora 31.2% 37.6% 27.5% 0.4% 1.9% 0.8% 0.1% 0.3% 100.0% 1.8084 60.2823 San Luis Potos 38.2% 43.9% 10.8% 0.3% 3.6% 1.8% 0.4% 0.9% 100.0% 1.7959 59.8624 Oaxaca 12.7% 50.2% 30.9% 1.4% 1.8% 2.0% 0.6% 0.4% 100.0% 1.7787 59.2925 Nayarit 23.4% 50.9% 20.7% 0.5% 2.1% 1.5% 0.5% 0.3% 100.0% 1.7737 59.1226 Chihuahua 41.2% 42.1% 10.3% 0.6% 2.4% 2.8% 0.2% 0.3% 100.0% 1.7540 58.4727 Chiapas 13.2% 51.0% 29.7% 1.1% 3.3% 1.3% 0.2% 0.2% 100.0% 1.7530 58.4328 Campeche 8.1% 47.5% 36.2% 0.4% 6.4% 0.9% 0.2% 0.4% 100.0% 1.7290 57.6329 Guerrero 5.8% 46.2% 42.5% 1.5% 1.6% 1.6% 0.4% 0.4% 100.0% 1.6202 54.0130 Nuevo Len 49.2% 40.3% 2.9% 0.3% 5.7% 1.1% 0.2% 0.3% 100.0% 1.5485 51.6231 Yucatan 38.5% 51.0% 7.4% 0.3% 0.9% 1.6% 0.1% 0.2% 100.0% 1.5140 50.4732 Tabasco 4.7% 51.7% 40.8% 0.4% 1.2% 1.0% 0.1% 0.2% 100.0% 1.4311 47.70

    República Mexicana 26.6% 39.1% 25.7% 1.1% 2.6% 3.8% 0.4% 0.7% 100.0% 2.0072 66.89

    Cuadro 6: Porcentajes de Votaciones por Entidad Federativa en las Elecciones Federales de Diputados porMayorı́a Relativa 1997.

    Número I 4 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    El Distrito Federal, se colocó en cuarta posición en-tre las de mayor diversidad con IDP=67.68. El PRDdominó claramente esas elecciones con el 45.38% delos votos, fue seguido muy lejos por el PRI (23.6%)y el PAN (18.04%). El PVEM (8.61%) acumuló sumáxima votación por estado.

    La entidad con el IDP menor es Tabasco con unIDP=47.7. Se observa que las elecciones fuerondominadas por dos partidos, el PRI (51.7%) y el PRD(40.8%). El PAN alcanzó solamente 4.7% de los vo-tos. Los 5 partidos restante no alcanzaron ni 2% delos votos. Las siguientes posiciones entre los másbajos fueron ocupadas por Yucatán y Nuevo Leóncon IDP de 50.47 y 51.62

    El siguiente mapa temático permite apreciarrápidamente la distribución del IPD. Claramentese observa mayor diversidad en el centro de paı́s yla menor en el Sur y Sureste.

    Fig. 2: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 1997.

    Es interesante observar la evolución de la diver-sidad polı́tica en las elecciones subsiguientes. Enel año 2000 participaron 11 partidos, de los cuales4 partidos participaron solos y 7 más en formade 2 alianzas: Partido Revolucionario Institucional(PRI), Partido del Centro Democrático (PCD), Par-tido Auténtico de la Revolución Mexicana (PARM),Partido Democracia Social (PDS); Alianza por elCambio, integrada por el Partido Acción Nacional(PAN) y el Partido Verde Ecologista de México y laAlianza por México, integrada por el Partido de laRevolución Democrática (PRD), el Partido del Tra-

    bajo (PT), Convergencia por la Democracia, PartidoAlianza Social (PAS) y Partido de la Sociedad Na-cionalista (PSN). El IDP nacional se incrementó a67.89.

    Fig. 3: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 2000.

    En las elecciones de 2003 participaron 12 partidos.El PRI participó sólo en 21 entidades y conformóalianza con el PVEM en 11 entidades federativas,pero en sı́ los partidos participantes fueron: PAN,PRI, PRD, PT, PVEM, Convergencia, Partido de laSociedad Nacionalista (PSN), Partido Alianza So-cial, Partido México Posible (PMS), Partido LiberalMexicano (PLM) y Fuerza Ciudadana (FC); aunqueno todos presentaron candidato en todos los dis-tritos y como consecuencia en varias entidades fe-derativas el número de partidos se redujo a 10. Elcálculo del IDP por entidad federativa se ajusta alos partidos participantes, pero al considerar los 12partidos a nivel nacional, los porcentajes por par-tido se reducen sensiblemente, para los partidos queno presentaron candidatos en todos los distritos. ElIDP nacional se incrementó a 70.48

    Número I 5 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Fig. 4: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 2003.

    En las elecciones del año 2006 el número de par-tidos participantes se redujo a 8, de los cuales 3partidos participaron solos y 5 conformaron 2 alian-zas: PAN, Partido Nueva Alianza (PANAL), PartidoAlternativa Social Demócrata (PASD); el PRI y elPVEM conformaron la Alianza por México, en tantoque el PRD, PT y Convergencia forma la Alianzapor el Bien de Todos. Los porcentajes de votacionesdel PAN y de las dos alianzas, alcanzaron porcenta-jes cercanos al 30% y tanto el PANAL, como PASDsuperaron 2% de las votaciones. El efecto fue unimportante incremento del IDP hasta 81.50

    Fig. 5: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 2006.

    En las elecciones de 2009, participaron 8 par-tidos, sin embargo algunos conformaron 2 alian-zas, aunque no definidas en todos los distri-tos: PAN, PRI, PRD, PVEM, PT, Convergencia,PANAL, Partido Social Demócrata (PSD), Alianza

    Primero México (PRI-PVEM) y la Alianza Salvemosa México (PT-Convergencia). El PRI incrementó no-tablemente su porcentaje de votación hasta 38.9%,con el consiguiente descenso para el PAN (29.7%)y el PRD, por sı́ solo, descendió hasta 12.9%. Los3 partidos restantes se mantuvieron en un margende 2.5% a 3.8% y las alianzas, a nivel nacional noalcanzaron el 1% de los votos. El efecto, fue un des-censo del IDP a 69.3.

    Fig. 6: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 2009.

    Finalmente en las recientes elecciones de 2012,participaron 7 partidos en forma independiente yconformando 5 alianzas por candidatos comunes,conformado 12 opciones distintas: PAN, PRI, PRD,PVEM, PT, Movimiento Ciudadano (antes Conver-gencia), PANAL, PRI-PVEM, PRD-PT-MC, PRD-PT,PRD-MC y PT-MC. El PRI por sı́ solo, descendió suporcentaje de votaciones a 31.5%. El PAN a diferen-cia de las elecciones presidenciales, se mantuvo en27.3% y el PRD por sı́ solo sumó 17.3% de las vota-ciones. El 24% restante de la votación se distribuyóentre las 9 opciones restantes, pero ninguna alcanzó5% de los votos. La resultante fue un IPD= 73.67

    Número I 6 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Fig. 7: IDP de Shannon. Elecciones Federales deDiputados por Mayorı́a Relativa 2012.

    Las entidades federativas han presentado compor-tamientos similares a lo largo de las seis elecciones.El estado de Morelos ha obtenido el IDP más altoen las últimas cuatro elecciones. Tlaxcala tieneel segundo mejor promedio en su posición de lasseis elecciones. El Distrito Federal también ha ocu-pado posiciones altas, excepto en 2006, que bajó a laposición 18. En el otro extremo, Tabasco, Yucatán yNuevo León se han mantenido sistemáticamente enlos últimos lugares.

    1997 2000 2003 2006 2009 2012 LugarNo. Entidad IDP Lugar IDP Lugar IDP Lugar IDP Lugar IDP Lugar IDP Lugar Promedio

    1 Morelos 63.42 8 68.09 4 70.79 1 84.57 1 82.05 1 78.20 1 2.672 Tlaxcala 70.41 1 70.56 3 66.54 4 79.57 8 71.83 9 77.12 4 4.833 Distrito Federal 67.68 4 75.68 1 62.88 6 76.20 18 78.86 2 78.05 2 5.504 México 67.87 3 70.60 2 62.27 8 84.11 2 71.30 11 74.99 7 5.505 Zacatecas 62.51 10 66.95 8 57.22 16 81.57 5 73.21 6 73.05 9 9.006 Michoacán 62.08 12 67.62 5 62.70 7 78.11 11 72.71 7 67.87 16 9.677 Baja California Sur 64.87 7 67.03 7 60.17 11 78.33 10 73.66 5 66.09 19 9.838 Quintana Roo 61.88 13 65.37 13 69.56 2 77.66 12 66.45 17 76.07 6 10.509 Hidalgo 60.89 19 66.05 10 59.32 13 82.26 3 71.60 10 71.22 12 11.1710 Aguascalientes 63.03 9 61.01 22 61.60 10 79.56 9 75.55 3 69.04 15 11.3311 Puebla 62.32 11 63.12 17 55.62 19 81.99 4 66.84 15 77.96 3 11.5012 Baja California 61.55 14 59.68 25 57.93 15 80.87 6 71.29 12 74.25 8 13.3313 Oaxaca 59.29 24 67.33 6 63.81 5 72.89 27 72.30 8 72.92 10 13.3314 Chiapas 58.43 27 64.10 16 67.49 3 73.76 26 74.39 4 76.51 5 13.5015 Veracruz 65.06 6 65.55 11 61.88 9 76.69 17 60.13 23 67.40 17 13.8316 Jalisco 61.37 16 62.05 19 56.28 18 75.96 19 63.64 20 70.95 13 17.5017 Nayarit 59.12 25 62.44 18 59.07 14 77.42 13 63.76 19 67.26 18 17.8318 Guerrero 54.01 29 60.25 23 56.51 17 74.87 23 69.35 13 71.69 11 19.3319 Campeche 57.63 28 66.59 9 54.23 25 80.47 7 54.44 29 65.81 22 20.0020 Quertaro 61.46 15 64.46 14 55.02 22 75.60 21 62.52 21 62.69 27 20.0021 Durango 68.89 2 61.02 21 50.90 29 74.30 25 60.48 22 63.68 24 20.5022 Guanajuato 65.22 5 57.02 30 59.69 12 69.26 30 64.67 18 62.14 28 20.5023 San Luis Potosı́ 59.86 23 60.25 24 54.12 26 74.74 24 68.00 14 70.35 14 20.8324 Sinaloa 60.87 20 59.45 26 54.95 23 77.00 16 60.11 24 65.16 23 22.0025 Tamaulipas 61.07 17 58.56 27 53.79 27 77.08 15 56.48 26 62.93 25 22.8326 Coahuila 61.05 18 58.26 28 55.47 20 77.29 14 51.26 30 61.29 30 23.3327 Chihuahua 58.47 26 56.78 31 48.85 30 75.91 20 66.61 16 65.94 20 23.8328 Colima 60.32 21 65.52 12 53.40 28 69.19 31 55.25 28 61.77 29 24.8329 Sonora 60.28 22 61.36 20 55.21 21 71.33 28 50.43 31 57.70 31 25.5030 Tabasco 47.70 32 64.11 15 48.39 31 58.60 32 59.42 25 65.88 21 26.0031 Nuevo León 51.62 30 57.38 29 48.02 32 75.55 22 56.33 27 62.88 26 27.6732 Yucatán 50.47 31 50.54 32 54.78 24 70.74 29 50.09 32 54.93 32 30.00

    Nacional 66.89 67.89 70.48 81.50 69.31 73.67

    Cuadro 7: Índices de Diversidad Polı́tica de Shannon por entidad federativa y posición relativa de elec-ciones federales para diputados 1997-2012.

    Número I 7 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    4. La Oferta Polı́tica

    A lo largo de las 6 elecciones federales de diputadospor el principio de mayorı́a relativa del perı́odo de1997 a 2012, han participado 18 partidos polı́ticosen forma independiente y a través de diversasalianzas o coaliciones, que han conformado hasta 12opciones a los electores. La incorporación de nuevos

    partidos polı́ticos no ha tenido un efecto tan sensi-ble en el IDP, pues los tres partidos dominantes hanacumulado más del 80% de la votación y los par-tidos con menor presencia entre los electores se hanintegrado en alianzas o coaliciones con los partidosdominantes para sostener sus registros.

    Año PARTIDOSPAN PRI PRD PCD PC PT PVEM PPS PDM PARM PDS PADS PSN PAS MP PLM FC PANAL

    Electoral (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17) (18)199720002003200620092012

    Cuadro 8: Partidos Participantes en Elecciones Federales de Diputados por Mayorı́a Relativa

    1 PAN Partido Acción Nacional 10 PARM Partido Auténtico de la Revolucin Mexicana2 PRI Partido Revolucionario Institucional 11 PADS Partido DemocraciaSocial3 PRD Partido de la Revolución Democrática 12 PASD Partido Alternativa Social Demcrata4 PCD Partido del Centro Democrático 13 PSN Partido de la Sociedad Nacionalista5 PC-MC Partido Converrgencia (en 2011, Movimiento Ciudadano) 14 PAS Partido Alianza Social6 PT Partido del Trabajo 15 MP Partido Mxico Posible7 PVE Partido Verde Ecologista de Mxico 16 PLM Partido Liberal Mexicano8 PPS Partido Popular Socialista 17 PFC Partido Fuerza Ciudadana9 PDM Partido Demórata Mexicano 18 PANAL Partido Nueva Alianza

    Año ALIANZASPAN PRI PRD-PT PRD PRD PRD PT

    Electoral PVEM PVEM C-PAS-PSN PT-PC PC PT (PC ó MC)199720002003200620092012

    Cuadro 9: Alianzas Participantes en Elecciones Federales de Diputados por Mayorı́a Relativa

    Número I 8 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Referencias

    [1] R. B. Ash. Information Theory. Dover Books on Mathematics. Dover Publications., 1965.

    [2] J. Krebs, Charles. Ecology the Experimental Analysis of Distribution and Abundance. Ecology Series.Harper & Row, Publishers, 1978.

    [3] S. Kullback. Information Theory and Statistics. Dover Books on Mathematics. John Wiley & Sons,1959.

    [4] H. R. W. Coding and Information Theory. Springer Undergraduate Mathematics Series. PrenticeHall, Inc, 1980.

    [5] N. Wiener. Cibernética y Sociedad. Consejo Nacional de Ciencia y Tecnologı́a, 1981.

    [6] N. Wiener. Cibernética o el Control y Comunicación en Animales y Máquinas. Turquets Editores,1985.

    Número I 9 Marzo 2014

  • Susana Barrera Ocampo

    Aplicación de las Distribuciones Poisson yBinomial Negativa para modelar ladistribución de manadas de elefantes

  • Revista de Muestreo y Estadı́stica

    DISTRIBUCIÓN DE MANADAS DE ELEFANTESEN EL PARQUE NACIONAL DE KIBALE, UGANDA

    APLICACIÓN DE LAS DISTRIBUCIONES DE POISSON Y BINOMIAL NEGATIVASusana Barrera Ocampo ∗

    1. Patrones de distribución

    EL ANÁLISIS DE LA DISTRIBUCIÓN DE una es-pecie en un hábitat, permite al investigadortener conocimiento de la dinámica y magni-tud de una población. Los cambios en el patrón dedistribución pueden revelar el efecto de factores ex-ternos o estacionales, pero también la disminución ointensificación de la competencia con otras especies.

    Las causas que provocan la ausencia o presenciade individuos de determinada especie en una regióny los patrones de agrupamiento cuando ellos estánpresentes, constituyen uno de los problemas másimportantes para la Ecologı́a.

    Para el análisis de distribuciones en el espacio,usualmente se define un cuadrante o unidad desuperficie para tomar conteos de individuos enuna muestra de cuadrantes. La densidad de unapoblación está relacionada con el número de indi-viduos por unidad de superficie o volumen y la va-rianza asociada a ese número. Los patrones de dis-tribución pueden variar desde un comportamientouniforme, dispersión aleatoria y en el otro extremogrupos o conglomerados de individuos. Los patronesde distribución revelan caracterı́sticas de interés deespecies de animales o vegetales.

    (a) Uniforme (b) Aleatorio (c) Conglomerado

    Fig. 1: Patrones de distribución espacial

    La Distribución Uniforme no es frecuente en la nat-uraleza, pero sı́ en poblaciones establecidas de man-era artificial por el hombre, como el cultivo de huer-

    tos, excepcionalmente las poblaciones de pingüinosen la Antártida de distribuyen en poblaciones muycerradas para protegerse del frı́o.

    ∗Susana Barrera Ocampo es egresada de la Licenciatura en Actuarı́a, de la UNAM.Actualmente es Profesora del Departamento de Matemticas en la Facultad de Ciencias.

    Número I 1 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    2. Modelos probabilı́sticos para distribuciones en el espacio

    El comportamiento al azar se ha probado en múltiples ocasiones que puede ser modelado exitosamentemediante una función de Poisson. Ası́ mismo, el comportamiento de conglomerados o también llamado decontagio suele ser modelado adecuadamente mediante una función de probabilidad Binomial Negativa.

    3. Función de Distribución de Poisson

    La distribución de Poisson propuesta por Siméon Denis Poisson (1838) como una aproximación de ladistribución Binomial para n grande y P pequeña, se caracteriza por la siguiente función de probabilidad.

    fX(x) =λxe−λ

    x!

    x ∈ 1, 2, 3, · · ·E(X) = λ

    V (X) = λ

    (1)

    El parámetro λ que caracteriza a esta función en 1, coincide con el valor esperado y la varianza de ladistribución. Ası́, una forma sencilla de determinar si una muestra de datos puede ser modelado medianteuna función de distribución de Poisson, consiste en calcular la media y varianza muestrales, si sus valoresson similares, es probable que el modelo de Poisson sea adecuado.

    La coincidencia del parámetro λ con E(X), permite una estimación muy simple del parámetro medianteel método de momentos. Consiste en igualar la media aritmética de la muestra con el parámetro.

    λ̂ = X̄

    4. Función de Distribución Binomial Negativa

    Para distribuciones que conforman conglomerados, también llamadas de contagio, la distribución Bino-mial Negativa suele ser una excelente alternativa de modelaje.

    La distribución Binomial Negativa se caracteriza por dos parámetros, K y P . La variable aleatoria X sepuede interpretar como el número de fracasos antes de alcanzar el k-ésimo éxito.

    fX(x) =

    (x+ k − 1

    x

    )P k(1− P )x

    k = 1, 2, 3, · · ·

    0 < P < 1x = 0, 1, 2, · · ·

    x ≤ k

    E(X) = k(1−P )PV (X) = k(1−P )P 2

    (2)

    Cuando en 2 laK no es entero, su valor se puede interpretar como el tiempo que hay que esperar para queocurra el k-ésimo éxito. La expresión de la distribución se define en función de la Gama matemática de

    Número I 2 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    la siguiente forma, que para K entero es equivalente a la fórmula anterior, pues para k entero se cumpleΓ(k) = (k − 1)!

    fX(x) =Γ(k + x)

    x! Γ(k)P k(1− P )x

    k > 0 · · ·0 < P < 1x = 0, 1, 2, · · ·

    (3)

    El método de momentos nos permite obtener estimaciones de los parámetros K y P mediante las si-guientes fórmulas:

    P̂ =X̄

    S2k̂ =

    X̄2

    S2 − X̄(4)

    Las distribuciones de individuos o manadas de animales, pero también en el caso de plantas, respondea diversos factores. La distribución de especies en donde el espacio habitable es continuo pero existeninteracciones de competencia entre individuos, hacen que donde está un individuo sea menos probableque se instale otro. La probabilidad de ocupación no es la misma para todos los puntos del espacio.Ejemplos: plantas que segregan sustancias alelopáticas por las raı́ces que impiden el establecimiento deotras plantas. Hay árboles que por competencia impiden el establecimiento de renovales bajo su copa.Muchas especies de animales delimitan un territorio, dentro del cual no se instalan otros individuos. Estaseparación a veces se da sólo entre individuos del mismo sexo o edad, por ejemplo los que se distancianson machos adultos reproductivos, pero se pueden agrupar con hembras o ejemplares juveniles.

    La distribución de contagio o agregados de individuos se da en especies que desarrollan instintos decolaboración para defenderse de otras especies competidoras o depredadoras. Ası́, diversas especies con-forman manadas tanto de presas como depredadores. La probabilidad de que un espacio sea ocupado noes la misma para todos los puntos del espacio. Las agrupaciones se pueden dar porque las condiciones delambiente difieren por los diversos factores del clima, orografı́a, fauna y flora. También puede ser conse-cuencia de la forma de reproducción, por ejemplo, cuando una planta se reproduce en forma vegetativa porestolones da lugar a agrupamientos, o animales por gemación causa que los individuos queden agrupados.

    Número I 3 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    5. Distribución de Elefantes en el Parque Nacional de Kibale

    Un interesante ejemplo de cambio en los patrones de distribución es el de las migraciones estacionales deelefantes en la reserva de Kibale, realizado por Wing y Buss (1970), estudio mencionado por R.L. Smith(1974). El Kibale National Park, fundado en 1932 en Uganda, se ubica a 240 kilómetros al oeste deKampala y a 25 kilómetros al este del Parque de las Montañas Rwenzori (Monte Stanley). El parque deKimbale ocupa una extensión de 776 kilómetros cuadrados de bosques siempre verdes, con altitud mediade 1300 metros. Además de elefantes, tiene una amplia fauna compuesta por primates, gacelas, jabalı́es,leopardos, leones, aves, etc.

    (a) Parque Nacional del Kibale (b) Elefantes

    Fig. 2: Elefantes en Uganda

    La distribución de las manadas de elefantes cambia de acuerdo a las temporadas lluviosas y secas. Du-rante las temporadas lluviosas las manadas tienden a una mayor dispersión debido a la abundancia depastos y abrevaderos. Durante las temporadas secas, por el contrario, se presentan migraciones hacia laslimitadas zonas de pastos y fuentes de agua.

    6. Modelos para las Temporadas lluviosas

    En los siguientes mapas, se muestran las distribuciones de manadas de elefantes en temporadas llu-viosas. El primer mapa de la figura 3 (a) muestra la distribución de manadas en las temporada lluviosade los meses de marzo - mayo. La distribución de manadas en la segunda temporada lluviosa septiembre- noviembre se muestra en el mapa de la figura 3 (b).

    La dispersión de las manadas en estas temporadas se torna más azarosa y se recurrirá al ajuste dedistribuciones de tipo Poisson 1 .

    Número I 4 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    (a) Marzo - Mayo (b) Septiembre-Noviembre

    Fig. 3: Distribución agregada de elefantes en el parque nacional de Kibale en épocas lluviosas. (a) En la distribución durante marzoa mayo, se observa el movimiento del bloque central hacia el norte y al este. Los elefantes se mueven y se dispersan uniformemente,también a través del bloque sur. (b) La distribución durante septiembre a noviembre nos muestra una concentración al oeste y hayuna distribución uniforme de norte a sur. (Wing and Bus, 1970. )

    6.1 Modelo para la Temporada lluviosa de Marzo a Mayo

    A partir de los números de manadas registrados en el mapa 3 (a) se procede a elaborar la siguientetabla de frecuencias y se procede al cálculo de la media y varianza. La media aritmética calculada seadopta como estimador del parámetro λ = 3.3181818 para obtener las probabilidades correspondientes alos diferentes valores de la variable aleatoria X (número de manadas por celda). En total se detectaron292 manadas en 88 celdas. Esas probabilidades permiten obtener las frecuencias esperadas. Finalmentese calcula la estadı́stica χ2 para verificar la bondad del ajuste. La hipótesis nulaH0 los datos correspondena la distribución propuesta. Esta hipótesis se rechazará si la probabilidad asociada es menor a 0.05 congrados de libertad asociados igual al número de intervalos de la tabla, menos el número de parámetrosestimados, menos 1.

    Número I 5 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Número de Frecuencia Probabilidad Frecuencia Estadı́sticaManadas Observada Poisson Esperada χ2

    x fi P (X = x) ei (fi − ei)2/ei0 5 0.03622 3.2 1.031021 7 0.12018 10.6 1.209042 19 0.19939 17.5 0.120443 15 0.22054 19.4 1.000854 20 0.18295 16.1 0.945165 14 0.12141 10.7 1.029186 5 0.06714 5.9 0.139727 2 0.03183 2.8 0.228978 1 0.01320 1.2 0.02251

    Total 88 0.99285 87.4 5.72689

    Cuadro 1: Distribución de Manadas de Elefantes durante marzo - mayo

    La gráfica en la figura 4 permite una comparación más intuitiva de las frecuencias observadas y lasesperadas de acuerdo a la distribución de Poisson ajustada. La probabilidad asociada a la estadı́stica χ25.72689 con 7 grados de libertad (9 intervalos 1 parámetro estimado -1), tiene una probabilidad asociadade corresponder al modelo poisson igual a 0.571975. Concluimos que el ajuste es bueno.

    Fig. 4: Ajuste de Distribución de Poisson. Manadas en marzo-mayo

    6.2 Modelo para la Temporada lluviosa de Septiembre a Noviembre

    Para la temporada lluviosa de Septiembre a Noviembre, con 275 manadas detectadas en las mismas 88celdas, se procedió de la misma forma. El valor estimado para λ = 3.1250, ligeramente menor que elanterior. Ello permite concluir que la forma de dispersión es muy similar en ambas temporadas secas. La

    Número I 6 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    estadı́stica χ2 alcanza un valor sustancialmente mayor 10.68732 con una probabilidad asociada igual a0.2200. Con una probabilidad menor que el modelo anterior, pero también se considera adecuado.

    Número de Frecuencia Probabilidad Frecuencia Estadı́sticaManadas Observada Poisson Esperada χ2

    x fi P (X = x) ei (fi − ei)2/ei0 6 0.04394 3.9 1.177321 9 0.13730 12.1 0.786482 16 0.21454 18.9 0.439083 26 0.22347 19.7 2.040214 13 0.17459 15.4 0.363715 11 0.10912 9.6 0.203416 2 0.05683 5.0 1.801067 4 0.02537 2.2 1.398898 0 0.00991 0.9 0.872159 1 0.00344 0.3 1.60501

    Total 88 0.99852 87.9 10.68732

    Cuadro 2: Distribución de Manadas de Elefantes durante Septiembre - Noviembre

    La gráfica en la figura 5 muestra las discrepancias entre las frecuencias observadas y las frecuenciascalculadas de acuerdo al modelo ajustado. Se nota la mayor discrepancia con las 26 celdas que registraron3 manadas y las 19.7 esperadas de acuerdo al modelo.

    Fig. 5: Ajuste de Distribución de Poisson. Manadas en Septiembre - Noviembre

    Número I 7 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    7. Modelos para las Temporadas de Sequı́a

    En los siguientes mapas, se muestran las distribuciones de manadas de elefantes en temporadas desequı́a. El primer mapa de la figura 6 (a) muestra la distribución de manadas en las temporada seca delos meses de Diciembre a Febrero . La distribución de manadas en la segunda temporada de sequı́a, deJunio a Agosto se muestra en el mapa de la figura 6 (b).

    Durante las temporadas secas, las manadas tienden a agruparse en torno al centro de la reserva, par-ticularmente en la temporada de Diciembre a Febrero. En la temporada de Junio a Agosto, se observandesplazamientos en la parte noreste. Los mayores agrupamientos de las manadas sugieren la aplicaciónde modelos del tipo binomial negativa 2 .

    (a) Diciembre - Febrero (b) Junio - Agosto

    Fig. 6: Distribución agregada de elefantes en el parque nacional de Kibale en épocas de sequı́a. (a) De diciembre a febrero,observamos como se concentra la distribución el la cuenca pantanosa. El bloque sur generalmente está abandonado y desierto. (b)La distribución de Junio a Agostonos muestra un movimiento del norte hacia el bloque sur. Hay una moderada concentración enáreas pantanosas.(Wing and Bus, 1970. )

    Número I 8 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    7.1 Modelo para la Temporada seca de Diciembre a Febrero

    Para la temporada seca de Diciembre a Febrero, se detectaron 238 manadas. El promedio de manadas porcelda en este caso fue de X̄ = 2.7045 y la varianza muestral S2 = 4.8772. Con estos valores se obtuvieronestimaciones para los parámetros de la distribución Binomial Negativa P = 0.55452 y K = 3.366. Parael cálculo de probabilidades se emplearon las fórmulas 4 . La estadı́stica χ2 = 5.14797, con 8 gradosde libertad tiene una probabilidad asociada igual a 0.74165, que permite calificar como bueno el modeloajustado.

    Número de Frecuencia Probabilidad Frecuencia Estadı́sticaManadas Observada Poisson Esperada χ2

    x fi P (X = x) ei (fi − ei)2/ei0 11 0.13737 12.1 0.097981 17 0.20602 18.1 0.070352 21 0.20037 17.6 0.643043 16 0.15968 14.1 0.270214 9 0.11322 10.0 0.093095 4 0.07431 6.5 0.985876 3 0.04616 4.1 0.277637 2 0.02751 2.4 0.073298 3 0.01588 1.4 1.836899 1 0.00894 0.8 0.05804

    10 1 0.00492 0.4 0.74157Total 88 0.99437 87.5 5.14797

    Cuadro 3: Distribución de Manadas de Elefantes durante diciembre - febrero

    La gráfica correspondiente de frecuencias observadas y esperadas muestra discrepancias más ligeras queen los casos anteriores.

    Fig. 7: Ajuste de Distribución de Poisson. Manadas en Diciembre - Febrero

    Número I 9 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    7.2 Modelo para la Temporada seca de Junio a Agosto

    El cuarto modelo ajustado, también fue una Binomial Negativa. Se identificaron 293 manadas cuyadistribución en las 88 celdas se muestra en la siguiente tabla. El promedio de manadas por celda esX̄ = 3.329545 y la varianza muestral S2 = 5.14302. Las estimaciones de los parámetros son P = 0.647390y K = 6.1130 (ver ecuaciones 4 ). La estadı́stica χ2, con valor 10.73087 y 8 grados de libertad tieneprobabilidad asociada igual a 0. 217419. Ello permite concluir que el modelo es adecuado.

    Número de Frecuencia Probabilidad Frecuencia Estadı́sticaManadas Observada Poisson Esperada χ2

    x fi P (X = x) ei (fi − ei)2/ei0 10 0.07009 6.2 2.380931 6 0.15108 13.3 4.002732 18 0.18946 16.7 0.105673 19 0.18067 15.9 0.604964 14 0.14514 12.8 0.118075 5 0.10351 9.1 1.853456 8 0.06760 5.9 0.707157 3 0.04125 3.6 0.109298 2 0.02384 2.1 0.004579 2 0.01318 1.2 0.60822

    10 1 0.00702 0.6 0.23583Total 88 0.99284 87.4 10.73087

    Cuadro 4: Distribución de Manadas de Elefantes durante junio - agosto

    La siguiente gráfica muestra que las mayores discrepancias se dieron en las frecuencias para los valores0 y 1 y en estas clases se da la mayor aportación a la estadı́stica χ2.

    Fig. 8: Ajuste de Distribución de Poisson. Manadas en Junio -Agosto

    Número I 10 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Conclusión

    Con este ejemplo se ha podido ilustrar la utilidad de los modelos Poisson y Binomial Negativa paramodelar distribuciones de elefantes en el Parque Nacional del Kibale y con ello disponer de bases objetivaspara el análisis de las migraciones estacionales de esta especie en peligro de extinción y la adopción demejores polı́ticas de conservación.

    Referencias

    [1] N. L. Johnson and S. Kotz. Distributions in Statistics: Discrete Distributions.

    [2] R. L. Smith. Ecology and and Field Biology. Harper and Row Publishers, 1974.

    [3] L. Wing and I. Buss. Elephants and Forest.

    Número I 11 Marzo 2014

  • Francisco Sánchez Villarreal

    Particiones Sucesivas

  • Revista de Muestreo y Estadı́stica

    ESTRATIFICACIÓN POR PARTICIONES SUCESIVASFrancisco Sánchez Villarreal ∗

    Introducción

    ES CONOCIDO PARA LOS MUESTRISTAS las ganancias en eficiencia que se obtienen al estratificaradecuadamente una población antes de proceder a la selección de unidades de muestreo. El ob-jetivo subyacente es identificar y controlar las fuentes de varianza para lograr el máximo de pre-cisión para un mismo tamaño de muestra. Si se dispone de una variable de estratificación medida ennivel intervalar o de razón y con elevada correlación con la variable objetivo, existen diversos métodospara estratificar.

    Uno de los más populares por su sencillez de apli-cación es el de Dalenius-Hodge (1959). Este métodoprocede con la formación de estratos a partir de laconstrucción de una tabla de frecuencias de los va-lores de la variable de estratificación, valores que seasocian a los elementos de la población para obtenerpuntos de corte que permitan definir una estructurade estratos óptima para afijaciones de muestra deNeyman (Cochran.1977).

    El supuesto de estratos numerosos y pequeños, delque parte este método, permite suponer además,uniformidad dentro de los estratos y en términosprácticos para el cálculo, proceder con la suma acu-mulada de las raı́ces cuadradas de las frecuenciasde la tabla previamente construida con intervalosde igual amplitud o ponderados si se tienen ampli-

    tudes desiguales, para determinar por división deltotal de la suma de raı́ces cuadradas de frecuenciasen tantos estratos como se quiera y ası́ identificarlos lı́mites de los estratos.

    El procedimiento de Dalenius, como muchos otrosen estadı́stica fueron ideados en tiempos en que ex-istı́an serias limitaciones de cálculo para los inves-tigadores, pues se contaba con primitivas máquinasde calcular de escritorio y el acceso a computado-ras era muy restringido. La época actual carece deesas restricciones y en el escritorio de cualquier in-vestigador se dispone de una computadora bastantepoderosa. Ello ha llevado a superar los obstáculosde cálculo que restringı́an la utilización de técnicasmás elaboradas en diversos tópicos del cómputo es-tadı́stico.

    2. Efectos de la estratificación

    Las ganancias debidas a la estratificación se obtienen a medida que se logra maximizar la varianzaentre estratos y simultáneamente minimizar la varianza dentro de estratos. La variación total se puededescomponer en dos fuentes: la suma de cuadrados dentro de estratos y la suma de cuadrados entreestratos, como se ilustra en la siguiente igualdad:

    ∗Profesor del Departamento de Matemáticas de la Facultad de Ciencias de la UNAM.Actualización de artı́culo presentado en el XIV Foro de la Asociación Mexicana de Estadı́stica, Xalapa Ver. 1999.E-mail: [email protected]

    Número I 1 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Total Dentro de EntreEstratos Estratos

    L∑h=1

    Nh∑i=1

    (yhi − Ȳ )2 =L∑h=1

    Nh∑i=1

    (yhi − Ȳh)2 +L∑h=1

    Nh∑i=1

    (Ȳh − Ȳ )2

    La ganancia aportada por la estratificación sepuede apreciar en la siguiente fórmula que rela-ciona la varianza del estimador de la media, esti-mada por muestreo aleatorio simple con la varianzadel estimador de la media obtenida por muestreo es-tratificado con afijación proporcional de la muestra.

    V (ȳmas) = V (ȳprop) +

    L∑h=1

    Nh∑i=1

    (Ȳh − Ȳ )2

    nN

    Como se puede apreciar, a medida que la varianzaentre estratos sea mayor y como consecuencia, lavarianza dentro de estratos sea menor, se tendrámayor eficiencia al utilizar muestreo estratificado.

    Maximizar la varianza entre estratos se puede lo-grar también si se minimiza la varianza dentro deestratos, esto es minimizar la siguiente suma decuadrados:

    L∑h=1

    Nh∑i=1

    (yhi − Ȳh)2

    Cuando se estratifica, en general, la variable deestratificación es una variable que presenta co-rrelación positiva elevada con la variable objetivo.Ası́, el supuesto básico es que al lograr una buenaestratificación a partir de la variable de estratifi-cación, se logrará un efecto similar en la variableobjetivo.

    3. Procedimiento de particiones sucesivas

    En forma empı́rica la minimización de la sumade cuadrados dentro de estratos se logra con el si-guiente procedimiento para hoja de cálculo, que lla-maremos de particiones sucesivas.

    • Se parte de una serie ordenada descendentede los valores de la variable de estratificación.

    • Se supone que inicialmente se tienen dos gru-pos o estratos, uno que incluye los N elemen-tos de la población y otro que incluye 0 elemen-tos.

    • Se calcula la aportación de cada uno de los dosgrupos a la suma de cuadrados, en el paso ini-cial, uno de los dos estratos incluye la sumade cuadrados total y el otro tiene contribuciónnula. Esto se logra fijando el extremo inicialdel rango de datos y dejando libre el extremofinal. La suma de cuadrados se obtiene al mul-

    tiplicar la función de varianza poblacional dela hoja de cálculo por el número de unidadesque incluye el rango.

    Nh∑i=1

    (yhi − Ȳh)2

    • Se excluyen, uno cada vez, los elementos delprimer estrato y se incluyen simultáneamenteen el segundo grupo. En el paso K el primerestrato tiene N − K elementos y el segundogrupo K elementos. El proceso continua hastaque el primer grupo tenga 0 elementos y el se-gundo tenga asociados los N elementos.

    • En cada paso se suman las aportaciones de losdos grupos a la suma de cuadrados:

    N1∑i=1

    (y1i − Ȳ1)2 +N2∑i=1

    (y2i − Ȳ2)2

    Número I 2 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    • Se observará que la suma de cuadrados dis-minuye desde los extremos hasta un punto,generalmente alejado del centro del grupo deobservaciones, en el cual la suma de cuadra-dos es mı́nima.

    • Ese punto mı́nimo será la frontera para definirdos estratos.

    El investigador puede proceder en forma similarcon el grupo que haga la mayor aportación a lasuma de cuadrados, si es que el número de ele-

    mentos no es demasiado pequeño, en cuyo caso con-vendrá censar el estrato, se tendrı́an entonces 3 es-tratos. Desde luego se puede proceder con la par-tición de los dos grupos iniciales y entonces tener 4estratos o más si se considera conveniente.

    El procedimiento es engorroso en apariencia, pues,como se mencionó, se puede lograr en forma rela-tivamente fácil con la ayuda de las funciones es-tadı́sticas para cálculo de varianzas de una hojaelectrónica de cálculo o con un programa especı́ficoque un programador capacitado puede lograr conrelativa facilidad.

    4. Ejemplo con entidades federativas

    Como ejemplo para ilustrar en forma resumida el procedimiento, se tomaron los datos de población totalpor entidad federativa reportados por el INEGI en el Censo de Población y Vivienda de 2010. Los datosde las 32 entidades, ordenados de acuerdo al número de habitantes, presentan una distribución muyasimétrica, como suelen ser en la práctica las poblaciones sometidas a muestreos (Cuadro 1 ) .

    En el mismo Cuadro 1 se puede observar la Fase 1 del procedimiento, que resultará en dos estratos.Una vez ordenados los estados de mayor a menor población, se procede a calcular las aportacionesde cada grupo a la suma de cuadrados dentro de estratos o grupos. La suma de cuadrados total es275,547,686,305,111 unidades cuadráticas. Este valor se observa en los extremos del Cuadro1. La sumade cuadrados desciende en la columna del extremo derecho del cuadro y su valor mı́nimo (99,557,894,578,660.8)lo alcanza al incluir en el primer grupo del Estado de México a Puebla. Los 27 estados restantes configu-ran entonces el segundo grupo o estrato. El primer estrato de 5 estados aporta 53,086,173,941,723.2 a lasuma de cuadrados dentro de estratos y el segundo 46,471,720,636,937.6.

    Número I 3 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Entidad Población Numeración Suma de Cuadrados Numeración Suma de Cuadrados Suma de CuadradosFederativa 2010 Ascendente Ascendente Descendente Descendente dentro de Estratos

    32 275,547,686,305,111 275,547,686,305,11115 México 15,175,862 1 - - 31 135,077,721,563,403 135,077,721,563,40309 Distrito Federal 8,851,080 2 20,001,433,673,762 30 101,305,762,146,605 121,307,195,820,36730 Veracruz 7,643,194 3 32,734,314,378,248 29 78,458,503,114,676 111,192,817,492,92414 Jalisco 7,350,682 4 40,443,285,648,923 28 56,836,403,790,295 97,279,689,439,21821 Puebla 5,779,829 5 53,086,173,941,723 27 46,471,720,636,938 99,557,894,578,66111 Guanajuato 5,486,372 6 63,141,999,336,769 26 37,218,529,926,967 100,360,529,263,73607 Chiapas 4,796,580 7 74,155,671,570,972 25 31,177,804,962,418 105,333,476,533,39019 Nuevo León 4,653,458 8 83,203,399,664,337 24 25,359,702,842,273 108,563,102,506,61016 Michoacán 4,351,037 9 91,834,554,178,158 23 20,493,991,228,658 112,328,545,406,81620 Oaxaca 3,801,962 10 101,748,364,698,492 22 17,457,667,355,517 119,206,032,054,00908 Chihuahua 3,406,465 11 112,149,801,889,991 21 15,444,700,589,111 127,594,502,479,10212 Guerrero 3,388,768 12 120,917,721,336,395 20 13,284,076,628,301 134,201,797,964,69628 Tamaulipas 3,268,554 13 128,979,252,789,567 19 11,262,000,231,805 140,241,253,021,37202 Baja California 3,155,070 14 136,476,015,945,130 18 9,351,183,172,117 145,827,199,117,24725 Sinaloa 2,767,761 15 145,020,737,576,307 17 8,221,558,405,982 153,242,295,982,28905 Coahuila 2,748,391 16 152,600,285,527,784 16 6,995,347,954,125 159,595,633,481,90913 Hidalgo 2,665,018 17 159,713,008,350,356 15 5,801,244,715,357 165,514,253,065,71426 Sonora 2,662,480 18 166,047,838,427,788 14 4,442,686,302,714 170,490,524,730,50224 San Luis Potosı́ 2,585,518 19 172,078,137,481,797 13 3,068,731,745,139 175,146,869,226,93627 Tabasco 2,238,603 20 179,195,192,527,537 12 2,249,716,074,383 181,444,908,601,92031 Yucatán 1,955,577 21 187,112,499,271,682 11 1,776,066,407,831 188,888,565,679,51322 Querétaro 1,827,937 22 194,994,727,644,628 10 1,391,617,324,368 196,386,344,968,99617 Morelos 1,777,227 23 202,460,102,342,512 9 992,159,806,980 203,452,262,149,49310 Durango 1,632,934 24 210,062,350,558,243 8 685,707,563,538 210,748,058,121,78132 Zacatecas 1,490,668 25 217,813,127,616,548 7 459,499,429,659 218,272,627,046,20723 Quintana Roo 1,325,578 26 225,859,913,000,805 6 321,952,274,987 226,181,865,275,79201 Aguascalientes 1,184,996 27 234,082,790,935,948 5 240,827,802,925 234,323,618,738,87329 Tlaxcala 1,169,936 28 241,800,268,381,877 4 130,604,714,123 241,930,873,096,00018 Nayarit 1,084,979 29 249,440,012,636,207 3 21,368,851,021 249,461,381,487,22704 Campeche 822,441 30 258,015, 605,986,527 2 91,516,921 258,015,697,503,44706 Colima 650,555 31 267,024,383,647,540 1 —- 267,024,383,647,54003 Baja California Sur 637,026 32 275,547,686,305,111 0 —- 275,547,686,305,111

    Cuadro 1: Fase I. Particiones Sucesivas dentro de Cuadrados de Estratos

    En la Fase 2 (Cuadro 2) se incluyen los 27 estados del segundo estrato original. Al repetir el procedimientose observa que la suma de cuadrados alcanza su menor valor en 14,332,259,424,246.6 y que correspondea la posición del estado de San Luis Potosı́. Si en este punto se suspende el proceso se tendrı́an 3 estratos(Figura 1). El primero con 5 elementos, el segundo con 14 y el tercero con 13 elementos. El estrato deGuanajuato a San Luis Potosı́ aporta 11,263,527,679,107.7 a la suma de cuadrados dentro de estratos yel segundo, de Tabasco a Baja California Sur aporta 3,068,731,745,138.92. Desde luego el mismo proced-imiento se seguirı́a si se requieren 4 o más estratos y se optarı́a por dividir el estrato con mayor aportacióna la suma de cuadrados.

    Número I 4 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Entidad Población Numeración Suma de Cuadrados Numeración Suma de Cuadrados Suma de CuadradosFederativa 2010 Ascendente Ascendente Descendente Descendente dentro de Estratos

    27 46,471,720,636,938 46,471,720,636,93811 Guanajuato 5,486,372 1 —- 26 37,218,529,926,967 37,218,529,926,96707 Chiapas 4,796,580 2 237,906,501,632 25 31,177,804,962,418 31,415,711,464,05019 Nuevo León 4,653,458 3 396,680,880,515 24 25,359,702,842,273 25,756,383,722,78816 Michoacán 4,351,037 4 692,248,807,465 23 20,493,991,228,658 21,186,240,036,12220 Oaxaca 3,801,962 5 1,524,405,207,505 22 17,457,667,355,517 18,982,072,563,02208 Chihuahua 3,406,465 6 2,747,347,426,940 21 15,444,700,589,111 18,192,048,016,05112 Guerrero 3,388,768 7 3,651,772,374,244 20 13,284,076,628,301 16,935,849,002,54528 Tamaulipas 3,268,554 8 4,527,963,779,524 19 11,262,000,231,805 15,789,964,011,32902 Baja California 3,155,070 9 5,397,544,452,698 18 9,351,183,172,117 14,748,727,624,81525 Sinaloa 2,767,761 10 6,841,143,453,874 17 8,221,558,405,982 15,062,701,859,85605 Coahuila 2,748,391 11 8,062,754,149,708 16 6,995,347,954,125 15,058,102,103,83313 Hidalgo 2,665,018 12 9,248,213,127,044 15 5,801,244,715,357 15,049,457,842,40126 Sonora 2,662,480 13 10,256,184,115,409 14 4,442,686,302,714 14,698,870,418,12424 San Luis Potosı́ 2,585,518 14 11,263,527,679,108 13 3,068,731,745,139 14,332,259,424,24727 Tabasco 2,238,603 15 12,875,191,082,194 12 2,249,716,074,383 15,124,907,156,57731 Yucatán 1,955,577 16 15,011,347,176,502 11 1,776,066,407,831 16,787,413,584,33322 Quertaro 1,827,937 17 17,251,533,070,924 10 1,391,617,324,368 18,643,150,395,29217 Morelos 1,777,227 18 19,384,322,195,574 9 992,159,806,980 20,376,482,002,55410 Durango 1,632,934 19 21,700,353,839,460 8 685,707,563,538 22,386,061,402,99832 Zacatecas 1,490,668 20 24,204,402,899,672 7 459,499,429,659 24,663,902,329,33123 Quintana Roo 1,325,578 21 26,980,931,250,606 6 321,952,274,987 27,302,883,525,59301 Aguascalientes 1,184,996 22 29,960,341,028,714 5 240,827,802,925 30,201,168,831,63929 Tlaxcala 1,169,936 23 32,729,474,872,388 4 130,604,714,123 32,860,079,586,51118 Nayarit 1,084,979 24 35,539,776,281,981 3 21,368,851,021 35,561,145,133,00104 Campeche 822,441 25 39,018,656,299,766 2 91,516,921 39,018,747,816,68706 Colima 650,555 26 42,862,415,903,257 1 —- 42,862,415,903,25703 Baja California Sur 637,026 27 46,471,720,636,938 0 —- 46,471,720,636,938

    Cuadro 2: Fase II. Particiones Sucesivas dentro de Cuadrados de Estratos

    Fig. 1: Estratificación de las 32 entidades, de acuerdo al número de habitantes por Particiones Sucesivas.Censo 2010

    En el Cuadro 3 de estadı́sticas básicas, se puede apreciar que el estrato que mayor aporta a la suma decuadrados dentro de estratos es el primero con 78.7%́ de la varianza. Este estrato es el que tiene menor

    Número I 5 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    número de elementos y en una asignación de muestra a estratos es posible censarlo con lo cual se logragran eficiencia. El segundo estrato con 14 elementos aporta el 16.7%́ y el tercero con 13 elementos aportael 4.6%́ de la varianza.

    Estrato Nh Media Desviación Suma de Cuadrados Porcentaje deEstándar dentro de Estratos Aportación

    1 5 8,960,129.40 3,643,012.97 53,086,173,941,723.20 78.7%2 14 3,552,673.86 930,819.64 11,263,527,679,107.70 16.7%3 13 1,369,112.08 505,695.21 3,068,731,745,138.92 4.6%

    Total 32 3,510,516.81 2,981,381.40 67,418,433,365,969.80 100%

    Cuadro 3: Estadı́sticas básicas de la Estratificación

    El primer estrato aporta el 78%́ de la varianza y ello es explicable por la gran diferencia que hay entre lapoblación de las entidades que lo integran. El Estado de México con sus más de 15 millones de habitantescasi duplica la del D.F. Si este estrato se pretendiera subdividir, quedarı́a un estrato con un solo elementoy otro con las 4 entidades restantes. En los procesos de estratificación con variables auxiliares económicaso demográficas y que presentan fuertes asimetrı́as, se conforman estratos con las unidades más grandes,usualmente pocas y en el otro extremo estratos con muchas unidades, pero más pequeñas.

    5. Análisis de la Varianza

    El análisis de la varianza de la estratificación muestra que la varianza dentro de estratos se redujo a24.5%́ y la varianza entre estratos cubre la mayor parte, 75.5%́ de la varianza. La estadı́stica F no sedebe interpretar en el contexto de prueba de hipótesis, pues por construcción los estratos son diferentes.

    Fuente de Varianza Suma de Cuadrados Porcentaje Grados de Libertad Cuadrados Medios FEntre Estratos 208,129,252,939,141.00 75.5% 2 104,064,626,469,571.00 44.7633387034598

    Dentro de Estratos 67,418,433,365,969.80 24.5% 29 2,324,773,564,343.79Total 275,547,686,305,111.00 100.0% 31

    Cuadro 4: Análisis de la Varianza de la Estratificación

    En el ejemplo se utilizó como variable de estratificación el número de habitantes, pero puede ser elnúmero de empleados en el caso de empresas, superficie de predios para encuestas agropecuarias, etc. Elefecto sobre la variable que sea objeto de la estimación será mayor a medida que haya mayor correlaciónentre ambas.

    Número I 6 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Referencias

    [1] W. G. Cochran. Técnicas de Muestreo. CECSA México, 1977.

    [2] T. Dalenius and J. L. Hodges. Minimum Variance Stratification.

    Número I 7 Marzo 2014

  • José Oscar Rosales Vergara

    Sistemas de Información Geográfica

  • Revista de Muestreo y Estadı́stica

    SISTEMAS DE INFORMACIÓN GEOGRÁFICAUNA HERRAMIENTA VALIOSA PARA EL ANÁLISIS ESTADÍSTICO

    José Oscar Rosales Vergara ∗

    “UNA IMAGEN VALE MÁS que mil palabras ”, expresión que tal vez adquiera un sentido más quepatente en esta era digital, donde las ideas y conceptos se expresan en gran medida a travésde dibujos, fotos y otros apoyos visuales. Si acompañamos una imagen con el resultado deprocesos estadı́sticos para una mejor interpretación de la realidad, tendremos entonces una herramientapoderosa que permitirá el mejor aprovechamiento de la información.

    Una herramienta que integra y analiza la infor-mación estadı́stica con la información espacial sonlos Sistemas de Información Geográfica (SIG o GISpor sus siglas en inglés). Los SIG han venido a facil-itar en gran medida el análisis de datos georrefer-enciados, en forma puntual y estadı́stica en diversosterrenos, como la demografı́a, economı́a, sociologı́a,salud pública, ecologı́a, investigación de mercados,desarrollo regional, etc.

    El inglés Roger Tomlinson es considerado el padrede los SIG al crear en la década de los años 60sel primer sistema de información geográfica com-putarizado para el gobierno de Canadá. A partirde entonces se fueron creando diferentes sistemascomo el desarrollado por el Buró del Censo de Es-tados Unidos, el Dual Independent Map Encoding(DIME). En 1969 se funda en California, EU, el En-viromental Systems Research Institute (ESRI) queen sus inicios se dedicaba a la consultorı́a del terri-torio y actualmente es una de las empresas lı́deresmundiales en el desarrollo y comercialización deprogramas especializados en SIG. Entre sus pro-ductos más conocidos se encuentran ARCGIS y AR-CVIEW.

    En 1974, se creó en México un sistema gener-ador de mapas, el Sistema Geomunicipal de Infor-mación desarrollado por Carmen Reyes Guerrero,matemática de la Facultad de Ciencias de la UNAMcuyo diseño emprendió al trabajar para el Centro deCómputo “Arturo Rosenblueth”.

    En 1984, después de recorrer un largo caminode ensayos y pruebas aparece otra herramienta es-encial para el desarrollo de proyectos geográficos:el Sistema de Posicionamiento Global (GPS por

    sus siglas en inglés) , fue diseñado originalmentecon fines militares por el Departamento de De-fensa de los Estados Unidos, actualmente es un in-strumento importante en los proyectos que involu-cran información de navegación, posicionamientoy cronometrı́a. La facilidad de su uso ası́ comola economı́a del dispositivo, cuyas versiones per-sonales para fines deportivos, de exploración, etc.Se pusieron al alcance de cualquier bolsillo. Lasplataformas de software apoyadas por GPS, per-miten que diseñar un proyecto de georreferen-ciación sea accesible para un mayor número de per-sonas y negocios sin tener que recurrir a empresasespecializadas.

    Actualmente se puede acceder a Sistemas de In-formación Geográfica que comercializan empresasespecializadas en este tipo de software, entre lasmás importantes, como se ha mencionado antes,se encuentra ESRI con su producto estelar ArcGisque quizá sea el programa SIG privado más usado,MapInfo es otro de los sistemas comerciales quemás se utilizan para la creación de mapas, IDRISISelva cuenta además con una aplicación para elanálisis visual de series de tiempo; etc. Otra opcióndisponible es acceder de manera directa en los sitiosde internet de los institutos y ministerios de es-tadı́stica y geografı́a que cuentan con sus propiossistemas diseñados ad hoc; o bien se dispone de pro-gramas de libre acceso como gvSIG ,GRASS, entreotros con los que se pueden crear proyectos una vezque se cuenta con los datos necesarios. Además decontar con otros programas que se pueden descar-gar en lı́nea, también se tiene el apoyo de las difer-entes páginas especializadas sobre el tema de losSIG ası́ como numerosos blogs con foros sobre tru-cos, consejos y temas particulares de este tipo desistemas.

    ∗Analista de Estadı́stica en Investigación y Desarrollo en Matemáticas Aplicadas, PRAGMA S.A. de C.V.

    Número I 1 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    En México la entidad encargada de generar la información es-

    Fig. 1: SIG del INEGI

    tadı́stica y geográfica del territorio nacional es el Instituto Na-cional de Estadı́stica, Geografı́a e Informática (INEGI) que cuentacon su propio programa SIG, el Mapa Digital de México.

    Este programa se encuentra disponible en la página web del IN-EGI y es de libre acceso; a la fecha cuenta con dos versiones: ElMapa Digital de México versión 5 y la versión 6 que está en unafase preliminar. Ambas versiones se pueden consultar directa-mente en lı́nea o bien, pueden descargarse las versiones de es-critorio.

    El sistema cuenta con una gran variedad de datos SIG disponibles,se pueden consultar 168 capas que contienen información espa-cial sobre cartografı́a urbana (carreteras, localidades, municipios,etc.), recursos naturales, clima, etc. además de la informaciónsobre censos, encuestas y proyectos que el INEGI realiza regular-mente. Dicha información están al alcance de todos para elabo-rar procesos que facilitan el análisis e interpretación de la infor-mación; en particular se tiene la herramienta del mapa temático,elemento visual muy valioso en el quehacer estadı́stico y en muchasotras áreas.

    Los mapas temáticos representan cualquier fenómeno geográficode la superficie terrestre el cual también contiene la informaciónde la localidad. Persiguen objetivos bien definidos. Hacen referen-cia a la representación de ciertas caracterı́sticas de distribución,relación, densidad o regionalización de objetos reales (vegetación,suelos, geologı́a, etc.) o de conceptos abstractos (indicadores deviolencia, de desarrollo económico, de calidad de vida, etc.) Pararepresentar variables numéricas utilizan todo tipo de recursos visuales, como superficies de distintos col-ores o tramas, cı́rculos o sı́mbolos de tamaño proporcional al valor numérico.

    Para poder hacer un mapa temático se pueden utilizar los programas de edición de dibujo que en generalson sencillos de usar si es que el mapa no precisa de una gran variedad de detalles.

    Para ejemplificar usaremos el editor de imágenes Paint y la información disponible en la página web delINEGI en el apartado del Censo de Población y Vivienda 2010. Los datos que se analizan corresponden ala población del Distrito Federal por delegaciones.

    Número I 2 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Clave Delegación Población02 Azcapotzalco 414,71103 Coyoacán 620,41604 Cuajimalpa de Morelos 186,39105 Gustavo A. Madero 1,185,77206 Iztacalco 384,32607 Iztapalapa 1,815,78608 La Magdalena Contreras 239,08609 Milpa Alta 130,58210 Alvaro Obregón 727,03411 Tláhuac 360,26512 Tlalpan 650,56713 Xochimilco 415,00714 Benito Juárez 385,43915 Cuauhtémoc 531,83116 Miguel Hidalgo 372,88917 Venustiano Carranza 430,978

    Distrito Federal 8,851,080

    Cuadro 1: Distribución de la Población del Distrito Federal por delegaciones. INEGI Censo de Poblacióny Vivenda 2010

    El Distrito Federal tiene 16 delegaciones polı́ticas con 8,851,080 habitantes reportados en el Censo de2010. Para este ejemplo se divide a la población en 4 estratos, el mapa temático de la población que resultase presenta a continuación.

    Fig. 2: Distribución de la Población del Distrito Federal por delegaciones. INEGI 2010

    Número I 3 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    El mapa 2 presenta en forma clara la caracterı́stica que se pretende mostrar: la población del DistritoFederal con 4 estratos previamente definidos. Al tener solamente 16 delegaciones y 4 estratos, la creaciónde este mapa puede considerarse sencillo y sin la mayor dificultad.

    Si por el contrario necesitamos representar información con más detalle, el usar un editor de dibujo esfactible, pero suele ser bastante complejo. Usaremos el Sistema de Mapas Digital de México 1 para hacerun mapa temático con un mayor grado de desagregación.

    La información geográfica del Distrito Federal ası́ como del resto del paı́s se encuentra disponible en lapágina web del INEGI, los datos se presentan mediante archivos de tipo SHAPE que se cuentan entre losformatos más usados por los programas SIG. Los archivos SHAPE son archivos vectoriales, compuestospor entidades de tipo punto, lı́nea y área. Un archivo con este formato se compone a su vez de tres archivoscon extensión .shx .shp y .dbf en los cuales se almacena información geométrica y alfanumérica de modoque a partir de la información vectorial contenida se generan las capas de información.

    Utilizando el sistema de Mapas 1 se pueden hacer mapas tan básicos como el ejemplo anterior 2 hastarealizar mapas con un mayor nivel de desagregación y complejidad. Se tiene la opción de elegir entre 7métodos de estratificación (Dalenius-Hodges, Intervalos iguales, Número de elementos iguales, Cuantiles,Cuantiles relativos, Valor único y Personalizado) ası́ como guardar el resultado de la estratificación endiferentes formatos.

    El Sistema de Mapas también permite realizar cálculos y mediciones con los datos utilizados, importar yexportar tablas, hacer diferentes tipos de gráficos, utilizar las herramientas de estratificación multivari-ada entre otras aplicaciones.

    Siguiendo con el ejemplo de la población del Distrito Federal, se graficará la población pero está veza nivel de área Geoestadı́stica Básica (AGEB) que es la unidad básica del Marco Geoestadı́stico Na-cional, por delegación, utilizando el Sistema Digital de Mapas 1 ; la representación del mapa temáticode población es la siguiente:

    Número I 4 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Fig. 3: Distribución de la Población del Distrito Federal por AGEB. INEGI 2010

    Es notable la complejidad de este mapa pues ya no son solamente 16 delegaciones sino 2,432 AGEBscon las que se tiene que trabajar identificando la unidad, seleccionar el estrato correspondiente según supoblación e iluminar con el color respectivo; en otras palabras, es prácticamente impensable hacer estalabor utilizando únicamente un editor básico de dibujo.

    Número I 5 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Otra de las aplicaciones que se pueden hacer con el sistema 1 es trabajar solamente con aquellos ele-mentos que tengan una caracterı́stica en particular. Por ejemplo, nos interesa ubicar aquellas AGEBs quetengan más de 10,000 habitantes en el Distrito Federal.

    Esta selección y extracción de capas se puede hacer mediante las herramientas contenidas en el apartadode Análisis Espacial, que contiene 11 opciones de tratamiento para las capas de información vectorial.

    Fig. 4: AGEBs de más de 10 mil hab. en el Distrito Federal. INEGI 2010

    Número I 6 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Sistema de Mapas Digital y Google Earth

    Una herramienta muy útil del Sistema de Mapas Digital es la exportación de los archivos .shp a archivoskml. Los archivos kml contienen información de un lugar (coordenadas geográficas), una imagen o unpolı́gono para Google Earth.

    Una vez que tenemos una capa con las propiedades que hayamos definido se hace la exportación a unarchivo KML para después abrirlo en Google Earth, el mapa temático con las AGEB con más de 10,000habitantes se verá ası́:

    Fig. 5: Distrito Federal desde Google Earth

    Con algunos acercamientos se puede observar las caracterı́sticas fı́sicas de los AGEBs para corroborarque efectivamente corresponden a una unidad con elevada población.

    La delegación Iztapalapa tiene mayor población del Distrito Federal y cuenta con 5 AGEBs con más dediez mil habitantes, la siguiente imagen es un acercamiento a esta delegación.

    Número I 7 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Fig. 6: Delegación Izatapalapa desde Google Earth

    El siguiente acercamiento nos muestra la gran densidad de casas y algunas unidades habitacionalesdonde viven los 11,528 habitantes de este AGEB.

    Fig. 7: Delegación Izatapalapa, acercamiento desde Google Earth

    Esta facilidad de poder visualizar estados, municipios, AGEB o cualquier otra unidad geográfica pormedio del Sistema de Mapas y luego poder identificar estas mismas unidades en Google Earth es unavaliosa herramienta que permite no sólo crear mapas temáticos sino poder verificar la interpretación deéstos.

    Número I 8 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    El Sistema de Mapas Digital no se restringe a los datos provenientes del INEGI o de México en particular,sino que, al ser un sistema SIG puede ser utilizado para proyectos de otros paı́ses que cuenten con losarchivos de información necesarios. Tal es el caso de Estados Unidos que en la página del Buró del Censo(The Census Bureau) se pueden encontrar los archivos SHAPE de su geografı́a y de muchos otros temas.

    El siguiente mapa del Sistema Digital corresponde al condado de Los Angeles en el estado de Californiaa nivel de Census Tract. El Census Tract es el equivalente al AGEB que maneja INEGI, aunque no essu mı́nima subdivisión geoestadı́stica, ya que le siguen el Block Group y el Block cómo última unidad depresentación geográfica.

    El área señalada corresponde al Census Tract donde se encuentra el famoso letrero de Hollywood enel Parque Griffith, mismo que se puede ver mediante Google Earth luego de hacer el procedimiento deexportación a archivos de formato kml.

    (a) Los Ángeles SIG INEGI (b) Los Ángeles - Google Earth

    (c) Hollywood (d) Parque Griffith

    Fig. 8: SIG INEGI - Google Earth

    Número I 9 Marzo 2014

  • Revista de Muestreo y Estadı́stica

    Los recursos que nos brindan tanto el Sistema de Mapas del INEGI como el Google Earth son un ex-celente apoyo técnico ya que son programas que nos auxilian en el análisis e integración de informacióngeográfica y estadı́stica para diferentes proyectos como estudios de mercado, planificación urbana, cercossanitarios, estudios sobre el medio ambiente y recursos naturales, transporte, detección de focos y zonasde alto riesgo naturales y un largo etc. Los resultados que se obtienen con estas herramientas son de granutilidad no sólo para conocer con más detalle y precisión las caracterı́sticas geográficas y estadı́sticas dedeterminado territorio, sino para tener un valioso apoyo sustentado en elementos técnicos a la hora de latoma de decisiones.

    Referencias

    [1] http://es.wikipedia.org/wiki/Wikipedia:Portada.

    [2] http://www.edusig.com.ar/contenido/software sig.

    [3] http://www.gps.gov/systems/gps/spanish.php.

    [4] http://www.software shop.com/in.php?mod=ver producto&prdID=149.

    [5] http://www.todosig.es/programas sig.html.

    [6] www.census.gov.

    [7] www.inegi.org.mx.

    Número I 10 Marzo 2014

    ContenidoDirectorioPresentaciónPluralidad y Diversidad Política basado en el Índice de ShannonAplicación de las Distribuciones Poisson y Binomial Negativa para modelar la distribución de manadas de elefantesEstratificación por Particiones SucesivasSistemas de Información Geográfica