1^/i u estreo e o a .c^.ones ilnitas

10
1^/i estreo e a . . . u o c^.ones ilnitas p Por FRANCISCO AZORfN' POCH Estadístico Facultativo 1. Introduccibn. Tenemos el propósito de que en esta Revista, y a partir de1 presente nú:m,ero, se publiquen articulos relativos a diversos aspectos del muestreo de poblaciones finitas. En i95o publicó el Instituto Nacional de Estadfstica las excelentes "Conferencias sobre IVfuestreo Estadfstico", de nuestro compañero Enrique Cansado, que se agotaron rápidaxnente. Aparecieron años más tárde las traduc- ciones al español del libro de Deming: "Sorne Theory of Sampling", en Argentina, y del libro de Sukhatme: "Sampling Theory of Surveys with Applications", en Mójico. Hay que reconocer la utilidad de disponer de tales obras en nuestro idioma, a pesar de ciertas reservas en cuanto a la traducción de varios t^rminos y giros; pero para conseguir un conocimiento operante de la Teoría y Métodos de1 Muestreo habrá que recurrir, en general, a otros textos, como el Cochran: "Sampling Techniques" y el Hansen, Hurwitz, NYadow, "Sample Survey 1VYethods and Theory", asf como los trabajos que continúan publicándose en las revistas especializadas. Aspiramos a que esta serie de artf culos proporcione a sus lec- tores una base que 1es facilite el estud,io y comprensión de talés publicaciones y obras. A este fin, procuraremos utilizar una notación que se aproxime en lo posible a la más corriente en estas materias. Recordarénlos una vez más, que se da el nombre de Muesíreo a la obtención de una o más partes (muestras} que suponemos representativas de un conjunto de elementos (población o universo). Direm,os que es muestreo ^robabilístico si puede establecerse de antemano cuál es la probabilidad de cada una de las muestras que pueden obtenerse con el pro- cedimiento establecido. Para esto es necesario que en la selección exista una cierta propiedad o carácter que denominamos aleatorio o de azar. La aleato- riedad no es un carácter que corresponda, hablando estrictamente, a una mues- tra dada, sino a todo el proceso de muestreo. Es la propiedad que permite que la composición de la muestra no dep enda de las preferencias o tendencias más o menos explicitas del individuo que la obtiene, sino de factores objetivos que pueden tenerse en cuenta de modo riguroso. Antes de proceder a la obtención de una o más muestras hay que establecer el diseño, esto es, el esquema lógico-matemático más adecuado, en vista de los elernentos siguientes: a) Los obj etivos de la investiga ĉ ión estadfstica de que se trate. b) Las circunstancias en que será necesario desenvolverse: medio ambiente, recursos, obstáculos, etc. Suele decirse que lo que se busca es el diseño más e f iciente en cada caso, esto es, el que proporciona la mayor información posible por unidad monetaria. C^ dicho de otro modo, el que proporcione máxixna precisión para un coste dado

Upload: others

Post on 27-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1^/i u estreo e o a .c^.ones ilnitas

1^/i estreo e a . . .u o c^.ones ilnitaspPor FRANCISCO AZORfN' POCH

Estadístico Facultativo

1. Introduccibn.

Tenemos el propósito de que en esta Revista, y a partir de1 presente nú:m,ero,se publiquen articulos relativos a diversos aspectos del muestreo de poblacionesfinitas. En i95o publicó el Instituto Nacional de Estadfstica las excelentes"Conferencias sobre IVfuestreo Estadfstico", de nuestro compañero EnriqueCansado, que se agotaron rápidaxnente. Aparecieron años más tárde las traduc-ciones al español del libro de Deming: "Sorne Theory of Sampling", en Argentina,y del libro de Sukhatme: "Sampling Theory of Surveys with Applications",en Mójico. Hay que reconocer la utilidad de disponer de tales obras en nuestroidioma, a pesar de ciertas reservas en cuanto a la traducción de varios t^rminosy giros; pero para conseguir un conocimiento operante de la Teoría y Métodosde1 Muestreo habrá que recurrir, en general, a otros textos, como el Cochran:"Sampling Techniques" y el Hansen, Hurwitz, NYadow, "Sample Survey 1VYethodsand Theory", asf como los trabajos que continúan publicándose en las revistasespecializadas. Aspiramos a que esta serie de artf culos proporcione a sus lec-tores una base que 1es facilite el estud,io y comprensión de talés publicacionesy obras. A este fin, procuraremos utilizar una notación que se aproxime en loposible a la más corriente en estas materias. Recordarénlos una vez más, quese da el nombre de Muesíreo a la obtención de una o más partes (muestras} quesuponemos representativas de un conjunto de elementos (población o universo).Direm,os que es muestreo ^robabilístico si puede establecerse de antemano cuáles la probabilidad de cada una de las muestras que pueden obtenerse con el pro-cedimiento establecido. Para esto es necesario que en la selección exista unacierta propiedad o carácter que denominamos aleatorio o de azar. La aleato-riedad no es un carácter que corresponda, hablando estrictamente, a una mues-tra dada, sino a todo el proceso de muestreo. Es la propiedad que permite que lacomposición de la muestra no dep ►enda de las preferencias o tendencias más omenos explicitas del individuo que la obtiene, sino de factores objetivos quepueden tenerse en cuenta de modo riguroso.

Antes de proceder a la obtención de una o más muestras hay que establecerel diseño, esto es, el esquema lógico-matemático más adecuado, en vista de loselernentos siguientes:

a) Los obj etivos de la investigaĉión estadfstica de que se trate.b) Las circunstancias en que será necesario desenvolverse: medio ambiente,

recursos, obstáculos, etc.

Suele decirse que lo que se busca es el diseño más e f iciente en cada caso,esto es, el que proporciona la mayor información posible por unidad monetaria.C^ dicho de otro modo, el que proporcione máxixna precisión para un coste dado

Page 2: 1^/i u estreo e o a .c^.ones ilnitas

MUESTREO DE POBLACIONES FINITAS ,r,^3

o mf nimo coste para una precisión dada. Claro que esto exige un previo acuerdosobre la medición de los das f actores mencionados.

En realidad, lo anteriormente dicho constituye una simplificación excesiva.Muchas otras variables habrán de tenerse en cuenta, pero será conveniente suclasificación en das grandes grupos, el primero de 1os cuales correspondería aun concepto arnpliado del coste (recursos utilizados, no solamente monetarios,sino de tiempo, esfuer^o, etc.). Y el segundo, al concepto d.e inforxnación (valo-ración del producta abtenido).

No siexnpre resulta sencillo el establecimiento de un disefío satisfactorio, ymenos óptimo. Por e11o trataremos a continuación de las razones que hacenrecomendable en situaciones muy variadas el en^pleo de muestras probabiif sticas.

2. Justi^icaclón dc la^ insiatencia en deatacar lae ventajas del muestreo.

Se han repetido tantas veces las ventaj as del muestreo en publicacionesdiversas, entre ellas las mencionadas al comienzo de este articulo, que pareceríaimprocedente insistir una vez más sobre las mismas. Sin embargo, continúanlas obj eciones al rnuestreo y las expresiones de recelo y desconfianza en su uti-lídad, no ya por personas aj enas a nuestras actividades, sino por estadísticoscon larga hlstoria de servicios y rnóritos. A estas irán dirigidas especialmentelas siguientes líneas.

En primer lugar, claro es que todos estamos de acuerdo sobre das casos ex-tremos en que conviene utili^ar muestras:

i.° Cuando la población de procedencia es suficientemente uniforme, yaque en este caso cualquier muestra nos da una buena representación del conjuntooriginario.

2.° Cuando la investigación es destructiva, como ocurre cuando hay queconsumir un artículo para j uzgar sobre su calidad o determinar una dvsisletal o un punto de rotura; en general, siempre que haya que someter a1 elementoestudiado a operaciones que anulen su utilidad en sucesivas ocasiones.

Aparte de estos casos extremos, existen dos ventajas que corresponden atoda muestra cuya representatividad procuramos, aunque no sea probabilística.Estas ventaĵ as son:

z) Eeonnmía. Evidentemente si en veZ de exarninar todos los elementos de lapoblación examinamos sólo unos cuantos, el coste será inferior. Esto nos permiteefectuar investigaciones que serfan imposibles o poco prácticas si hubieran dereferirse a la poblacián completa.

En sentido amplio podríamos incluir en esta ventaj a la posibilidad de unamayor rapidez en la obtención de los resultados. Asi, dada una cierta cantidaddisponible, será posible obtener mediante muestras una información más fre-cuente y más detallada sobre cada elemento, aunque sea xnenos extensa. Estaventaj a enlaza con la de

2) O^oytunidad. De ésta nos ocuparemos al tratar de Censos y Muestrasen la Sección 4 de este artf culo.

3) Calidad. Tratándose de una muestra, es posible cuidar más la preparacióndel estudic^ o medida correspondiente a cada elemento por el mej or entrena-

Page 3: 1^/i u estreo e o a .c^.ones ilnitas

44i nr

ESTADISTICA ESPANOLA

miento del personal, uso de los mej ores instrumentos y mayor intensidad en lasupervisión y controles.

Y puesto que venimos hablando de ventaj as, ^ no sería ya oportuno citar cuáles el mayor inconveniente del muestreo? Este es sin duda importantísimo. Nadamenos que obligarnos a j uzgar el todo por una de sus partes. En esto estribaprecisaxnente todo el problema de la inferencia o inducción incompleta, base delas ciencias d.e la Naturaleza.

,^ Pueden Ias dos ventaj as antes se^f aladas, de economia y calidad, compensarel riesgo que supone basar en muestras nuestro conocimiento de la población?^laro es que no puede contestarse categóricamente a esta pregunta. Habrácasos en que tal riesgo quede compensado, y casos en que no ocurra así. Ca^osen que será aconsej able tomar muestras y casos en que convendrá m,ás examinartodos los elexnentos de la población. Aqui entra en j uego e1 concepto de muestreoprobabilístico. En primer lugar, por tratarse de un procedimiento objetivo, evitaque de rr^odo inadvertido, insidioso o al menos imposible de evaluar, se intro-duzcan en el método de obtención factores que lo vicien o inclinen de tal maneraque ciertos elementos de la poblacidn se vean preferidos mientras que otrosresulten postergados.

Pero, sobre tcido, 1a gran ventaja del muestreo probabilístico es ser el únicoque permite el conocixniento de la variabilidad en el muestreo. Solarnente enel caso de rnuestras probabilfsticas es posible que cualquier número de especia-listas estadisticos que analicen sus resultados lleguen a conclusiones análogas.Sobre todo, sola^rnente en este caso es p ►osible expresar de modo obj etivo cuál esla confianza que puede ponerse en las conclusiones obtenidas. Esto es, con talesmétodos puede expresarse nurnéricamente la precisión de las estim,aciones, laestabilidad de 1a estimación de una cierta caracteristica poblacional en todaslas muestras posibles, mediante afirmaciones como, por ejemplo, la s^guiente:"La proporción de articulo$ defectuosos en esta remesa está comprendida entreel 23 y el 27 por ^oo, con un grado de seguridad en esta afirmación de o,gosobre i." Esto quiere decir que con el procedimiento de muestreo probabilísticoque se haya diseñado obtendríamos un intervalo (en nuestro caso particular,o, 23 a o, 2^) que cubriria, de ^ o veces, g eI valor verdadero o poblacional de la pro-porción de artículos defectuosos en la remesa estudiada a partir de una muestraprobabilística. A este interv^.lo es al que se le conoce con el nombre de intervalocanfidencial o intervalo de confianza.

3. Tipoa de muestreo y sug limitaciones.

Obsérvese que afirmaciones como la anterior no son posibles en las llamadasmuestras circunstanciales, de cornodidad o trozos, que son las obtenidas "decualquier manera" sin suj etarse a norma alguna que garantice la aleatoriedad.

Naturalmente, tampoco es posible tal tipo de afirmacián en las muestras^ntencionales u"opináticas", que se eligen como típicas o representativas,según e1 juicio del que las selecciona, o bien a su arbitrio, aunque sea dentro deciertas normas. Así ocurre, por ej emplo, en el 1lamado muestreo ^ior cuotas, enque el agente enumerador ha de recoger información de un cierto número depersonas o f amilias que curnplan determinadas condiciones. Por ej emplo, z 2

Page 4: 1^/i u estreo e o a .c^.ones ilnitas

MUESTREO DE POEtLACIONES FINITAS 45

mujeres cualesquiera, con tal que tengan una edad comprendida entre los 35 Ylos 40, sean de clase media acomodada y habiten determinado barrio.

Vamos a recordar cuáles son las limitaciones del muestreo, aun siendo pro-babilístico y aparte del riesgo que lleva consigo toda muestra, al que ya noshem.as referido anteriormente.

Una limitación seria se presenta en el usa de muestras cuanda se necesiteinformacidn relativa a todas las elementos o a grupos o a áreas rnuy pequeñasde la población. A la falta de precisión en 1os resultados, que p ►uede afectar gra-vemente a las cansecuencias basadas en las estimaciones, se une un grave in-conveniente psicológica. Asf, por ej emplo, a1 publicar resultados que se basenen muestras, relativos al número total de carpinterias de una localidad de pocoshabitantes, puede ocurrir que la comprobacidn de la diferencia entre el númeroestimado y el efectiva origine una desconfian2a en el público y en general enpersonas carentes de preparacián estadf stica adecuada, sobre los demás resul-tados de la muestra. Claro es que esta desconfianza puede ser injustificada encuanto a las estimaciones correspondientes a zonas rnás amplias, pero no porello es menos canveniente tenerla en cuenta.

Otra limitación es 1a dificultad que siempre supone el empleo de un instru-mento delicado y compleĵ o. E1 muestreo exige en comparación con la realizaciónde censas y estudios exhaustivos, rnenos cantidad de trabaj o bruto, pero mayar re-finamiento y preparación. No solamente exige cierta base estadfstico-matemáticaen los dise^iadores, y a ser posible una buena experiencia de trabaj o sobre el terre-no, sino también un buen entrenamiento de los agentes, inspectores y supervisores.

Conviene advertir, además, que habrá casos en que será más canvenienterealizar un muestreo no probabilf stico, sino intencional o la simple obtenciánde un trozo de la población o agregado en estudio.

Deming, en el Capftulo I de su ya mencionada obra, incluye un ej ercicxorelativo a la selección de una sola provincia o comarca camo representaciánde un pafs completo para estudios económicos o sociales. En tal caso sería pre-ferible efectuar un muestrea intencional para no exponerse a obtener una mues-tra muy poco representativa. En general, al crecer el tam.año de la muestra onúrnero de elernentas incluídos en ella, la precisián de1 muestreo intencionalpermanece m^is o menos constante, mientras que aumenta la del muestreoprobabilfstico. For eso en el caso de muestras muy ^iequeñas puede ser másconveniente el primero aunque na dé idea de la fiabilidad o confianza que po-damos atribuir a sus resultados. Hendricks, en "The Nlathematical Theory ofSampling", Capftulo I, representa gráficamente cámo aumenta la precisión (odisminuye el error) en forma de rama hiperbólica descendente, con asfntotahorizontal, para el rnuestreo probabilistico, mientras que en el correspondienteintencional puede representarse por una paralela al eje de abscisas. La inter-sección de esta recta can la anterior rama hiperbólica indicarfa en cada casocuándo es indiferente emplear uno u otro tipo de muestreo.

Lo anteriormente dicho pone de manifiesto que afirmar que el muestreoprobabilf stico tiene poco interés porque es inaplicable en cieytos casos o porqueen otros serfa preferible efectuar un censo, carece de sentido. Nadie pretendeque un instrumento técnico o matemático sea de uso universal. Pero sf es ne-cesario conocer las posibilidades del mismo antes de j uzgar sobre la convenien-cia de su aplicación.

Page 5: 1^/i u estreo e o a .c^.ones ilnitas

^STADÍSTICA ESYAÑOL.^

Por ej emplo, una obj ecián corriente consiste en poner de relieve que lasconsecuencias serf an muy distintas según las unidades que f ormasen parte dela muestra en el caso de tratarse de una población de unidades muy ^diferentesentre sí. Es evidente que al tomar una muestra de capitales españolas el resul-tado serfa muy distinto según que Nradrid y Barcelona quedaran fuera o dentrode la xr^uestra.

Se olvida al hacer ^sta y aná,logas obj eciones que existen muy diierentestipos de muestxeo. Quien se limite a leer las primeras páginas de algunos de la ►stextos anteriores pudiera creer que no exi.ste otro métoda que el muestreoaleatorio simple sin ree^nplazamiento, también llamado muestreo irrestricta-mente aleatc^rio, en el que todos los elernentos que constituyen la poblaciónen estudio tienen, a^irzori, la misma prababilidad de ser seleccionados. Sin em.-bargo, el principal interés de este tipa de muestreo es el de constituir la baseteórica para el desarrollo de los demás. Pocas veces puede utilizarse directamenteen la práctica. Es casi seguro que al menos será conveniente establecer una previa^división en estratos constituf dos por elementos parecidos entre sf en lo posibleo con alguna caracterfstica común. Asf, en el caso antes citado de las capitalesespañolas serfa obvio que la inclusidn de Madrid y Barcelona en un estratodistinto del que comprendiera, por ejemplo a Avila, Soria y Teruel podrfa con-tribuir sustancialrnente a mejorar la representatividad de la muestra.

tTn artfculo publicado en e1 número 278, Vol. ^2, con fecha junio z957, en"Journal of the American Statistical Association", constituye una buena in-troducción, escrita en forma amena e informativa, sobre los diferentes métodosde rnuestreo. El titulo de dicho artfculo es "Sampling in a Nutshell" (el muestreoen una cáscara de nuez); su autor es Morris James Slonim. E1 artículo pone dernanifiesto que la ignorancia sobre las p^,sibilidades de estas técnicas se extiendea naciones como los EE. UU., actualmente a la cabeza en métodos de muestreoy de recoleccidn estadf stica. A los que carezcan de tiernpo para leer u hoj earlos textos antes mencionados les recomendamos el anterior trabajo, y sus brevescapftulos sobre rnuestreo estratificado, muestreo por conglomeradas (muestreopor ^,reas, por etapas), muestrea sistemático, muestreo doble, muestreo suce-sianal, etc., asf como lo relativo a los procedimientos de estimación: directos,de la razón, de dif erencias y de regresidn lineal.

4. Mues^tras y Censoa.

Otra expresión de desconfianza en la teoría y técnicas del muestreo es larecomendación de dedicar una parte xnás o rnenos sustancial del presupuestodisponible para la realización de muestras, a 1a llamada "validacidn". Sobretodo cuando consiste la validación en efectuar censos parciales, por ejemplo,relativos a una sola comarca de las cornprendidas en 1a muestra o que abarquenmenor núrnero de preguntas o mediciones, a fin de comparar los resultados decenso y muestra y declarar esta últirna "válida" o"inválida", según que hayao no acuerdo entre sus resultados y 1os censales. En primer lugar, aun cuandola proporción que en la muestra corresponda a dxferentes categorf as o clasescoincida con la población, tal coincidencia no evidencia que la muestra searepresentativa para otras caracterfsticas. Hemos citado tales proporciones

Page 6: 1^/i u estreo e o a .c^.ones ilnitas

IvIUI^S^R^:U ]^^ ^'('lI3LACIt)NE5 Ii INITAS

porque el procedimiento de validación más corriente consistiría no en realizar,como antes hemos dicho, un nuevo censo parcial, sino en valernos de censosanteriores y ver qué ocurre con la distribución por edades, por sexos, etc., enla poblacidn y en la rnuestra. Todavía en este últirno caso p ►odría j ustificarseel procedimiento, ya que nos permitirf a desechar muestras rnuy poco represen-tativas; pero, aun así, tal práctica se presta a consecuencias perj udiciales. Aladmitir que si los resultados de una muestra inicial parecen inaceptables, seprocederá a seleccionar una nueva n^uestra en la esperanza de obtener "mej oresresultados"; ta1 rnétodo podría llevarnos a conseguir cualquier valor que deseára-mos o esperásemos de antemano. destruyendo el carácter prabábilfstico al intro-ducir un elemento tendencioso o sesgado, que serf a el prej uicio u opinión delinvestigador.

E1 mismo ef ecto psicológico de la validación puede conseguirse por un proce-dimiento más ortodoxo: el de 1as submuestras reiteradas inter^benetrantes. Con-sisten éstas en la obtención, no de una muestra única, sino de una serie de sub-muestras indépendientes que perrniten "medir" el grado de acuerdo de los re-sultados de las mismas. Qtra de sus ventaj as es que la primera de estas sub-muestras puede proporcionar rápidamente una primera estimación, aunqueluego ésta quede perfeccionada o corregida cuando se disponga de 1a muestratotal a conj unto de tales submuesfiras.

Ya nos referimos a la ventaja de la rapidez, que incluírnos en la de econamfa,al hablar de la conveniencia del rnuestreo. Pero adernás de la economía en eltiempo necesario para la realización de los trabaj os de campo y de los cálculossubsiguientes, conviene destacar la de la oportunidad. Puede muy bien ocurrirque una información censal prolija y detallada pero relativa a lo que ocurrióhace meses o años, sea mucho menos interesante que la obtenida a partir deuna muestra reciente. El rápido desarrollo de las técnicas y el carácter dinámicode las sociedades modernas hacen que, tanto la administración pública comolas grandes empresas, y en consecuencia todas las actividades productivas dela nación, estén pendientes en sus decisiones y planeamientos del conocim.ientode la situación al rnes o al día. Lo que haya que hacer depende no tanto de loque ocurrió el año pasado como de disponer de información actual, y a ser posiblecontinuada. E11o obliga a arrostrar el riesgo de los errores de rnuestreo, Por otraparte, debe tenerse en cuenta que tampoco un censo está exento de riesgos. Y"ahablamos, al referirnos a las ventaj as del muestreo, de la posibilidad de obtenerdatos de mej or calidad por la mayor preparación de los agentes y mej ores mé-todos de medida y supervisión. Tanto es así, que se ha Ilegado a la situacián, aprimera vista: paradójica, de la validacián del censo a partir de las muestras. Enun articulo de Marks, Mauldin y Nisselson, titulado "The Post EnumerationSurvey of the ^95o Census", publicado en el Vol. 48, núm. 262 de " Journal ofAmerican Statistical Association", puede verse un estudio interesante sobre 1aaplicación de los resultados de una muestra a la investigación de la calidad yextensidn (omisiones, duplicaciones, etc.) de los datos del censo.

Pero no se trata de polemiZar o de dividir a los estadísticos en amigos delcenso y partidarios de las muestras, como seria absurdo declararse enernigo delcálculo matricial o de 1as máquinas sumadoras. Lo irnportante es reconocer quemucha inf ormacián estadística necesaria en nuestro país todavía no existe, osi existe es incompleta o anticuada. Se trata, pues, de integrar muestras y censos

Page 7: 1^/i u estreo e o a .c^.ones ilnitas

4g ESTAI^ÍSTICA ESPAIYOLA

en un sistema estadístico caordinado, de modo que cada muestra no constituyauna operacián espor^.dica y desconectada, para la que solamente se tengan encuenta las circunstancias de cada ocasidn particular. Lo aconsej abl.e es conside-rar la accián rnutua seg^ún l.a cual los resultados de un censo pueden^ constituirla base que haga posible un diseño muestral mas eficiente, mientras que lasmuestras completan y extienden, a la vez que panen al día, la inforna^acián queno seria posible conseguir mediante la m^,s costosa Qperácidn d,e un censo.

^►. ^`a^e^ de u^na eabrevlielór^ par mue^treo.

^arnos a examinar a continuacidn las diversas fases de una sobrevisión pormuestreo. Es ya clasica la divisián propuesta por la Uficina de Estadf stica de lasNaciones Unidas, publicada en la "Preparación de informes sabre encuestasp►or 1Vluestreo", Publicaciones estadísticas, serie C, núm. i. E1 ya mencionadotexto de Deming y al^unas reuniones y Seminarios, corno el celebrado en ^g^2en Estocolmo, por la F. A. O. y pv►r la C?ficina Central de Estadística de Suecia,han propuesto tarnbi^n clasificaciones y diversas fases o etapas necesarias en unaoperación de muestreo.

A partxr . de las anteriores f uentes y de las experiencias recogidas de maneradirecta, CreenloS que pue+de ser conveniente la consideracián de las siguientesfases:

.z.^ f ase. .Indicacidn de ^os f ines del est^dio.

No se trata sim,plemente de efectuar una declaracidn vaga de estos fines,sino de establecerlos de moda muy concreto, En esta fase va incluida l^, d^fini-ción de la poblacidn que constituiría el objetivo ideal y de la poblacián a mues-trear efectivamente, si es que ambas no coinciden. Es muy ^interesante expresarno salamante cu^.l es la informacián que se desea obtener, sino tambián el m,otivode nuestros deseos y la forrr^a en que van a utilizarse los resultados, asi como elmado en que habr^,n de in#luir en posteriores decisiones. Es conveniente efectuarpor escrito la especificacián previa, no sólo de los objetivos antes mencionados,sino también de las caracteristicas a estimar, las tabulaciones y los grados deconfianza y de precisión que se consideren adecuados. A1 establecer la coberturao abarcamiento que corresponde a la definicián de los fines de nuestro estudiohabr^, que justificar, en caso de eliminacidn de p►artes de la poblacidn ideal, en quánas fundarnas para considerar conveniente prescindir de las mismas. En talescasos, al p ►racticar tal "poda" o"desmoche" ^eut-o f f j, deberá tenerse presenteque en tod,o caso los resultados de la muestra sálo se refieren estrictamente a lapoblacián considerada de modo efectivo.

2.a f ase.w-^-Condicianes, recursos y limitacior^es.

Despues de un exam.en detenida de tod^a la informacidn disponible, a finde evitar dup.licaciones, y de aprovechar resultados anteriores, se estableceranlos límites presupuestarios y temporales a que deber^, suj etarse la investigacián,

Page 8: 1^/i u estreo e o a .c^.ones ilnitas

MUESTREO DE POBLACIONES FINITAS 49

teniendo presente al propio tiempo la legislación, disposiciones, oportunidad dea fecha elegida y dernás circunstancias que puedan limitar o modificar el plan

general del trabaj o.Habrá que hacer acapio de Ia información cartográfica, ficheros, listas, etc.,

y cuidar su posible mej oramiento y puesta al df a para constituir el rnarca,infraestructura o subestrato, descripcidn de la estructura relativa a la pobla-ción en eŝtudio,

Se establecerá asimisma cuál es el personal y equipo mecánico de que podrf adisponerse con vistas a una utilización óptima de recursos.

3.a f ase. Programa de o^beyaciones.

En esta fase pueden incluirse el diseño del muestreo, el cuestionario, la en-cuesta piloto si f uese necesaria, los métodos de recolección, Ia organización deltrabajo de campo y de oficina, la preparacicSn y entrenarniento del personal yequipos, las dispQsicianes sobre codificacidn, supervisión y control, el tratamientodel "no consta" o"no respuesta", etc.

Claro es que la cuestión fundamental, desde el punto de vista estadfstico-matem;ático, consiste en establecer el diseño del muestreo. Para ello hay quepensar, entre otras cuestiones, si la muestra va a formar parte de una sucesión,y en tal caso, si será preferible espaciar muestras grandes o efectuar muestraspequeñas con mayor frecuencia. También habrá que tener en cuenta si convienesustituir la muestra por un conj unto de submuestras interpenetrantes como lasque mencionamos en la seccián q.. Esta permite, además de otras posibilidades, lade comparar el comportamiento de distintos agentes o equipos.

En lo que se refiere al cuestionario, se han publicado trabaj os de interésque recogen sus aspectos psicológicos, sociológicos y semánticos. Los realizado-res de encuestas de opinión pública y aquellos que han necesitado recoger in-formacidn sobre actividades humanas que se refieran a aspecias económica-financieros o de carácter privado, han tenido ocasión de recoger experiencias muyvaliosas a este respecto. Merece mencionarse el trabajo de Cochran, Mostellery Túkey sobre "Fundamentos de muestreo". En general, se insiste en la necesi-

^ dad de establecer instrucciones inequfvocas para los agentes y en la convenien-cia de usar un cuestionario fij o. Sin embargo, en el caso de preguntas de f ndolemuy delicada, puede ser más conveniente sustituir 1as preguntas directas porprocedimientos adecuados a las circunstancias de cada caso.

En cuanto al núrnero de agentes, aparte de 1a consideración práctica delnúmero de unidades de muestreo que pueda examinar cada agente en un periododado, asf como la del presupuesto disponible, posibilidades de entrenamientoy supervisión, etc., habrá que tener en cuenta que en general pocas entrevis-tadores pueden introducir una gran fuente de sesgos personales, mientras queun gran número de agentes tal vez den lugar a un aumento en las fluctuacionesaleatorias o errores de muestreo. En todo caso serf a conveniente aprovecharlas experiencias de cada muestra en una situación y campo dado, empleandoel análisis de la varianza a1 estudio de las direrencias de rendimiento entre agen-tes o grupos de éstos para aplicar los resultados obtenidos a muestras subsi-guientes.

Page 9: 1^/i u estreo e o a .c^.ones ilnitas

50 ESTADÍSTICA ESPAÑOLA

4.d f ase. Ejecución del ^rograma y recoleccidn de datos.

Cuando no se disponga de experiencias de muestras análogas anteriores ala que se trata de ejecutar, puede decirse que será imprescindible la realizacidnde una muestra piloto. En ésta se pondrá a prueba el cuestionario y constituiráun ensayo general de las instrucciones, reacciones de los elementos constituyentesde la población, . tanto por ciento de no respuesta, etc. Proporcionará ademásinformación sobre la variabilidad de la población en estudio, sobre la cual ba-sarse para evaluar el tamaí^o de la muestra, que deberá proporcionar una pre-cisión que se aproxime a la establecida en la fase.

5.a f ase. Análisis y a^rovecha^niento de los resultados.

Esta última fase comprenderá el cálculo de las estimaciones requeridasacompañadas en sus errores de muestreo, de manera que 1a misma muestraproporcione la medida de su fiabilidad y confianza. Estos cálculos, ^unidos alas correspondientes tabulaciones, representaciones, etc., irán seguidos del co-mentario e interpretación.

, Es rnuy conveniente que una vez efectuada la muestra se indique cuál hasido el desarrollo efectivo de 1as fases antes mencionadas, destacando detalla-damente el capf tulo de costes y haciendo una crf tica general de las operacionesrealizadas, y de las diferencias entre lo que se trataba de hacer y lo que efecti-vamente se hizo. Tiene especial interés la comparación entre el error máximoadmisible establecido en la primera f ase y el error de muestreo calculado aposteriori, asf como el estudio del "no consta" y otras posibles f uentes de sesgo.

6. Ezperienciáe.

Algunas sabrevisiones por muestreo han sido ya realizadas en España porel Instituto Nacional de Estadística, Instituto de Investigaciones Estadísti-cas, etc., así como por entidades particulares de investigación de mercados. Lamayor parte se han basado en listas como las del Censo electoral de cabezas def amilia, haj as del padrán, ficheros de vivienda, etc. En este mismo número sepresenta una aplicación del muestreo por áreas realizada con motivo del censoindustrial en la provincia de Barcelona. Es de esperar que estas operacionessean sólo el comienzo de una aplicacidn intensa, vasta y eficaz de los métodosde muestreo, y se haga uso de las técnicas más recientes para elevar de estemodo 1as estadísticas españolas al rango que todos deseamos.

A continuación damos una lista de las publicaciones de mayor interés paralos que deseen adquirir una base sólida en estas cuestiones f undamentales parala aplicacián práctica de los recursos de la estadística moderna.

Page 10: 1^/i u estreo e o a .c^.ones ilnitas

MUE5TRE0 DE POBLACIONES FINITAS

NOTA BIBLIOGRAFICA

51

E. CANSADO: "Conferencias sobre rnuestreo estadfstico", i95o, I. N. E. Madrid.W. E. DEMING: "Some Theory of Sampling", i95o, J. Wiley.W. E. CocxRAN: "Sampling Technigues", igg3, J. Wiley. ^HANSEN, HURWITZ y MADOW: "Sarnpling Survey Methods and Theory", igg3, J. Wiley.

P. V. SUKHATME: "Sampling Theory of Surveys", t954^ F• A• Q•

V. A. HENDRICKS: "The Mathematfcal Theory of Sampling", iggó, Scarecrow Press.

Anterlor a éstos es la obra de F. YATx3, "Sampling Methods for Censuses and Surveys",(i94g, Griffin, London), que puede considerarse como el primer texto sobre muestreo de p©-blaciones finitas. Multitud de artículos de interés sobre muestreo pueden verse, por ejemplo,en las revistas mencionadas en este artículo, así como en el "Journal of the Royal StatisticalSociety, Sankhya", etc., y en las españolas "Trabajos de Estadística", "Racionalización", "Su-plemento al Boletín de Estadística", etc.

RÉS ĈIM^

L'auteur, avec sa ^►récission et clarté cayactéristiques, ex^osedans cet article l'extension et la ^usti f ication de la technique dusondage, et ^y€sente une id^e ^ortant suy ce vaste cham^i d'a^i^ili-cation, et ses di f f^yents ty^es, avec des citations de quelques articleset travaux intéressants pour ceux qui veuillent se renseigner surl e suj et. En f in, l'auteur considére les diverses ^ihases d'unesobrevision de sondage ei des ex^i^riences r^atis^es.