tamaño del efecto 1

7/25/2019 Tamao Del Efecto 1

1/16

Revista Latinoamericana de Psicologa

ISSN: 0120-0534

[email protected]

Fundacin Universitaria Konrad Lorenz

Colombia

LEDESMA, RUBN; MACBETH, GUILLERMO; CORTADA DE KOHAN, NURIA

TAMAO DEL EFECTO: REVISIN TERICA Y APLICACIONES CON EL SISTEMA ESTADSTICO

ViStaRevista Latinoamericana de Psicologa, vol. 40, nm. 3, 2008, pp. 425-439

Fundacin Universitaria Konrad Lorenz

Bogot, Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=80511493002

Cmo citar el artculo

Nmero completo

Ms informacin del artculo

Pgina de la revista en redalyc.org

Sistema de Informacin Cientfica

Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal

Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
http://www.redalyc.org/articulo.oa?id=80511493002http://www.redalyc.org/comocitar.oa?id=80511493002http://www.redalyc.org/fasciculo.oa?id=805&numero=11493http://www.redalyc.org/articulo.oa?id=80511493002http://www.redalyc.org/revista.oa?id=805http://www.redalyc.org/http://www.redalyc.org/revista.oa?id=805http://www.redalyc.org/articulo.oa?id=80511493002http://www.redalyc.org/fasciculo.oa?id=805&numero=11493http://www.redalyc.org/comocitar.oa?id=80511493002http://www.redalyc.org/articulo.oa?id=80511493002http://www.redalyc.org/revista.oa?id=805


2/16

Revista Latinoamericana de Psicologa

2008, volumen 40, No 3, 425-439

ABSTRACT

Effect size (ES) is a necessary complement to the statistical hypothesis testing, however,researchers rarely report ES in their papers. This work provides a conceptual review of the ESestimates for the difference between two means, taking into account the most importantalgorithms and their interpretation. We also provide a guide to the freely available and easy-to-use ViSta statistical software to compute ES. We hope this paper contributes to the diffusion ofES methods and encourages its use among researchers in Psychology.

Key words: effect size, mean, free software, ViSta

RESUMEN

La estimacin del tamao del efecto (TE) se considera actualmente como un complementonecesario a las pruebas de hiptesis, no obstante, su uso se encuentra an poco extendido entrelos investigadores en Psicologa. Este trabajo ofrece una revisin terica de las estimaciones delTE para el caso de la diferencia entre dos medias, considerando los algoritmos ms importantes

1 Correspondencia: NURIACORTADADEKOHAN, Salguero 1692, 8-A, CP 1425, Buenos Aires, Argentina. Tel. 54-011-4824-1753. Correo electrnico: [email protected]

Contina

RUBNLEDESMACONICET/Universidad Nacional de Mar del Plata, Argentina

GUILLERMOMACBETHCONICET/Instituto de Investigaciones Psicolgicas de la Universidad del Salvador, Argentina

y

NURIACORTADADEKOHAN1Universidad de Buenos Aires, Argentina


3/16

426 LEDESMA, MACBETH Y CORTADA

INTRODUCCIN

El tamao del efecto (TE): definicin e

importancia

La investigacin psicolgica se interesa pordetectar la ocurrencia de ciertos fenmenospoblacionales mediante el anlisis de una colec-cin de datos muestrales (Cohen, 1988; citadopor Kohan, 1994). Para lograr tal conocimiento sevale de un procedimiento lgico-estadstico quepermite decidir, con cierto margen de error, si esposible sostener o no la ocurrencia poblacionaldel fenmeno bajo estudio. Lo que interesa saberes, por ejemplo, si un tratamiento novedoso A es

mejor que un tratamiento clsico B para la recu-peracin de personas que padecen algn trastor-no. Resulta pertinente estudiar si los pacientestratados con A mejoran ms que los tratados conB y la medida en que tal diferencia se presenta enla poblacin, ms all de lo que se observa en lamuestra que el investigador conoce.

El tamao del efecto (TE) se define como elgrado de generalidad que posee esa superiori-dad de A sobre B en la poblacin de la que seobtuvo la muestra estudiada. De esta manera, el

TE se refiere a la magnitud de un efecto que es,en este ejemplo, la diferencia entre un tratamien-to nuevo A y otro clsico B. Si A es realmentemejor que B, interesa saber en qu medida seespera este fenmeno en la poblacin (Cohen,1992b). No es suficiente saber que la mejoramedia lograda con A es mayor que la mejoramedia lograda con B en un experimento particu-lar. Se necesita saber, adems, hasta dnde sepuede generalizar este hallazgo cuando se tie-

nen en cuenta las limitaciones del experimento.La cantidad reducida de personas que participa-ron del estudio, el mximo riesgo que se aceptacorrer en la generalizacin y los errores de

medicin de la mejora, entre otras, son laslimitaciones del experimento que restringen laposibilidad de afirmar la superioridad de A sobreB para la poblacin de la que se obtuvieron laspersonas que participaron del estudio.

En sntesis, no es suficiente con identificar laocurrencia de cierto efecto, se requiereadicionalmente determinar su magnitud o tama-o (Cohen, 1990, 1992a). Con tal propsito sehan desarrollado diversas tcnicas formales quepermiten cuantificar el TE para diversas pruebas

estadsticas habituales en la investigacin psico-lgica como son, por ejemplo, la prueba t, elanlisis correlacional r, y el anlisis de varianza,entre otras (Cohen, 1988). Estas tcnicas deestimacin del TE poseen inters prctico enPsicologa, no slo como complemento necesa-rio a la pruebas de hiptesis, sino tambin por-que ofrecen una mtrica comn sobre la cualintegrar los resultados de la investigacin enestudios de meta-anlisis (Anderson, 1999;Macbeth, citado por Kohan & Razumiejczyk, enprensa). Este inters ha llevado a la AmericanPsychological Association (APA) a alentar suuso entre los investigadores en Psicologa(Thompson, 1998) y tambin a que las publica-ciones peridicas soliciten, cada vez ms, nosolo estadsticas, sino tambin sus TE (Hunter &Schmidt, 2004).

No obstante el inters asociado con estastcnicas, en la prctica su uso sigue siendo pocohabitual entre los investigadores, quienes se

y su interpretacin. Complementariamente, se presenta y describe un nuevo programa para el

clculo del TE dentro del sistema ViSta. Este programa es simple de utilizar y se encuentradisponible de forma gratuita. Se espera que el trabajo contribuya a difundir estos procedimien-tos y aliente su uso entre los investigadores en Psicologa.

Palabras clave: tamao del efecto, medias, software libre, ViSta


4/16

427TAMAO DEL EFECTO EN ViSta

muestran ms proclives a informar slo los valo-res de significacin de las pruebas estadsticas,

es decir, el valor convencional de fijado en0,01 0,05 (Cohen, 1990, 1994; citado porKohan, 2006). Una cuestin aadida y que nocontribuye a modificar esta prctica, es que losprogramas ms populares no siempre incluyenla estimacin del TE entre sus opciones deanlisis. As, resulta clara la conveniencia deinsistir en la difusin de estas metodologas,tanto como facilitar el acceso a las tecnologasinformticas necesarias para su aplicacin.

En este contexto, se presenta en lo que sigue

una revisin terica de las estimaciones del TEpara el caso de la diferencia entre dos medias.Esta revisin incluye una presentacin de losalgoritmos ms comunes, su clculo y su inter-pretacin. Luego, se introduce y describe unprocedimiento para estimar el TE mediante elprograma ViSta The Visual Statistics System(Young, 1996). Se espera que el trabajo contri-buya a una mayor difusin de estas metodologasy aliente su uso entre los investigadores enPsicologa.

ESTIMACIONES DEL TE: EL CASO DE LADIFERENCIA ENTRE DOS MEDIAS

Para calcular el TE que surge de la diferenciaentre dos medias, se emplean habitualmente tresprocedimientos que se conocen como delta deGlass, d de Cohen y g de Hedges (Grissom &Kim, 2005). A estos algoritmos se agregan laconversin de d en r, que es la medida mscomn en la investigacin psicolgica actual yel estadstico CL (Common Language Effect Size

Statistic), menos conocido pero que tambinpuede resultar de utilidad. Mediante estosestimadores se calcula el grado de generalidadpoblacional de un efecto, a partir de la diferenciaque se observa entre dos medias muestrales. Lapreferencia por una u otra depende de ciertascondiciones vinculadas a los supuestos de lasdistribuciones y a las propiedades del diseo deinvestigacin.

La delta de Glass

Pretende estudiar el efecto de la manipulacinde la variable independiente X sobre la variabledependiente Y. Para ello se conforman dos gruposhomogneos de participantes. El grupo experi-mental recibe la manipulacin deXmientras que elgrupo control no la recibe. Se comparan la mediade Yen el grupo experimental (Y

c) con la media de

Y en el grupo control (Ye) para saber si se gener

entre ambas una diferencia d (Ecuacin 1).

(1)

La diferencia d entre las medias de ambosgrupos que genera la Ecuacin 1 no es unamedida estable y homognea porque depende,entre otras condiciones, de la unidad de medidade la escala que se aplique para medir la variabledependiente. No es lo mismo una escala quepunta de 1 a 10, que otra escala que punta, porejemplo, de 1 a 100. Esta diferencia bruta dresulta demasiado libre como para obtener deella alguna informacin til, por lo que convieneuniformarla de algn modo que facilite su mane-

jo. Su comportamiento se vuelve ms informati-

vo si se trata esta medida como un puntaje Z, esdecir, cuando se la estandariza. La Ecuacin 2presenta la diferencia d estandarizada, lo queequivale a dividirla por el desvo estndar delgrupo control (S

c).

(2)

El desvo estndar Sc de la Ecuacin 2 se

ajusta mejor con n 1 en el denominador, tal

como se indica en la Ecuacin 3. El trmino ncserefiere al tamao del grupo control.

(3)

La diferencia estandarizada entre mediasmuestrales de la Ecuacin 2 es un estimador delparmetro poblacional delta, atribuido a Gene

d = Ye Y

c

Ye Y

c

d =

Sc

1

)(

=


5/16


Glass (Glass, McGaw & Smith, 1981), que serepresenta con la letra mayscula griega en la

Ecuacin 4.

(4)

Los valores de ey cse refieren a las respec-tivas medias poblacionales de la variable depen-diente Yen los grupos experimental y control. Lasigma con subndice c (c) se refiere al desvoestndar poblacional del grupo control. La poblacional de la Ecuacin 4 es el parmetro quese pretende conocer mediante el clculo del esta-dstico muestral de la Ecuacin 2. La escala dentro

de la que se mueve la es la de los puntajes Z, esdecir, cada unidad es un desvo estndar. Suinterpretacin se refiere a la distancia estandarizadaque la manipulacin de la variable independiente

Xgener en la variable dependiente Y. Por ejem-plo, si = 1, se interpreta que la media del grupoexperimental (esto es, en condicin de manipula-cin deX) se encuentra a 1 desvo estndar de lamedia del grupo control, es decir, la primerasupera aproximadamente al 84% del grupo con-trol (porque el rea bajo la curva normal quecorresponde a una Z = 1 de la distribucin

estandarizada de c es de p = 0,84022).

La g de Hedges

La delta de Glass pondera la diferencia entrelos grupos mediante el desvo estndar del grupocontrol Sc, como se indica en el denominador dela Ecuacin 2. Sin embargo, la diferencia brutaentre las medias del numerador depende de lavariabilidad de los dos grupos. De esta manera, ladelta de Glass es poco sensible a las diferencias de

variabilidad (por ejemplo, desvo estndar,varianza) entre los grupos experimental y control.Este conservadurismo puede generar sesgos en laestimacin del TE cuando la variabilidad resultaheterognea entre los grupos. Es por ello queHedges propuso cambiar el desvo estndar delgrupo experimental Sc que se presenta en eldenominador de la Ecuacin 2, por otro desvoestndar que mida la variabilidad conjunta de

ambos grupos (Grissom & Kim, 2005). Estamedida de variabilidad unificada Sues un nuevo

desvo estndar que se obtiene de combinar losdatos de los grupos experimental y control enuna nica medida que no asume la igualdad devarianzas. El desvo estndar unificado S

u se

obtiene mediante los cmputos de la Ecuacin 5.

(5)

El desvo estndar unificado Su permite quetanto la variabilidad interna de cada grupo (S2e,S2c), como el tamao de los grupos (n e, nc)

participen en la estimacin del TE. Esta medidaresulta menos sesgada que la delta de Glasscuando no se asume la igualdad de varianzas. Elempleo del desvo estndar unificado Su para elclculo del TE, cuando se comparan dos gruposindependientes, se conoce como la gde Hedges.Su cmputo se presenta en la Ecuacin 6.

(6)

La g de Hedges es un estimador de la corres-

pondiente gpoblacional gpob que se indica en laEcuacin 7.

(7)

Tanto la delta de Glass, como la g de Hedges,presentan un sesgo positivo, es decir, unasobreestimacin del TE que puede corregirsemediante un ajuste propuesto por el mismoHedges. La g ajustada g

ajust se obtiene mediante

la Ecuacin 8.

(8)

A mayor cantidad de grados de libertad gl,menor ajuste se necesita para lograr una estima-cin menos sesgada del TE, tal como se deducede la ubicacin de los gl en los cmputos de laEcuacin 8.

=

2

)1()1(22

+

+=

=

=

=

14

31


6/16


La d de Cohen

El estimador del TE propuesto por Cohen(1988, 1992a, 1994) es similar a la gde Hedges,aunque presenta un mayor sesgo cuando no seasume la igualdad de varianzas. El denominadorde la gde Hedges que se presenta en la Ecuacin5, emplea el artificio de n 1(es decir, n

e+ n

c-

2) para lograr una mejor aproximacin del valormuestral del desvo estndar unificado S

u al

valor poblacional del desvo estndar unificado. Se ha demostrado que mediante este artificiose logra una mejor aproximacin estadstica alos valores poblacionales, que mediante el uso

de n. Sin embargo, si las condiciones de variabi-lidad controlada que se proponen lograr losdiseos experimentales son adecuadas, ambosartificios resultan equivalentes. Es por ello quebajo el supuesto del control ideal de todas lasfuentes de variabilidad ajenas a la manipulacinde la variable independiente X,se considera queel empleo de la nen el denominador del desvoestndar resulta pertinente. La d de Cohen, en-tonces, emplea este artificio para el clculo delTE. El desvo estndar de la dde Cohen es, comoocurre con la gde Hedges que se presenta en las

Ecuaciones 5 y 6, una medida que combina losdesvos estndar de los dos grupos, aunque la dno emplea el artificio de n 1.

La dde Cohen (1988) es una de las medidasms empleadas en las publicaciones especializa-das para el clculo del TE y en los estudios meta-analticos (Anderson, 1999; Hunter & Schmidt,2004). Su cmputo se presenta en la Ecuacin 9.

(9)

El desvo estndar unificado Su en la d deCohen, sin embargo, no es idntico al de la gdeHedges de la Ecuacin 5, porque el primeroemplea slo la n, es decir, no incluye la correc-cin de n 1.

La relacin entre estas tres medidas del TEdepende de la variabilidad interna de cada gru-po. Cuanto ms se aproximen los grupos experi-

mental y control a la normalidad y homogeneidad,ms se acercarn al ideal de = g

pob= g

ajust= d. Esta

situacin ideal resulta, sin embargo, poco posibledebido a las variaciones que genera el error demuestreo, entendido como el conjunto de diferen-cias que se observan entre diversas muestrasaleatorias obtenidas de una misma poblacin(Hunter & Schmidt, 2004). Es poco probable queS

e = S

c y, por lo tanto, que ambas medidas sean

iguales a la sigma unificada poblacional u.

Interpretacin de las estimaciones del tamao

del efecto

El significado del TE no se obtiene mecni-camente (Cohen, 1990). Si bien su unidad demedida es la de los desvos estndar, su interpre-tacin depende de la manera en que se relacionacon otros criterios relevantes del razonamientoestadstico (Gigerenzer, 1993; Krueger, 2001;Thompson, 1998). Un mismo TE puede tenerdiferentes significados prcticos porque depen-de del problema especfico que se est evaluan-do. Uno de los aspectos ms relevantes para lainterpretacin del TE es su relacin con el poder

estadstico (Cohen, 1988), entendido como laprobabilidad que posee una prueba de obtenerresultados significativos. Formalmente, el podero potencia (power) se define como 1 , siendo la probabilidad de aceptar errneamente lahiptesis nula (Cohen, 1992a). A su vez, elpoder estadstico es una funcin matemtica quedepende del tamao de la muestra (n), del nivelde significacin estadstica (p valor) y del TE.De esta manera, el TE ha sido entendido comoun complemento necesario para el anlisis de losdatos empricos en la prueba de hiptesis tradi-

cional (Cortina & Dunlap, 1997).

En relacin con este procedimiento clsicode la prueba de hiptesis, la hiptesis nula sos-tiene que el TE es igual a cero (Cohen, 1988,1994). El alejamiento del TE de cero implica elrechazo de la hiptesis nula, por lo cual sumagnitud crece junto con el poder de la pruebade significacin estadstica que se est emplean-do. A mayor TE, mayor poder, es decir, menor

=


7/16


probabilidad de cometer un error de tipo II. Laconsideracin del TE en el contexto de la prueba

de hiptesis es una manera de controlar tanto elvalor de (probabilidad de cometer un error detipo I), como el valor de (probabilidad decometer un error de tipo II). De esta manera,cuanto mayor sea el TE, menor resulta el tamaode la muestra que se necesita para detectar laocurrencia poblacional de un fenmeno.

El tamao del efecto en trminos de

correlacin

La forma ms universal del TE es r, entendi-da como correlacin biserial entre una variableindependiente binaria X y una variable depen-diente numrica o escalar Y(Cohen, 1988). LaXadquiere slo dos valores, por ejemplo 1 y 0,segn la pertenencia del participante al grupoexperimental (X= 1) o al grupo control (X= 0).Los valores de Y dependen, en cambio, de laescala de medicin que se aplique. La estima-cin del TE mediante r tienen varias ventajassobre los anteriores estimadores, entre las que sedestaca su mayor facilidad de interpretacin.

Esta ventaja se debe a la condicin acotada de laescala de r. La correlacin es siempre un nmerodecimal que flucta entre 0 y 1, a diferencia delas otras medidas del TE que se comportan comoun puntaje Z. Por ello, es til convertir estimadorescomo la dde Cohen a r. Esta conversin facilita,adems, la posterior realizacin de estudios meta-analticos. Cohen (1988) propone la frmula dela Ecuacin 10 para convertir la d en r.

(10)

Los valores de p y q corresponden a lasproporciones de sujetos que pertenecen a losgrupos experimental y control, respectivamen-te. Es decir que la proporcin pes equivalente alcociente que surge de dividir la cantidad desujetos que incluye el grupo experimental n

epor

la cantidad total de sujetos n (grupo experimen-tal n

e+ grupo controln

c). Es decir,p = n

e/ n. La

proporcin de sujetos que pertenecen al grupo

control es q = nc/ n. De esta manera, la propor-

cin qes el complemento de p, por lo cual q = 1

- p. Cuando el tamao de ambos grupos esidntico (ne = n

c), el valor del trmino (1 / pq)

resulta igual a 4, es decir 1 / (0,5 x 0,5) = 1/ 0,25= 4. De esta manera, la Ecuacin 10 puedeabreviarse cuando los grupos experimental ycontrol poseen el mismo tamao. La Ecuacin11 propuesta por Cohen (1988) resume estecaso.

(11)

Cunto mayor sea la discrepancia entrepy q,es decir, entre el tamao de los grupos experi-mental y control, mayor ser el valor del deno-minador en la Ecuacin 10, por lo cual menorser la correlacin r.

Para interpretar el TE mediante r se debeconsiderar que a mayor TE, mayor r. Se infiereque cuanto mayor es el valor de r, mayor es lamagnitud del efecto que la manipulacin de lavariable independiente X gener sobre la varia-ble dependiente Y. A mayor valor de d(y mayor

homogeneidad de tamao entre los grupos),mayor correlacin biserial entre Xe Y. Suponga-mos el ejemplo que se reproduce con mayordetalle en el apartado de descripcin del progra-ma. En l, se realiza un experimento con dosgrupos de similar tamao, con 21 sujetos querecibieron una manipulacin experimental y 23sujetos que no recibieron ninguna manipulaciny el TE obtenido para la diferencia estandarizadaentre medias resulta de d= 0,691. Reemplazan-do los valores correspondientes en la Ecuacin10 obtenemos:

)/1(2

+=

42 +

=

326,0

119,2

691,0

)249,0/1(477,0

691,0

)523,0477,0/1(691,0

691,0

2==

+=

+=

326,0

115,2

691,0

477,4

691,0

4477,0

691,0

4691,0

691,0

2==

+=

+=

La Ecuacin 11, que asume la homogenei-dad del tamao de los grupos, tambin arrojauna rde 0,326 porque la diferencia de la nentreambos es muy pequea (p q 0,5).


8/16


Ntese que el trmino de mayor peso en estasfrmulas de conversin es el tamao del efecto

d. De esta manera, a mayor TE, mayor r, es decirmayor proximidad de ra 1. Si en el caso ilustradoeliminramos del grupo control un aparenteoutlier presente en los datos, la d ascendera de0,691 a 0,922 y se obtendra una r an mayorcon la Ecuacin 10:

La proporcinpse obtiene de 21/43 = 0,488

y la proporcin q se obtiene de 22/43 = 0,512,por lo cual el valor de pq resulta de 0,488 x0,512 = 0,2498 0,25. En este caso, la diferen-cia de tamao entre los grupos experimental ycontrol es tan pequea que el valor de rresultaequivalente segn las Ecuaciones 10 y 11. Elvalor hallado de r = 0,419 indica una buenacorrelacin entre la manipulacin de X y lasvariaciones de Y. De esta manera, la conversinde da rpermite interpretar el TE en trminos decorrelacin.

Tablas para la interpretacin del tamao del

efecto

Cohen (1988) ha proporcionado una colec-cin de tablas para la interpretacin del TE en laspruebas estadsticas ms usadas en la investiga-cin psicolgica, tales como t, r, 2, F, etc. Estastablas presentan dos variedades: a) algunas sir-ven para calcular el poder de una prueba estads-tica en un anlisis post hoc, es decir, luego deconcluida la investigacin; y b) otras se aplicanpara calcular el tamao de muestra (n) necesariopara detectar un TE determinado durante laplanificacin de un estudio, es decir, antes de la

investigacin (Citado por Kohan & Macbeth,2008, en prensa). Las tablas que ofrece Cohen(1988) para el primer caso informan los valoresaproximados del poder de la prueba para dife-rentes tamaos de la muestra n y diferentesvalores del TE. En la Tabla 1 se resumen algunosvalores del poder de la prueba t ofrecidos porCohen para el caso de un criterio de significa-cin de = 0,05 en la comparacin de dosgrupos independientes. Los diversos TE (d) ob-tenidos se indican en las columnas y los diferen-tes tamaos de (n) se indican en las filas.

419,0

202,2

922,0

)25,0/1(85,0

922,0

)512,0488,0/1(922,0

922,0

2==

+=

+=

TABLA 1

Poder (1-) de la prueba t bilateral para un p valor de 0,05 (Cohen, 1988)

D

n 0,30 0,50 0,70 0,80 1 1,20

1 0,10 0,18 0,31 0,39 0,56 0,7130 0,21 0,47 0,76 0,86 0,97 *50 0,32 0,70 0,93 0,98 * *72 0,43 0,85 0,99 * * *

100 0,56 0,94 * * * *

* poder > 0,995

La Tabla 1 es una versin abreviada de latabla ofrecida por Cohen (1988, pp. 36) para laestimacin del poder de la prueba tbilateral conun p valor de 0,05 para la comparacin de dosgrupos independientes.

Para ilustrar el funcionamiento de esta tabla,Cohen propone un ejemplo en el que se compa-ran dos grupos de ratas en un experimento sobreaprendizaje. El grupo experimental fue someti-do a una sesin de aprendizaje mientras que el


9/16


grupo control no recibi ningn tratamiento. Semidi el nmero de ensayos necesarios para

obtener xito sostenido en una determinadatarea. Se encontr que las diferencias entre elgrupo control y el grupo experimental arroja-ron una estimacin del TE equivalente a d =0,50; con una n= 30 para cada grupo. El poderde la prueba estadstica aplicada es, segn laTabla 1, equivalente a 0,47. Esto significa quela probabilidad de detectar un TE de 0,50 conun p valor de 0,05 mediante una prueba tbilateral es menor a 1/2. Si el tamao del efectoresulta, en cambio, de mayor magnitud, enton-ces el poder aumenta.

Por ejemplo, si la dasciende de 0,50 a 0,70,manteniendo constante el resto de las condicio-nes, entonces el poder de la prueba correspondea 0,76. Esto indicara que la prueba tposee, en talcaso, una probabilidad bastante alta de detectarel TE especificado. El poder de la prueba aumen-ta junto con el tamao de los grupos y, simult-neamente, a medida que aumenta la diferencia dentre el grupo experimental y el grupo control.

En general, a mayor TE y mayor tamao de lamuestra, mayor poder estadstico posee la prue-

ba que se emplee para una hiptesis.

La segunda variedad de tablas ofrecidas porCohen para interpretar el TE se relaciona con elclculo del tamao de la muestra que se necesitapara detectar un determinado efecto. Estas tablasse emplean durante la planificacin de un estu-dio. La Tabla 2 presenta una versin abreviadade la tabla ofrecida por Cohen (1988, pp. 55)para el clculo del tamao de la muestra que senecesita para detectar diferentes TE (d) segn elpoder estadstico de la prueba t bilateral con un

p valor de 0,05. Por ejemplo, para detectar unadiferencia estandarizada entre las medias delgrupo experimental y control equivalente a unad= 0,50 con un poder de 0,80, se necesitan 64casos por grupo. Si se espera que la diferenciaentre los grupos resulte an mayor, por ejemplode d = 0,80, entonces se necesitarn menoscasos, 26 por grupo segn se indica en la Tabla2. Con slo 12 casos por grupo se podr detectaruna diferencia d = 1,20.

TABLA 2

Tamao de muestra (n) necesario para detectar diferentes TE (d) mediante prueba t

(Cohen, 1988)

D

poder 0,10 0,20 0,50 0,80 1,20

0,25 332 84 14 6 4

0,50 769 193 32 13 7

0,70 1235 310 50 20 10

0,80 1571 393 64 26 12

0,90 2102 526 85 34 16

De la misma manera, en caso de anticiparuna diferencia menor entre ambos grupos equi-valente, por ejemplo, a una d = 0,20, se necesi-tarn 393 casos por grupo para que la prueba t

bilateral (con un p valor de 0,05) tenga un podero probabilidad de 0,80 de detectarla. En general,a mayor poder, se necesita mayor cantidad decasos y, a mayor TE, menor cantidad.


10/16


El estadstico CL como una va ms simple de

interpretacin del TE

McGraw y Wong (1992) proponen otro m-todo de estimacin del TE para el caso de ladiferencia entre dos medias provenientes demuestras independientes: el estadstico CL(Common Language Effect Size). Los autoresargumentan que es un estadstico ms simple deinterpretar que los anteriores, ya que se expresala magnitud de la diferencia en trminos de unvalor de probabilidad. En particular, estima laprobabilidad de obtener un valor de diferenciasentre medias mayor que cero en una distribucin

normal cuya media es la diferencia observadaentre ambas medias (Valera-Espn & Snchez-Meca, 1997). Para su clculo, debe obtenerseprimero:

(12)

Posteriormente se busca en la distribucinnormal tipificada la probabilidad de un valor

menor al obtenido en la formula anterior. En elejemplo supuesto y descrito en el prximo apar-tado del software, esto sera:

Que se interpretara fcilmente como: el 74%de las veces un sujeto extrado al azar del grupoExperimental obtendr un valor mayor que un

sujeto extrado al azar del grupo Control. Estaconversin del TE a un valor de probabilidadpodra aplicarse tambin a otras formasestandarizadas de estimacin de TE, como elestadstico d de Cohen, para proporcionar unaforma ms universal de interpretacin.

CLCULO DEL TE CON EL PROGRAMAViSta

ViSta The Visual Statistics System

ViSta es un programa estadstico creado porel Profesor Forrest W. Young de la Universidadde Carolina del Norte en Chapel Hill (Young,1996). Diseado originalmente como entornopara desarrollar tcnicas de visualizacin dedatos, en la actualidad puede considerarse unsistema estadstico completo, ya que ofrece ca-pacidades de edicin, transformacin y anlisis

de datos (Molina-Ibaez, Ledesma, Valero-Mora& Young, 2005). ViStaes un sistema escrito enlenguaje LispStat (Tierney, 1990) que ha sidopensado como software abierto y extensible,esto significa que proporciona acceso al cdigofuente y herramientas de programacin para quelos usuarios avanzados puedan expandir o mo-dificar las capacidades de anlisis del programa.Se presenta en este artculo la anexin de funcio-nes bsicas de estimacin del TE a un mdulo yaexistente en ViSta para la comparacin de me-dias.

Ejemplo de uso de ViSta

La Figura 1 muestra una imagen parcial deViStacon un conjunto de datos apropiados parailustrar el clculo del TE. Este archivo de datosse encuentra en la librera de datos de ViSta ycorresponde a un ejemplo tomado de Moore yMcCabe (1993). Los datos pertenecen a unestudio que examina cmo una nueva tareadirigida puede ayudar a los estudiantes a mejorar

sus habilidades de lectura. Los dos grupos co-rresponden a estudiantes que han recibido latarea (grupo experimental; n

e= 21) y estudiantes

que no la han recibido (grupo control; nc = 23).

La variable dependiente en este caso es lapuntacin en un Test de Lectura, etiquetada en la

22

+

=

651,0

63,1401,11

55,3951,48

22=

+

= , yp(Z< 6,651) = .743


11/16


imagen con el nombre Puntajes. Este tipo dearchivo de datos puede crearse en ViSta usando

el editor de datos o tambin importarse en forma-to texto.

En ViSta la estimacin del TE se realizaautomticamente cuando se aplica el comandode contrastacin de medias para muestras inde-pendientes. Por su naturaleza, este anlisis soloadmite datos de entrada con una variable inde-pendiente binaria dos grupos de compara-cin y una variable dependiente numrica,como los datos del ejemplo. Luego de ejecutar

este comando, ViSta proporciona salidas num-ricas en formato de texto (Reports) y salidas enformato grfico para explorar visualmente losresultados del anlisis.

La Tabla 3 muestra el informe con los resul-tados estadsticos bsicos de la prueba de com-paracin de medias para los datos del ejemplo.

Figura 1. Imagen parcial de ViSta con laplanilla de datos del ejemplo

La primera parte incluye informacin descripti-va (tamao de los grupos, medias, desvos

estndar, etc.), mientras que la segunda partemuestra las diferentes formas de estimacin delTE, incluyendo la d de Cohen (0,691), la g deHedges (0,684), la delta de Glass (0,580), laconversin de d a r (0,326) y el estadstico CL(0,687). Por ltimo, se presentan los resultadosde la prueba t y de la prueba de homogeneidadde varianzas. Esta ltima parece indicar unadiferencia significativa entre las varianzas deambos grupos, y la consiguiente necesidad deuna inspeccin ms detallada y directa de losdatos. Con este fin, puede ser conveniente utili-

zar los grficos que ViSta proporciona pararealizar un anlisis exploratorio.

Para este caso, la Figura 2 muestra un ejem-plo del tipo de grficos que se pueden generar enViSta y su posible utilidad como complementoen el clculo del TE. Dicha figura presentadiferentes imgenes de un grfico de puntos,diamantes y cajas (dot, diamond and box plot).La primera imagen (arriba a la izquierda) mues-tra el grfico de puntos representando los par-ticipantes de cada grupo y las medias de ambos

grupos unidas por una lnea. Este grfico permi-te apreciar la diferencia entre las medias y tam-bin visualizar un aparente outliero caso atpicoen el grupo control. El segundo grfico (arriba ala derecha) es un esquema de las distribucionesbasado en las medias y desvos estndar de cadagrupo. Se aaden al grfico anterior dos diaman-tes como indicadores de la variabilidad de losgrupos. Aqu, los extremos de cada diamante sefijan en un desvo por encima y por debajo de lamedia de cada grupo. El tercer grfico (abajo ala izquierda) tambin es un esquema de las

distribuciones, aunque ste se basa en medidasde posicin. Se trata de un grfico de cajas (box

plot) donde la lnea central corresponde a lamediana, las cajas estn definidas por los cuartilesuno y tres, y las lneas de los extremos represen-tan los percentiles 10 y 90, respectivamente. Porltimo, el grfico ubicado abajo a la derecha esuna superposicin de todos los anteriores.


12/16


TABLA 3

Ejemplo de salida en formato de listado numrico (Report)

La informacin grfica anterior sugiere laexistencia de una diferencia entre las medias afavor del grupo experimental, pero tambin per-mite detectar cierta heterogeneidad en las varianzasy un aparente outlieren el grupo control, cuestio-nes que se deben tener en cuenta al momento dela comparacin. Considerando que el outlierpue-de afectar la media del grupo control y contribuira la heterogeneidad de las varianzas, el analistapodra razonablemente estar interesado en reali-zar el anlisis nuevamente, eliminando el outlier

de los datos. La eliminacin de casos atpicos sejustifica, en ocasiones, por el incumplimiento decriterios de inclusin en el reclutamiento de losparticipantes que conforman la muestra, o bienpor errores en el ingreso de datos (Miller, 1993).Este tipo de operaciones (seleccin, eliminacinde participantes, etc.) puede realizarse de modosencillo en ViSta utilizando un Panel de Selec-cin. As, la aplicacin de los anlisis, en este casoel clculo del TE, resulta ms dinmica e interactivapara el usuario.


13/16


La tabla 4 muestra los resultados del an-lisis luego de proceder con dicha elimina-cin. Se observan cambios en las estimacionesdel TE, as como un resultado ms satisfacto-rio en el Test de homogeneidad de varianzas.En sntesis, el ejemplo permite ilustrar que el

Grfico con las medias de los grupos ylos sujetos representados como puntos

Grfico con las medias de los gruposy un diamante representando la

variabilidad

Grfico de cajas con las medianas deambos grupos conectadas

Grfico de puntos, diamantes y cajaspara ambos grupos.

TE puede calcularse de modo sencillo enViSta, con la ventaja aadida de que el usua-rio tambin pude interactuar con el resto delas opciones del programa, tales como obte-ner salidas grficas, seleccionar o eliminarparticipantes, etc.

Figura 2. Ejemplos de grficos generales en ViSta.


14/16


COMENTARIOS FINALES

El TE se ha planteado como un complementonecesario a las pruebas de hiptesis (Cohen,1988). El TE permite una apreciacin ms direc-ta de la magnitud de los fenmenos en estudio yofrece una interpretacin ms adecuada de losresultados. Adems, resulta un elemento nece-sario para la integracin de diversos resultadosmediante el Meta-Anlisis (Hunter & Schmidt,

TABLA 4

Nueva salida de resultados luego de la eliminacin de un posible outlier en el grupo control

2004; Macbeth et al., en prensa). De ah lasrecomendaciones de los expertos y de las nor-mas editoriales de las revistas especializadas quepromueven con un nfasis creciente el empleode estas tcnicas.

No obstante, su uso se encuentra an pocoextendido en la prctica, lo cual podra explicar-se, en parte, por desconocimiento y, en parte,porque los programas estadsticos ms popula-


15/16


res no lo incluyen claramente entre sus opcionesde anlisis. Es curioso, por ejemplo, que muchos

manuales de estadstica en Psicologa no incor-poren este tema entre sus contenidos bsicos,siendo que su clculo e interpretacin resultanrelativamente sencillos. Aqu puede verse, tam-bin, el nfasis en las pruebas de hiptesis y losvalores de significacin tradicionales de 0,01 y0,05.

En este contexto, el presente trabajo intentacontribuir a los esfuerzos realizados por institucio-nes como la APA por difundir y animar el uso delTE entre los investigadores en Psicologa. Con tal

propsito, se proporciona aqu una implementacin

informtica simple de usar y de libre acceso, quese acopla al programa estadstico ViSta.

En cuanto a la disponibilidad y funciona-miento de esta implementacin informtica, elusuario interesado simplemente debe: a) Instalarla versin 6.4de ViSta, y b) Instalar el programaViSta-ES, que aade las opciones de estimacindel TE en ViSta. Ambos programas pueden en-contrarse en la direccin URL: www.mdp.edu.ar/psicologia/vista/ Por ltimo, quienes estn intere-sados en una revisin general de las capacidadesy funcionamiento de ViSta pueden consultar aMolina-Ibaez, Ledesma, Valero-Mora y Young

(2005).

REFERENCIAS

Anderson, G. (1999). The Role of Meta-Analysis in the Significance Test Controversy.European Psychologist, 4(2),75-82.

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. Second Edition.Hillsdate, NJ: LEA.

Cohen, J. (1990). Things I Have Learned (So Far).American Psychologist, 45(12),1304-1312.

Cohen, J. (1992a). A Power Primer. Psychological Bulletin, 112(1),155-159.

Cohen, J. (1992b). Fuzzy Methodology. Psychological Bulletin, 112(3),409-410.

Cohen, J. (1994). The Earth Is Round (p


16/16


Molina-Ibaez, J.G., Ledesma, R., Valero-Mora, P. & Young, F.W. (2005). A Video Tour through ViSta 6.4, a Visual Statistical Systembased on Lisp-Stat.Journal of Statistical Software, 13(8), 1-10.

Moore, D.S. & McCabe, G.P. (1993).Introductionto the Practice of Statistics. Second Edition.

New York: W.H. Freeman & Company.Thompson, B. (1998). Statistical Significance and Effect Size Reporting: Portrait of a Possible Future.Research in the Schools, 5(2),33-38.

Tierney, L. (1990).Lisp-Stat An Object-Oriented Environment for Statistical Computing and Dynamic Graphics. NY: John Wiley& Sons.

Valera-Espn, A. y Snchez-Meca, J. (1997) Pruebas de significacin y magnitud del efecto: Reflexiones y propuestas.Anales depsicologa, 13,1, 85-90

Young, F.W. (1996). ViSta: The Visual Statistics System. UNC L.L. Thurstone Psychometric Laboratory, Research Memorandum94-1.

Recibido: Abril de 2007

Aceptacin final: Octubre de 2008

tamaño del efecto 1

Documents