FACULTAD DE HUMANIDADES
Carrera de Psicología
CONFIABILIDAD INTERJUECES DEL TEST DE WARTEGG EN UN PROCESO DE SELECCIÓN EN UNA EMPRESA DE SERVICIOS DE LIMA METROPOLITANA
Tesis para optar el Título Profesional de Licenciado en Psicología
CARLOS ENOBI SHIMABUKU
Asesor:
Jorge Enrique Rivas Rivas
Lima – Perú
2019
2
Resumen
La presente investigación tuvo como objetivo encontrar evidencias de confiabilidad del
Test de Wartegg, el cual es usado actualmente en algunos procesos de selección de personal.
El tipo de investigación fue de tipo instrumental. La muestra estuvo conformada por 100
personas entre los 18 a 44 años de edad, siendo 54 mujeres y 46 hombres asistentes a un proceso
de selección en una empresa de servicios en Lima. Para la recolección de datos se aplicó el test
de Wartegg a la muestra mencionada y la corrección e interpretación de la prueba fue realizada
por tres Jueces usando un mismo manual. Se usó el Kappa Light para hallar la índice
confiabilidad interjueces, los resultados obtenidos para cada dimensión no son significativos ya
que se ubican por debajo del índice de Kappa menor a 0.30, lo que indicaría poco acuerdo entre
los jueces. Actualmente en nuestro contexto no existe un organismo que administre y actualice
los test, indicando qué pruebas deben usarse en selección y cómo emplearlas. Según los
arquetipos de Jung la función compensatoria, por su dinamismo sea la explicación del por qué
el constructo es complejo de ser captado a comparación de otras pruebas que cuentan con rasgos
más estables. A partir de los resultados se infiere que existe poco interés de parte de los
profesionales en Latinoamérica de informarse más a fondo mejorando los métodos de
evaluación, cuestionando y poniéndolos a prueba.
Palabras clave: Interjueces, confiabilidad, Test de Wartegg,
3
Abstract
The present investigation had as objective to find evidences of Reliability of the Test of
Wartegg, which is used frequently in processes of selection of personnel. The type of research
was instrumental. The sample consisted of 100 people between 18 and 44 years of age, made up
of 54 women and 46 men attending a selection process of a service company in Lima. For the
collection of the information the test of Wartegg was applied to the sample and the correction
of the test was done by three Judges. Kappa Light was used to find the reliability index, the
results obtained for each dimension are not significant since they are below the Kappa index
lower than 0.30, which would indicate little agreement among the judges. Currently in our
context there is no body that manages and updates the tests, indicating which tests should be
used in selection and how to use them. According to Jung's archetypes the compensatory
function, for its dynamism is the explanation of why the construct is complex to be captured
compared to other tests that have more stable traits. From the results, it is inferred that there is
little interest on the part of professionals in Latin America to learn more about improving the
methods of evaluation, questioning and putting them to the test.
Keywords: Reliability, Wartegg, interagreement.
4
Introducción
Una de las áreas más populares que reúne a la mayoría de psicólogos organizacionales,
en nuestro contexto, es la que corresponde a los Recursos Humanos y/o Gestión del Talento
Humano. En dicho campo, el psicólogo se encarga de desarrollar diferentes servicios tales
como reclutamiento y la selección de nuevo personal, capacitaciones sobre diversos tópicos y
fortalecimiento del clima y cultura organizacional (Flórez & Salas, 2011).
En su quehacer profesional, los psicólogos pueden usar diversas pruebas de evaluación
y diagnóstico de personalidad. Dichas herramientas deben responder a criterios de validez y
confiabilidad, así como estar adaptadas al contexto en el que se aplican. En el proceso de
evaluación de candidatos, las pruebas proyectivas más empleadas en nuestro medio suelen ser:
el Test de la Figura Humana de Machover, el Test del Hombre Bajo la Lluvia y el Test de
Wartegg (Vergara, 2011).
Por su interpretación, estos test quizá son los más complejos ya que demandan altos
niveles de experticia, difícilmente lograda por campos diferentes al de la psicología clínica; en
algunos casos, como con el Psicodiagnóstico de Rorschach, demandan largos periodos de
entrenamiento (Hernández, 2009). En ese sentido, cabe precisar que generalmente son pruebas
psicológicas que surgieron como herramientas de diagnóstico clínico, por lo que su aplicación
en el ámbito laboral plantea ciertas inquietudes y debate. Además, es necesario señalar que en
5
la actualidad existen pocos estudios que se esfuerzan en demostrar su validez y confabilidad
dentro en el contexto organizacional, en la cual es usada (Hernández, 2009; Vergara, 2011).
Dichas pruebas se elaboran a partir del mecanismo de proyección psicológica, el cual
está fundamentado bajo el paradigma de la teoría psicodinámica. Freud definió dicho
mecanismo como la tendencia que tienen los seres humanos a atribuir a objetos y personas
aquellos aspectos de su personalidad que no pueden aceptar (Sabogal, 2004) para explicar el
mundo psíquico y las motivaciones del comportamiento humano en un marco clínico y como
esfuerzos comprensivos de las psicopatologías imperantes a finales del siglo XIX. En una
definición más amplia, lo proyectivo plantea la colocación de aspectos centrales de la
personalidad en estímulos no estructurados.
Es importante destacar que el papel de la evaluación psicológica es amplia y
fundamental, como ciencia es dinámica y necesita de una actualización constante para generar
desarrollo en sus diferentes áreas. Existen varios problemas en cuanto a la evaluación, como el
uso de test desfasados sin justificación científica, falta de profesores especializados. Las
informaciones derivadas del uso de las pruebas psicológicas dependen no sólo de la calidad de
instrumento, sino también de conocimiento y competencia del profesional que la emplea
(Padilha, Porto & Zanchet, 2007).
Por lo tanto, no debemos dejar de lado a la psicología como un proceso de
transformación y actualización científica, tomando en cuenta las nuevas relaciones respecto al
ejercicio de la profesión. En la práctica con instrumentos de evaluación algunos autores no
concuerdan con sus colegas. Se busca que se empleen instrumentos psicológicos actualizados
6
cumpliendo con requisitos de evaluación. De acuerdo con Schimdt y Hunter (1998) los
psicólogos se vienen dando cuenta que las pruebas desempeñan un papel importante en el
proceso de selección. En la actualidad, la práctica psicológica en la selección profesional está
comprometida, debido al mal uso de los instrumentos de evaluación. Entre los instrumentos
más usados en el proceso de selección se encuentra el Wartegg (citado por Leite & Noronha,
2005).
Se observa una diferencia importante de resaltar entre el ámbito académico y
profesional (Anderson, Herriot & Hodkingson, 2001, citado por Alonso, Moscoso &
Cuadrado, 2015). Debido a que cuando los profesionales de selección de personal trabajan en
sus procesos, no están al tanto de nuevas técnicas desarrolladas por los investigadores y las
evidencias empíricas que aconsejan el uso de determinadas técnicas en comparación con otras
que cuentan con menor estudio científico.
El Test de Wartegg es utilizado por muchas empresas en procesos de selección de
personal. Pasando por ella varios futuros posibles empleados basándose principalmente en las
personalidades de los solicitantes al empleo. A pesar de que la prueba se ha aplicado
ampliamente, existe un tiempo necesario para el análisis (Yuana., Harjunowibowo, Karyanta,
& Wawan, 2018).
Respecto a la personalidad, existen diversas teorías bajo diferentes autores, expuestas a
lo largo de los años. Algunos de estas teorías o perspectivas son del tipo psicoanalítica, rasgos,
aprendizaje, cognitivo y humanista. Existiendo muchos teóricos que describen la personalidad
7
de diferente manera debido a sus distintas observaciones. Existe la falta de un paradigma
común entre los investigadores de la personalidad hasta el punto de llegar a competir. Quizá
dada la diversidad cultural, la exploración de las teorías de la personalidad de otras culturas y
tradiciones como el budismo (Nitis, 1989) y otros enfoques orientales (Atwood & Maltin,
1991) puede ayudarnos a evaluar el grado en el cual las teorías de la personalidad que hemos
estudiado están sesgadas por las suposiciones individualistas de la cultura occidental (véase
Triandis, 1989, citado por Cloninger, 2003).
Existen actualmente posiciones como el eclecticismo, el cual trata de quedarse con las
contribuciones más destacadas sin aceptar cada teoría por completo. También está el
pluralismo la cual se diferencia de lo anterior por coexistir manteniendo su distintiva teoría
(Cloninger, 2003).
En el presente estudio sobre el Wartegg se usó la prueba, para evaluar la personalidad
bajo distintos niveles, este proceso se basa en los principios de la Psicología Gestalt y la
teoría de los arquetipos de Jung. Los arquetipos de Jung (1951) se determinan como los
contenidos primitivos del inconsciente, un componente constitutivo perteneciente a la psique
humana. Según la teoría tiene su principio en el inconsciente global y existe en la concepción
del mundo y de todo ser humano, ya que son heredados. Estos mismos solo pueden ser
traducidos en imágenes a mediante de su expresión simbólica, diferenciándose de acuerdo a
la diversidad de cada cultura (Techera, 2014).
8
A pesar de los resultados de las meta-análisis utilizadas en selección de personal,
coaching o establecimiento de perfiles por competencia, y del reciente éxito de las medidas de
personalidad para predecir el desempeño ocupacional, su uso en el contexto organizacional, no
está exenta de problemas y dificultades. Existe el sesgo y la distorsión de respuesta al ítem,
por tratar de dar una buena impresión o sugerir que existe algún tipo de trastorno, por parte del
evaluado, existiendo una preferencia por lo primero, para poder ser contratado en un proceso
de selección. Lo cual se traduce a un deseo social de aceptación o deseabilidad, que se divide
en el manejo de impresiones y el autoengaño, como la participación de evaluados entrenados
para distorsionar sus respuestas (Salgado, 2005).
En diferencia con los modos de personalidad concentrados en el individuo desde una
vista sistemática de forma estadística; las técnicas proyectivas fueron vistas en un comienzo
como la técnica para centrarse en el individuo desde una vista exclusivamente clínica, que
examinaba las variables grafológicas, personalidad e inteligencia única en que un individuo
proyecta en estímulos ambiguos su manera ver la vida, sus propósitos, significados, patrones,
y sentimientos (Frank, 1939; Cohen & Swerdlik, 2001, citado por Levano, 2010).
Al respecto, Gregory (2001) indica que los métodos proyectivos engloban un conjunto
de pruebas donde el sujeto examinado se hace frente a estímulos estandarizados, vagos,
ambiguos y no estructurados para responder con sus propias construcciones. Estos estímulos
requieren que los sujetos respondan con tan pocas restricciones lo cual proporciona el
momento esperado para que se muestren los aspectos internos. Para dicho autor, el desafío de
las pruebas proyectivas consiste en descubrir los procesos de la personalidad ocultos mediante
respuestas individualizadas, únicas y subjetivas de cada persona examinada.
9
En el Perú existen pocas investigaciones capaces de reforzar las buenas prácticas de
selección y evaluación de personal. Según la encuesta de Flórez y Salas (2011), la
investigación es virtualmente inexistente debido a que los profesores en las universidades
tienen una fuerte carga laboral dictando clases. Autores locales (León, 2013) creen, que se
trata de vacíos de tradición investigadora conectadas entre empresas y universidades, así como
de una falta de capacidad de la mayoría de profesores para investigar y de recursos materiales
para hacerlo.
En este escenario se ubica el test de Wartegg, como una prueba proyectiva usada
frecuentemente en los procesos de selección de personal; sin embargo, cuenta con escasos
estudios acerca de su validez y confiabilidad (Rodriguez, Primi & Koich, 2007; Sánchez y
Pardo, 2013). Aun cuando su origen es alemán y se remonta a la década de los 30, su uso
parece centrarse en Latinoamérica antes que en Europa (Roivaine, 2015). Precisamente en
nuestro contexto pareciera existir un creciente interés entre los psicólogos que laboran en el
área organizacional por incorporar dicho instrumento dentro del repertorio de herramientas
empleadas en los procesos de selección de personal.
Según Vergara (2011), en el caso de Perú, las pruebas proyectivas más usadas en
procesos de selección de personal, son el Test de la Figura Humana desarrollado por Karen
Machover (26,5%), seguido por el Wartegg (17,6%), y la Persona Bajo la Lluvia (10,3%).
10
Al respecto, resulta de sumo interés el trabajo de Godoy y Noronha (2005), quienes
indagaron cuáles eran los instrumentos de selección psicológica más empleados en un grupo
de participantes conformado por 15 psicólogos en formación y 15 reclutadores y psicólogos
selectores de la región de Campinas. Para ello emplearon un cuestionario enviado a los
profesionales por e-mail y distribuido a estudiantes de la universidad. Los resultados
mostraron que entre los instrumentos más usados por los psicológicos fueron: Wartegg,
Concen- Atención Trada, Prueba de Inteligencia No Verbal G36, Batería CEPA y Palográfico
y las técnicas más comunes fueron las entrevistas personales, las entrevistas de grupo
dinámico y pruebas psicológicas.
Según Vergara (2011), la interpretación del test de Wartegg, empleado en el ámbito de
la selección de personal, se centra en dos aspectos fundamentales: la evaluación de la
personalidad de los candidatos y la predicción de su desempeño en el trabajo. Sin embargo,
para la interpretación de dichos aspectos existen diferentes manuales que en ocasiones llegan a
ser contradictorios entre sí (Wass & Mattlar, 2000; Avé-Lallement, 1994; Gardziella, 1985 y
Crisi, 2007; Citado por Roivainen, 2009). Precisamente este aspecto evidencia las dificultades
que implica el uso del Wartegg (Crisi, 2009) frente a las cuales la investigación psicométrica
se constituye en un importante esfuerzo por abordarlas.
A partir de este punto es importante preguntarnos qué motivos o evidencia concretas
existen para usar el test de Wartegg en el área organizacional. Si la base de la naturaleza de las
pruebas proyectivas está orientadas a medir aspecto clínico por qué se debería usar esa
información para un área de desempeño laboral. ¿Qué tan exactas son las interpretaciones de
11
distinto evaluadores para descartar o no a un candidato en proceso de selección? ¿Hay
coincidencias en lo criterios? Este estudio es importante porque nos ayudará a saber si es
pertinente tomar en cuenta las interpretaciones de distintos evaluadores para tomar una
decisión sobre el resultado de un candidato. Además, que no existe un estudio similar así en el
Perú lo cual es un aporte.
El test de Wartegg (WDCT) fue creado por Erig Wartegg. En principio dicho autor
adoptó una postura psicoanalítica; sin embargo, también fue cercano a la filosofía china,
específicamente al I ching, el cual es un método que fue usado para leer la fortuna y la
personalidad que consiste en ocho trigramas o patrones de tres líneas. En ese sentido, se puede
especular que los trigramas del I ching se encuentran presentes en algunos de los estímulos
que usó Wartegg en la elaboración de su prueba de personalidad (Roivainen, 2009).
Otro de los enfoques presentes en el test de Wartegg es la psicología Gestalt, esta
propone que la acción principal de psique humana es holística por lo que es difícil estudiar la
psicología de una manera mecánica, dividiendo una entidad psicológica compleja en partes
más simples. En este sentido, el aporte gestáltico al Wartegg pareciera hallarse en las teorías
de la percepción que se desarrollaron en dicha escuela. Al respecto, uno de los más
importantes representantes gestálticos, Wertheimer, introdujo el concepto de Prägnanz en
1914. Se prefieren las figuras regulares, ordenadas, simplistas y simétricas como también
complejas y desorganizadas. Ambas posturas se popularizaron en Alemania después de la II
Guerra Mundial (Harrington, 1996 citado por Roivanen, 2009).
12
En resumen, las bases teóricas del Wartegg se centran en filosofia de Keyserling
basadas en el misticismo y la teosofía. Teorías psicológicas por parte de autores como Carl
Jung, Rabindranath Tagore y Vassily Kandisky. Además de la psicología Gestalt y
psicoanálisis. Cómo se evidencia los indicadores de confiabilidad y validez no fueron lo más
importante a la hora de desarrollar esta prueba.
Este test está compuesto por ocho cuadrados conformados por estímulos no
estructurados que el evaluado debe completar sin un orden establecido y que tienen como
objetivo comprender la estructura básica de la personalidad. En ese sentido, las respuestas de
los sujetos a prueba son consideradas solamente en su dimensión expresiva y proyectiva más
no en sus habilidades artísticas. Para ello, el autor elaboró un esquema tipológico de 4
funciones compuesta por las dimensiones básicas tradicionales: Emoción, imaginación,
intelecto y control, dividendo cada uno de estas funciones en dos aspectos o características
más o menos opuestos (Diagnóstico de camadas WZT de Erihg Wartegg, 1987).
En torno a la primera de estas funciones, la emoción, se entiende que los aspectos
vinculados a ésta pueden moverse desde un punto de retraimiento hasta un extremo de
expansión lo cual configura personalidades introvertidas y extrovertidas respectivamente. El
individuo que se caracteriza con una emoción retraída o introvertida se orienta más a la
reflexión interna y no hacia el mundo que le rodea, tiende a ver cosas a través del lente de sus
actitudes y predisposiciones, además suele ser bastante sensible y se puede dejar abatir con
facilidad por la depresión. Mientras que el individuo de emoción expansiva se orienta al
mundo exterior relacionándose fácilmente con personas, suele ser amable y alegre, lo cual
13
hace contactos con facilidad, tiene intereses variados y hasta pueden llegar a ser superficiales
lo cual obstaculiza su eficiencia y realización (Diagnóstico de camadas WZT de Erihg
Wartegg, 1987).
Las configuraciones de la función imaginación describen al tipo con imaginación
combinatoria como aquella persona que extrae su material directamente del ambiente, lo
organiza de acuerdo a patrones objetivos y produce formas que se ajustan al mundo de la
experiencia sensorial. Esa clase de imaginación se basa esencialmente en la percepción de la
realidad visible y en la orientación para ella. Mientras que el tipo con imaginación creadora se
caracteriza por el contacto lábil con la realidad objetiva y también por las preferencias de
construcciones abstractas o por símbolos emocionales, fisiológicos o místicos (Diagnóstico de
camadas WZT de Erihg Wartegg, 1987).
El tipo intelecto práctico identifica a los individuos que operan principalmente por
percepción y observación, se caracterizan por tener conciencia clara, pensamiento ordenado y
expresión directa, trazos de personalidad que son considerados como concretos y positivos.
Cuando tiene la inteligencia dentro de los patrones medios presenta una formación intelectual
vagamente racionalista, sin espíritu práctico y distante de la realidad (Diagnóstico de camadas
WZT de Erihg Wartegg, 1987).
La actividad dinámica incluye todas las formas y grado de energía motora, desde el
simple movimiento hasta la impulsividad. Generalmente los individuos que se caracterizan por
la actividad dinámica son personas emprendedoras, auto confiadas, entusiastas; llegando
muchas veces a ser apasionados o irritables. Por otro lado, el tipo de actividad controlada se
14
caracteriza principalmente por la firmeza en la toma de decisiones y por la consistencia de
conducta, planea cuidadosamente sus actos antes de actuar y continúa reflexionando sobre
éstos posteriormente a su realización. En virtud de su control y de su cautela es casi siempre
exacto y fidedigno en sus opiniones y debido a su tenacidad tiende a realizar sus objetivos
pese a encontrarse con muchos obstáculos. Su atención es concentrada al mismo tiempo que
necesita de tranquilidad y de regularidad para desempeñar sus actividades, su comportamiento
es casi siempre consistente, uniforme y calmado. Entretanto, cabe resaltar que su
concentración puede eventualmente evoluir para la fijación, su control para la inhibición y
compulsividad, y su tenacidad para la perseverancia si se trata de un individuo
intelectualmente menos diferenciado (Diagnóstico de camadas WZT de Erihg Wartegg, 1987).
A nivel estructural, cada uno de los estímulos que se muestran en el test se centra en
aspectos específicos de la evaluación de la personalidad. Así, el primer estímulo mide la
centralidad, el segundo la vitalidad, el tercero la direccionalidad, el cuarto la
estabilidad/pesadez, el quinto la contraposición/superación, el sexto la síntesis/unión, el
séptimo la delicadeza/amabilidad y finalmente el octavo el redondeo/cierre (Crisis & Dentali,
2016).
Respecto a la ejecución de los campos, la persona evaluada sigue un orden propio en
los diseños que reflejan sus características personales. De esta forma el análisis secuencial del
test revela el perfil diagnóstico por los campos preferidos: primer y segundo diseño ejecutado
frente a los campos séptimo y octavo que remarcaron las dificultades del individuo o de menos
interés en la vida. Junto a ello se solicita al sujeto que identifique el diseño que más y el que
menos le gustó, el que le pareció más fácil y el más difícil de hacer. Con las respuestas
15
obtenidas se puede aproximar a cierto nivel de coherencia intrapsíquica, la cual es
fundamental para conocer el equilibrio emocional (Diagnóstico de camadas WZT de Erihg
Wartegg, 1987).
Una característica peculiar de la prueba de Wartegg es que, en contraste con su
popularidad, existe una falta de investigación sobre la prueba. Los resúmenes de PsycInfo
listan varios miles de estudios sobre el Rorschach, mientras que solo se pueden encontrar 88
estudios para El WZT. Esta cifra evidencia la escasa investigación sobre el WZT en los
últimos años aun cuando en la actualidad esta prueba goza de una importante popularidad
sobre todo en el área clínica. Sin embargo, su uso actual en el campo de la psicología
organizacional trae nuevas interrogantes acerca de la vigencia y el contexto de la prueba con
especial énfasis en profundizar en las características psicométricas del test (Roivainen, 2009).
Así, en relación a la validez del instrumento, Rodríguez, Primy y Koich (2007),
realizaron una investigación para evaluar dicha característica psicométrica en el Wartegg, para
lo cual utilizaron el criterio externo, en correlación con los resultados de las pruebas 16PF y el
Bpr5. Para ello compararon estos 3 instrumentos en un grupo de 121 participantes con edades
que iban de los 16 a 65 años de ambos sexos. Sin encontrar correlaciones significativas entre
dichos instrumentos, aunque obteniendo algunas correlaciones coherentes y otros no tan
coherentes con otras interpretaciones del Wartegg. Las conclusiones de este estudio sugieren
que no hay evidencia rigurosa para usar el Wartegg de forma profesional.
En el caso de, Soilevuo y Gronerød (2010) indagaron en torno a los ciertos aspectos de
la validez de dicho instrumento a partir de determinar si los dibujos grandes en el Wartegg son
16
sinónimo de expansión o simplemente indican habilidades de dibujo en el evaluado,
encontrando una fuerte correlación con lo segundo, sin dejar de lado que se debe seguir
investigando bajo otros parámetros.
Para hacer más complejo el panorama, en el Perú la mayoría de estudios psicométricos
se orientan a la validez y confiabilidad o adaptación de escalas y pruebas de este tipo, por lo
que existe escasa investigación respecto a pruebas proyectivas.
Se aprecia que, aun cuando existen pocos estudios sobre la validez y confiabilidad del
Wartegg contextualizados en el ámbito laboral, es necesario tener una medida de la validez y
confiabilidad de los resultados que permitan asegurar el empleo de una herramienta que
cumpla el propósito para el que fue diseñado. Sin embargo, la producción científica es una
deuda pendiente en nuestro medio y la investigación psicométrica ahonda en dicho déficit. No
obstante, el trabajo de Reynaldo Alarcón sigue siendo un importante referente en este ámbito
ya que se ha encargado de estandarizar pruebas como el Test de Madurez Mental de
California, el Test Colectivo de Inteligencia PV y el Inventario de Personalidad de Hugh M.
Bell (León, 2009).
Otros notables esfuerzos son los que realizaron Sánchez, Martínez, Niño de Guzmán y
Argumedo (2002) al adaptar el Test de Millón para la población peruana. No obstante, una
revisión al portal web de la Revista Peruana de Psicometría evidencia que la mayoría de
investigaciones de este tipo se centran exclusivamente en el área de la psicología educativa y
clínica. Dicho de otra forma: no hay evidencia de trabajos orientados hacia el área
17
organizacional. Además, las publicaciones de investigación se encuentran descontinuadas ya
que solo existen desde el año 2008 hasta el 2013.
Al respecto, se distinguen las pruebas psicométricas, las cuales se caracterizan por el
énfasis puesto en conseguir altos niveles de validez y confiabilidad, alcance inferencial y
límites interpretativos; y las pruebas de carácter proyectivo, las mismas que se caracterizan por
recopilar información de la persona y medir formación de conceptos, percepción, abstracción
y generalización. Aun cuando en este último grupo de pruebas no suele enfatizarse aspectos
como validez y confiabilidad, existen estudios que indagan sobre ellos en pruebas tales como
el Test de la Figura Humana de Machover, el Test de Wartegg y el Psicodiagnóstico de
Rorschach. Incluso algunos de estos instrumentos cuentan con muestras representativas de la
población, mientras otros solo se limitan a estudios poblacionales específicos o simplemente
traducciones (Román, 2002).
Como se ha mencionado en párrafos anteriores, las pruebas proyectivas tienen
popularidad en la práctica de la psicología clínica, pero pocos son los trabajos dedicados a la
estandarización y validación de los mismos que estén a la altura del trabajo de Exner con el
Psicodiagnóstico de Rocharsh, el cual ha asegurado su utilidad (Stagner, 1984). Por otro lado,
la evaluación psicológica, al margen del ámbito en el que se realice, tiene a su disposición una
serie de instrumentos, cada uno de ellos con su ventajas e inconvenientes, que pueden ser
aplicados en conjunto o de manera complementaria, pero definiendo sus propiedades
psicométricas como necesario requisito antes que intentar determinar qué método de
evaluación es el más exacto (Ganellen citado por Rodriguez, 2007).
18
En ese sentido, el valor de una perspectiva psicométrica lejos de oponerse a la
naturaleza proyectiva de un instrumento puede constituirse en un factor complementario. Así,
determinar la validez y la confiabilidad en un instrumento como el Test de Wartegg se
constituye, sin lugar a dudas, en un importante aporte a nuestro campo profesional. Lo curioso
es que la mayoría de validaciones y adaptaciones se enfocan en pruebas psicométricas y no en
pruebas proyectivas, lo cual ha animado el debate sobre los métodos proyectivos, centrándose
en una crítica en torno a sus características psicométricas (Lilienfeld, Gershon, Duke, Marino
& Waal, 1999, citado por Sanchez & Pardo, 2013).
La forma como se conceptualiza la confiabilidad en instrumentos con enfoques
cuantitativos asume la posibilidad de replicabilidad, la misma que, desde un enfoque
cualitativo, es altamente cuestionable ya que se reconoce que la realidad y que el investigador
o evaluador es un mediador entre el conocimiento que se obtiene a través del instrumento y la
realidad social. Por otro lado, es necesario reconocer que la confiabilidad asegura una base
sólida de los datos obtenidos. Así, una forma a través de la cual se puede cumplir con brindar
algún nivel de confiabilidad para un instrumento proyectivo es la metodología interjueces, en
las que no hay que usar el porcentaje de acuerdo como índice de confiabilidad, porque el
mismo no ofrece ninguna corrección que tenga en cuenta las chances para obtener resultados
similares al azar. Entre los más conocidos se encuentran la pi (π) de Scott y el alpha (α) de
Krippendorff. En caso de que hubiera 3 o más jueces, se tendría que usar la kappa de Fleiss
emparentado con la pi de Scott y el k de cohen (Cortez, 1997; Dubé, 2008).
19
Otro de los aspectos que se incluyen en los estudios psicométricos y que guarda
estrecha relación con la propuesta del presente trabajo, está centrado por el uso de tests
psicológicos creados en otros contextos culturales. Esta práctica es habitual en países que
tienen escaso desarrollo científico como en las regiones de Latinoamérica y África. La
aplicación de algún test en un contexto cultural diferente al que fue creado tiende a causar
diferentes problemas: como el empleo de giros lingüísticos propios de un determinado
contexto, la familiaridad con el ítem y las diferentes características que poseen las muestras de
estandarización; todo lo cual terminaría en generar diferentes sesgos en la medición
transcultural de constructos psicológicos. Esto se contrapone a la exigencia por demostrar la
universalidad de las teorías psicológicas y su vigencia en otras culturas (Muñiz, Elosua y
Hambleton, 2013).
Así, el dilema validez-diversidad ha sido un tema dominante tanto en la investigación
como en la práctica de la selección de personal. Esto debido a que algunos instrumentos de
selección presentan grandes diferencias étnicas en sus puntuaciones (diferencias culturales que
hacen que los integrantes de un determinado grupo se sientan identificados entre sí a partir de
comportamientos y prácticas). Al respecto; los científicos intentan desarrollar estrategias que
reduzcan estas diferencias a partir del empleo de alguna de las siguientes estrategias: usar
medidas de capacidades cognitivas alternativas, emplear simulaciones, utilizar métodos
estadísticos para combinar las medidas predictores y de criterio, reducir la varianza para los
predictores irrelevantes para el criterio, fomentar reacciones positivas en los candidatos y
facilitarles preparación y posibilidades de practicar (Lievens y Druart,2013).
20
En el caso del Test de Wartegg existen importantes esfuerzos como el de Gardziella
(1985), quien propuso una nueva visión para la interpretación de los datos obtenidos a partir
de este instrumento; sin embargo, al ser comparado con otros tres tipos de evaluación de la
personalidad, se encontró muy poca relación por parte de la interpretación planteada por este
autor, sugiriendo que dicho manual debe actualizarse (Soilevuo y Gronerod, 2010).
Así, se torna necesario investigar sobre el Wartegg, identificar los fundamentos
teóricos, el rigor metodológico y los criterios de validación tanto para darle rigor y solvencia a
dicha herramienta de evaluación como para evitar que el uso intuitivo genere interpretaciones
vagas o desde una psicología del sentido común que restan el valor y desvíen por completo el
propósito para el que fue construido (Sánchez y Pardo, 2013). Continuar empleando dicho
instrumento sin el rigor necesario podría llevar a que los psicólogos lleguen a conclusiones
erróneas o formulen hipótesis diagnósticas sin sustento evaluativo científico.
El presente trabajo se propone identificar los niveles de confiabilidad del test de
Wartegg en un grupo de candidatos en una empresa de servicios de call center. Para ello, se
determinará el nivel de confiabilidad del test de Wartegg a través de un proceso evaluación de
la consistencia interjueces.
21
Método
Tipo y diseño de investigación.
La presente investigación es de tipo instrumental, la cual se define como aquellos
trabajos que centran su interés en el diseño, adaptación o estudio de las propiedades
psicométricas de pruebas y técnicas (Montero & León, 1992). En este sentido, el centro de
interés del presente trabajo es precisar las cualidades psicométricas del Wartegg, a partir del
cual se puede discutir la pertinencia de incluir esta herramienta en el acervo psicológico.
Participantes
La selección se hizo mediante el muestreo no probabilístico, buscando personas
dispuestas darnos información mediante las indicaciones de la prueba y los propios resultados.
El muestreo utilizado fue el de por conveniencia. Esta se basa en una muestra de
voluntarios, y se utiliza si el investigador necesita que los posibles participantes se presenten
por voluntad propia. Este muestreo es fácil y eficiente pero no es uno de los preferidos debido
a que en estos estudios la clave es sacar la mayor cantidad posible de información de los pocos
casos de la muestra, y el método por conveniencia puede no suministrar las fuentes más ricas
en información. Es un proceso fácil y económico que permite pasar a otros métodos a medida
que se colectan los datos (Salamanca & Crespo, 2007).
Para ello, se tomaron como criterios de inclusión los siguientes: Adultos jóvenes entre
18 y 44 años que busquen por automotivación un puesto laboral adentrándose en un proceso
de selección de personal. Tras ello, se conformó un grupo de 100 participantes conformado
por 54 mujeres y 46 hombres, en su mayoría de estado civil soltero pertenecientes a diversos
distritos de la capital, pero con mayor presencia de los distritos de Ate, Santa Anita y San Juan
22
de Lurigancho. Respecto al estado de civil de la muestra fue conformada por 93 personas
solteras, 2 convivientes, 4 casados y 1 divorciado.
Instrumento
El instrumento que es objeto del presente trabajo es el Test de Wartegg. El mismo fue
creado por Ehrig Wartegg basándose en la teoría gestáltica y otras pruebas predecesoras. Tiene
como objetivo explorar la estructura de la personalidad. La consigna requiere completar un
dibujo de la forma que desee con un lápiz, sin reglas ni normas para su realización y tomando
como punto de partida un dibujo inicial pre-establecido. Al término de la evaluación se le
solicita que con un número haga mención a los cuadros escriba al pie de la misma que quiso
dibujar y cuáles dibujos le parecieron mejor acabados y cuáles menos.
Cada uno de los 8 cuadrantes de 4 x 4 cm. está definidos por un marco grueso de color
negro, insertado sobre un fondo blanco que tiene como función principal la activación de la
proyección psicológica en el sujeto.
Para su análisis e interpretación, el autor elaboró un esquema tipológico de 4 funciones
compuesta por las dimensiones básicas tradicionales: Emoción, imaginación, intelecto y
control, dividendo cada uno de estas funciones en dos aspectos o características más o menos
opuestos (Diagnóstico de camadas WZT de Erihg Wartegg, sf).
23
Procedimiento
La elección de la muestra se dio dentro de una empresa que brinda servicios de call
center, antes de la evaluación se dejó en claro a los posibles participantes que era una
investigación para una tesis de titulación en psicología, preguntando quienes tendrían la
disponibilidad e interés de participar siendo evaluados con la prueba. Las personas que
accedían, se les hacía firmar, además de la prueba, una ficha de consentimiento informado, se
les pidió solo poner su edad, explicando anonimidad de la prueba, en el cual se mencionó que
los datos proporcionados y los resultados solo serán para uso pertinente de esta investigación,
posteriormente dejando abierta la posibilidad de ser contactados para fines internos de esta
tesis. Firmando dicho acuerdo por parte de los participantes en mención.
Se procedió a dar las instrucciones de la prueba antes de empezar, se explicó
detalladamente cómo se deben completar los 8 cuadrados dejando en claro que no deben dejar
ningún dibujo sin terminar. Una vez terminados los diseños, se les pidió que escriban los
títulos de los diseños o el nombre del dibujo, para saber qué dibujaron. Culminaron la prueba
indicando qué diseño les gusto más, menos, cuál les pareció fácil y difícil.
Así se pudo completar la muestra, se revisó que las pruebas estuvieran completas.
Posteriormente se buscó tres psicólogos que laboren actualmente en selección de personal y
que usan la misma versión del manual Test de Wartegg constantemente en los procesos de
selección que manejan. Se les pidió previamente que interpretaran, por separado, una prueba
para tener en claro los criterios que tenían por cada cuadrante entre los 3 jueces, facilitando
poder hacer las interpretaciones e informes asegurando que no haya ningún sesgo en cuanto a
la interpretación. Luego de negociar con ellos y poner plazos respecto a la entrega de
informes, donde se elaboró un esquema tipo resumen, por cada dimensión que la prueba mide,
en la cual por cada Wartegg corregido se pudiera ver la interpretación de cada uno de los 8
cuadrados. Además, se les entrego un único manual. Se elaboró un cuadro de confiabilidad
donde se colocaron los resultados de las interpretaciones y se encasillaron respecto a los 4
24
conceptos que mide el Wartegg (Emoción, Imaginación, Intelecto y Actividad), finalmente
para comparar resultados.
Esto se hizo con el fin de comparar resultados entre los 3 jueces u observadores y ver
si existen evidencias de confiabilidad.
Análisis de datos
Se usó el enfoque cualitativo para la confiabilidad mediante una tabla de concordancia
cruzando información de interpretaciones realizadas por 3 jueces observadores usando un
coeficiente de confiabilidad. Luego de pensar en varios posibles coeficientes, se llegó a
seleccionar el análisis bajo Kappa de Light, en tanto este tiene mayor reconocimiento entre los
investigadores (se usó el lenguaje de programación R, paquete "irr"). Este Kappa se interpreta
de la misma forma que el de Fleiss y cuenta con mayor reconocimiento entre investigadores
interpretándose de la misma manera. Para obtener el coeficiente de confiabilidad se usó un
módulo de SPSS en la página de la comunidad de IBM (Hallgren, 2012).
25
Resultados
A continuación, se presentan los resultados obtenidos de los análisis de confiabilidad
cualitativa de los 100 protocolos del Test de Wartegg. Para evitar el uso de diversos criterios
en la interpretación se empleó el manual sobre Test de Wartegg (Diagnóstico de Camadas,
1991).
En torno a la confiabilidad del instrumento, este fue calculado según el grado de
acuerdo entre observadores. Se encontraron solo 5 casos en los cuales los tres jueces
concordaron en sus diagnósticos en las 4 dimensiones que componen el Wartegg,
constituyéndose en el punto más alto de coincidencia.
Un peldaño por debajo, se observaron 18 casos en los cuales, 3 jueces coincidían en 3
de las 4 dimensiones, mientras que se observaron 38 casos en los que se produjeron
coincidencias en 2 de las 4 dimensiones. En el primer caso, la dimensión que generaba
discrepancia fue actividad (9), mientras que en el segundo caso fueron: Imaginación (22) y
Emoción (22). Esto se puede apreciar en la tabla 1 y 2.
Tabla 1
Discrepancias de 3 jueces en 3 de 4 dimensiones
Dimensión Emoción Imaginación Intelecto Actividad
3 jueces 7 5 1 9
26
Tabla 2
Discrepancias de 3 jueces en 2 de 4 dimensiones
Dimensión Emoción Imaginación Intelecto Actividad
3 jueces 22 22 18 17
Cuando se identifican las coincidencias en 2 de los 3 jueces entre las 4 dimensiones
evaluadas con el Wartegg se obtienen 32 casos. Mientras que cuando este nivel de
coincidencia se da en 3 dimensiones el número de casos es 13. En este tipo de casos la
dimensión que presenta mayor grado de acuerdo fueron Intelecto (14) e Imaginación (15)
coincidencias, mientras que la dimensión con mayor discrepancia fue Emoción con 7 casos.
Esto lo podemos apreciar en las tablas 3 y 4.
Tabla 3
concordancias entre 3 jueces en solo 3 dimensiones
Dimensión Emoción Imaginación Intelecto Actividad
3 jueces 6 14 15 7
Tabla 4
Discrepancias entre 3 jueces en solo 3 dimensiones
Dimensión Emoción Imaginación Intelecto Actividad
3 jueces 7 0 0 6
En la tabla 5 se observan las veces en las que cada dimensión del Wartegg mostró
discrepancias en todas las dimensiones.
Tabla 5
Discrepancias Totales de 3 jueces entre 4 dimensiones
Dimensión Emoción Imaginación Intelecto Actividad
3 jueces 62 47 54 51
27
Para hallar la confiabilidad inter-jueces, a un nivel de acuerdo en los 3 jueces entre las
100 pruebas, se procedió a usar el Kappa Light, el cual a comparación de Kappa de Fleiss,
cuenta con mayor reconocimiento entre investigadores y se interpretan de la misma manera.
Para obtener el coeficiente de confiabilidad se usó un módulo de SPSS en la página de la
comunidad de IBM.
En la dimensión D1 (Emoción) el Kappa fue igual a 0.107, en la dimensión
Imaginación D2 (Imaginación) el Kappa fue igual a 0.184, en la dimensión Intelecto D3
(Intelecto) el Kappa fue igual a 0.219 y en la última dimensión Actividad D4 (Actividad)
0.249.
Para la interpretación de dichos valores se cuenta con dos criterios: el elaborado por
Lands y Koch (1977) y el de Altman (1991). Aunque difieren en algunas etiquetas de criterio
coinciden al ubicar segmentos o rangos de valores, así como de un nivel moderado a partir del
valor .41, tal como se puede observar en la Tabla 6
Tabla 6.
Interpretación de Kappa Light
Landis & Koch (1977) Altman (1991)
< .00 Poor -
.00 - .20 Slight Poor
.21 - .40 Fair Fair
.41 - .60 Moderate Moderate
.61 - .80 Substantial Good
.81 - 1 Almost Perfect Very Good
A partir de dichos criterios se puede observar, que los resultados obtenidos para cada
dimensión no son significativos ya que se ubican por debajo del índice de Kappa menor a .30,
lo que indicaría poco acuerdo entre los jueces.
28
Discusión
A partir de los datos presentados en el capítulo anterior se discute si la confiabilidad
del test de Wartegg justifica el uso del instrumento en procesos de selección, al igual que otras
pruebas proyectivas como el Machover. En ese sentido, se entiende que actualmente el
Wartegg tiene un gran impacto dentro de dichos procesos al punto de constituirse en un apoyo
fundamental que complementa otras técnicas tales como la entrevista laboral por competencias
y que deviene en decisiones que llevan a contratar o no a un candidato.
El Test de Wartegg de 8 campos suele interpretarse de forma indiscriminada, lo cual ha
generado que se obtenga información a partir de interpretaciones vagas, incluso prestándose a
predicciones de tipo no psicológico lo cual ha llevado a cuestionar si su uso se ajusta al
objetivo con el que esta prueba fue creada. En ese sentido, es importante resaltar que el
Código de Ética del Colegio de Psicólogos del Perú señala en sus artículos 53 y 57 del título
VII que el psicólogo debe demostrar que la validez de los programas y procedimientos usados
para la interpretación de pruebas psicológicas (test) se basa en evidencia apropiada como
también la responsabilidad de tomar decisiones sobre individuos, basándose en resultados de
pruebas psicológicas (test), teniendo una adecuada comprensión de los problemas de
medición, validez y confiabilidad.
Actualmente en nuestro contexto no existe un organismo que administre y actualice los
test, indicando qué pruebas deben usarse en selección y cómo emplearlas. Tampoco hay
capacitaciones por parte de profesionales altamente calificados para el mismo uso, en este
caso, sobre las técnicas proyectivas. Existen en el mercado cursos que se emplean para la
enseñanza de pruebas, pero no se basa en acumular o sistematizar el conocimiento entre
profesionales de manera práctica, por lo contrario, estas tienden a orientarse a lo lucrativo.
Tampoco existe estudios sobre ésta prueba como lo enfocamos en esta Tesis, lo cual es un
aporte al conocimiento en practicante que se viene dando.
29
Al revisar las respuestas de los participantes, se encontraron solo 5 casos de
coincidencias exactas sobre los resultados entre las interpretaciones individuales que los 3
jueces realizaron.
Es importante preguntarnos por qué tan pocas coincidencias, y por qué las
interpretaciones no permiten observar la misma información entre todos los jueces. Podría
radicar el problema en relación a lo obtenido, a pesar del uso del mismo manual por parte de
los evaluadores, indicando que el constructo es muy complejo, lo cual podría explicar las
diferentes vistas de los jueces.
Adicionalmente, los resultados en los que 2 de los 3 jueces coincidieron de forma
limitada en las 4 tipologías (emoción, imaginación, intelecto y actividad). Este hallazgo nos da
indicios de lo que ocurriría al guiarnos de los resultados del WZT en un contexto de selección
real, ya que, sus resultados no serían tan exactos como se estipula en la práctica.
En los resultados generales sobre 2 de las 4 (dimensiones), 2 jueces coincidieron entre
las 4 tipologías en solo 39 casos. Aún aquí encontramos más posible evidencia que apunta a
que la prueba no mide exactamente las dimensiones que propone de manera precisa. Mientras
que en los generales de 3 de 4 (dimensiones) coincidencias por juez fueron solo de 16. Al
parecer mientras más se trata de encontrar coincidencias entre mayor número de dimensiones,
en esta investigación, se revelan mayores discrepancias entre las mismas. ¿Por qué hemos
obtenido estos resultados? ¿Es este, un indicio de que la prueba no posee una confiabilidad
consistente entre diferentes evaluadores? Si esto fuera correcto, ¿sería recomendable su uso en
el ámbito de la selección de personal? O sería conveniente incentivar un mayor número de
investigaciones locales sobre este tema.
Estos resultados son similares a los que encontraron Rodríguez, Primi y koich (2007)
en la cual no encontraron correlaciones significativas comparando el Wartegg con otros Tests
psicométricos indicando que existen pocas evidencias para usar el Wartegg en el ámbito de
selección de personal.
30
Reiteramos que en esta investigación se repartió un único manual para las 100
interpretaciones realizadas por parte de los 3 jueces que laboran en el área de selección.
Tomando en cuenta la complejidad del constructo planteado, no parece práctico describir la
personalidad es solo 4 segmentos opuestos es una idea limitada de cierta forma, debido a que
actualmente existe un debate entre teóricos de la personalidad y distintas corrientes.
Puntualizando este aspecto la forma en que Jung (1941) consideró que se activaban los
arquetipos era, precisamente, obedeciendo dos principios clave en su teoría: la compensación
y el equilibrio de los opuestos. El primero lo emplea para referirse a la acción homeostática
del inconsciente, el cual, a semejanza del cuerpo humano, busca un equilibrio siempre en la
psique del sujeto.
Por ejemplo, según Jung, una persona sumamente introvertida puede buscar
compensación inconsciente en sus sueños al verse como alguien extrovertido. En este sentido,
el equilibrio de los opuestos es un principio que Jung deriva de la compensación, implicando
polaridades y dicotomías en cada aspecto de la personalidad. De esta manera, ambos
principios explican la razón por la cual se manifiestan unos arquetipos y no otros, es decir, la
manifestación de los arquetipos está en función de las necesidades personales y la situación
psicosocial del sujeto. Una vez más, la función de los arquetipos es compensatoria.
(Estramiana, Galdos y Ruiz, 2007). Quizá la función compensatoria, por su dinamismo sea la
explicación del por qué el constructo es complejo de ser captado a comparación de otras
pruebas que cuentan con rasgos más estables.
Estos resultados pueden tener relación con los de Soilevuo y Gronerød (2010) en el
cuál investigaron si los dibujos grandes en el Wartegg eran sinónimo de mayor autoestima,
energía o simplemente eran habilidades en el dibujo del evaluado, encontrando coherencia con
los segundo quizá es un factor aislado que influyo en el por qué los jueces no encontraron las
mismas interpretaciones. Ya que, en el manual se estipula lo contrario, que lo dibujos grandes
son por expansión
31
Según Roivainen (2009) existen poco estudios sobre el Wartegg además de diversos
manuales, por lo cual aún no ha habido un consenso entre investigadores y usuarios sobre que
manual está más actualizado o validado lo cual es importante resaltar y poner a prueba la
versión usada en esta investigación nos ayuda a descartarla o ponerla en observación en el
contexto en el cual se está empleando actualmente.
Unas de las limitaciones del estudio fueron la manera en la cual los profesionales que
trabajan en selección pueden llegar a sesgar cuando se trata de entrevistar a un candidato y ver
una prueba como el Wartegg antes de hacerlo. Lo cual ya genera un prejuicio con los
resultados de la interpretación que ve influyendo en la toma de decisión. Por lo cual el uso de
las pruebas psicológicas depende no sólo de la calidad de instrumento, si no del conocimiento
y competencia del profesional que la usa. Es importante una formación sólida en evaluación
psicológica, sostenida por la enseñanza que privilegie la profundización teórica en las
actividades prácticas e investigativas.
En el segmento organizacional existen más estudios en relación a cómo evaluar la
personalidad de una forma psicométrica a comparación de las pruebas proyectivas que son
usadas con el mismo fin, pero que no presentan tantos estudios de validez y confiabilidad,
finalmente usándose ambas para predecir el desempeño o la personalidad del candidato a un
cargo específico de trabajo.
La naturaleza de estos instrumentos es cualitativa y de respuestas abiertas, para
encontrar la confiabilidad se usó el criterio de jueces expertos, cabe resaltar que la única
prueba proyectiva que ha pasado este proceso exitosamente es el Rorchach con un 84 y 91%
este caso es único en su género hasta el momento (Sabogal, 2004).
Se sugiere que en la práctica se puedan usar otros instrumentos comprobados
científicamente como el Inventario del Trabajador Productivo y Confiable (ITPC) o Employee
Reliability Inventory ITPC o ERI es una prueba que se ha aplicado más de 3 millones de veces
32
en el mundo, y ha sido ampliamente validada en países de habla hispana, y adecuada
culturalmente a países de América Latina y España.
Podemos ver que existen diversos estudios sobre el Wartegg y la situación de su actual
uso, estos predominan con mayor fuerza en Europa, donde se ven los esfuerzos de crear o
mejorar interpretaciones, a pesar de esto, al parecer existe poco interés de parte de los
profesionales en Latinoamérica de informarse más a fondo mejorando los métodos de
evaluación, cuestionando y poniéndolos a prueba. Actualmente existen interpretaciones son
hechas en otros contextos, y para que sean válidos tendría que adaptarse dicha prueba también
al nuestro o replicar el mismo método de interpretación, durante el desarrollo de este estudio
se encontró la oportunidad alertar a futuros investigadores que puedan tomar en cuenta otros
aspectos complementarios que en este estudio no se pudo tocar como la validez de la prueba.
33
Referencias
Alonso, P., Moscoso, S., & Cuadrado, D. (2015). Procedimientos de selección de personal en
pequeñas ˜ y medianas empresas españolas. Revista de Psicología del Trabajo y de las
Organizaciones, 1,1–12. Recuperado de:
http://scielo.isciii.es/pdf/rpto/v31n2/v31n2a03.pdf
Atwood, J. D., & Maltin, L. (1991). Putting Eastern philosophies into Western psychotherapies.
American Journal of Psychotherapy, 45, 368–382.
Cloninger, S, (2003), Teóricas de personalidad, México, Pearson Educación.
Cohen, R. J., & Swerdlik, M. (2001). Pruebas y evaluación psicológicas: introducción a las
pruebas y a la medición (4ta edición). México DF: Mc Graw-Hill, Interamericana S.A.
Corral, Y. (2016). Validez y Fiabilidad en investigaciones cualitativas. Arjé, (11), 196-209.
Cortez, G. (1997). Confiabilidad y Validez de estudios cualitativos. Nueva Época, (1), 77-88.
Crisi, A. (2009). Nuevo método de interpretación del test de wartegg (WZT) en el ámbito clínico
y de selección de personal. Psicodiagnosticar, 19, 57-70.
Crisi, A., & Dentali, F. (2016). The Wartegg drawing completion test: inter-rater agreement and
criterion validity of three new scoring categories. International Journal of Psychology
and Psychological Therapy, 16, 83-90.
De Soete, B., Lievens, F. & Druart, C. (2013). Strategies for dealing with the diversity-validity
dilemma in personnel selection: Where are we and where should we go?. Journal of
Work and Organizational Psychology, 29, 3-12.
Dubé, E. (2008). Evaluación de acuerdo interjueces en investiación clinica: Breve intruduccion
a la confiabilidad interjueces. Revista Argentina de Clínica Psicológica, (17), 75-80.
Estramiana, J. L. Á., Galdós, J. S., & Ruiz, B. F. (2007). De Moscovici a Jung: el arquetipo
femenino y su iconografía. Athenea Digital: Revista de Pensamiento e Investigacion
Social, 11, 132-148.
Flórez, J. & Salas, E. (2011). Industrial and Organizational Psychology in Latin America: The
Peruvian Story, 1, 2.
Gardziella, M. (1985). Wartegg-piirustustesti: Ka¨sikirja [The Wartegg Drawing Test: A
handbook]. Jyvaskyla, Finland: Psykologien Kustannus Oy.
Gregory, R. (2001). Evaluación Psicológica. Historia, principios y aplicaciones (Sexta
edición). México: Editorial El Manual Moderno.
34
Hallgren, K. (julio, 2012). Computing Inter-Rater Reliability for Observational Data: An
Overview and Tutorial. Recuperado de:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3402032/
Hayes, A., & Krippendorff, K. (2007). Answering the call for a standard reliability measure for
coding data. Communitacion methods and measures, 1, 77–89. Recuperado de:
http://afhayes.com/public/cmm2007.pdf
Hernández, Y. (2009). Prácticas de selección de personal, un instrumento de dominación
socialmente aceptado. AD-minister, 14, 137-160.
Jung, C. G. (1941). Acerca del aspecto psicológico de la Core. En C. G. Jung. (2002). Los
Arquetipos y lo inconsciente colectivo. OC. 9. Barcelona: Trotta.
Schimdts, F. L., & Hunter, I. E. (1998). The validity and utility of selection methods in personnel
psychology: practical and theoretical implications of 85 years of research findings.
Psychology Bulletin, 124(2), 23-38.
Landis, R., & Koch, J. (1977). The Measurement of Observer Agreement for Categorical Data.
Biometrics, 33, 159–174. Recuperado de:
https://pdfs.semanticscholar.org/7e73/43a5608fff1c68c5259db0c77b9193f1546d.pdf
León, F. (2013). Las psicologías del área social-organizacional en el Perú: 2003-20121. Revista
de Psicología, 31, 2.
León, R. (2009). La contribución de Reynaldo Alarcón al desarrollo y fortalecimiento de la
psicometría en el Perú. IIPS, 12, 239 - 250.
Lévano, R. (2010). Variables Grafológicas, Rasgos de Personalidad e Inteligencia, en procesos
de Evaluación y Selección de Personal (Tesis de pregrado). Universidad nacional mayor
de San marcos, Lima.
Leite, S. & Noronha, A. (2005). Instrumentos psicológicos utilizados en selección profesional.
De la Universidad de Chile, 1, 139-159.
Montero, I., & León, O. Clasificación y descripción de las metodologías de investigación en
Psicología. International Journal of Clinical and Health Psychology, 2(3), 503-508.
Muñiz, J., & Hambleton, P. (2013). Directrices para la traducción y adaptación de los tests:
segunda edición. Psicothema, 25, 151-157.
Nitis, T. (1989). Ego differentiation: Eastern and Western perspectives. American Journal of
Psychoanalysis, 49, 339–346
Padilha, S., Porto, A., & Zanchet, C. (2007). Instrumentos de avaliação psicológica: uso e
parecer de psicólogos. Avaliação Psicológica, 6(1), 69-76.
35
Rodríguez, C., Primi, R., & Koich, F. (2007). Validade do teste wartegg: carrelacao com 16PF,
BPR-5 e desempenho profissional. Evaluación psicológica, 6(1), 9-49.
Rodriguez, C. (2007). Personality and personality disorders assessment by means of
(Performacebased) projective thecniques. Clínica y salud, 18, 325-346.
Roivainen, E. (2009). A brief history of the Wartegg drawing test. Gestalt theory, 31, 55-71.
Roman, H. (S/F). El dibujo y otras pruebas proyectivas [Documento en pdf]. Recuperado de:
https://www.ramajudicial.pr/Miscel/Conferencia/PDF/8_HRoman.pdf.
Sabogal, L. (2004). Sabogal, L. F. (2004). Pruebas proyectivas: acerca de su validez y
confiabilidad. Duazary: Revista internacional de Ciencias de la Salud, 1(2), 134-138.
Salamanca, A., & Martín-Crespo, C. (2007). El muestreo en la investigación cualitativa. Nure
Investigación, 27(7), 1-4.
Salgado, J. A. (2005). Personalidad y deseabilidad social en contextos organizacionales:
implicaciones para la práctica de la psicología del trabajo y las organizaciones. Papeles
del Psicólogo, 26, 115-1.
Sánchez, M., & Ligia, P. (2012). Estudio psicométrico dela prueba figura humana. TELOS.
Revista de Estudios Interdisciplinarios en Ciencias Sociales, 14, 210 - 222.
Sanchez, O., & Pardo, C. (2013). Calidad psicométrica del Test de Wartegg versión 16 campos,
nuevas escalas y publicaciones de resultados para la aplicación e interpretación del test
en la población colombiana (Tesis de Bachiller). Universidad Católica de Colombia.
Soilevuo, J., & Grønnerød C. J. (2012). The Wartegg Zeichen Test: A Literature Overview and
a Meta-Analysis of Reliability and Validity. Psychological Assessment, 24, 476–489.
Soilevuo, J., & Grønnerød, C. (2010). Are large drawings signs of psychological expansion or
effects of drawing skills? A critical evaluation of Wartegg drawing size categories in a
Finnish sample. Scandinavian Journal of Psychology, 51, 63–67.
Techera. (2014). El Test de Wartegg en el ámbito laboral. Monografia, 1, 1-23.
Thorne, C., Sánchez, M., Martínez, P., Argumedo, D., & Niño de Guzman, I. (2002).
Adaptación del Inventario de Estilos de Personalidad de Millon en una población
universitaria peruana. Revista de Psicología de la PUCP, 20, 29-40.
Vallejo, M. (2015). Confiabilidad y validez de la investigación cualitativa. Revista Fedumar
Pedagogía y Educación, 2(1), 7-10.
Vergara, R. (2011). Buenas prácticas en el uso de test de selección de personal, vya consulting
group, 38.
Vives, M. (2006). Test proyectivos: Aplicación al diagnóstico y tratamiento clínicos. Barcelona:
Editorial.
36
Wartegg, E. (1987). Diagnóstico de Camadas – WZT. Florianópolis: Casa do Psicólogo.
Yuana, R., Harjunowibowo, D., Karyanta, N., & Wawan, C. (2018). Data Similarity Filtering
of Wartegg Personality Test Result using Cosine-Similarity. International Journal of
Recent Contributions from Engineering, Science & IT (iJES), 6(3), 19-28. Recuperado
de: https://online-journals.org/index.php/i-jes/article/view/9413