Comunidad de Práctica (COP) en Desarrollo Curricular UNESCOOIE
EForum Anual 22 noviembre 10 diciembre 2010
http://www.unesco.org/ibe/forum/
Desde el año 2005, la Comunidad de Práctica (COP) en Desarrollo Curricular de la UNESCO‐OIE lleva a cabo un e‐forum anual sobre temas clave en desarrollo curricular. El mismo ofrece una oportunidad única de llevar a cabo un diálogo abierto a nivel interregional y multi‐lingüístico entre los miembros de la COP, con el apoyo de expertos internacionales. El e‐forum, a través de este documento de discusión y una serie de preguntas semanales, busca estimular la reflexión y discusión, y hacer avanzar el debate sobre la base de una perspectiva interregional. Los participantes pueden contribuir en las 6 lenguas oficiales de la ONU y todos sus aportes serán traducidos al inglés. Los resultados de este e‐forum serán publicados y diseminados en un informe final. Finalmente, es importante que tenga en cuenta que el enfoque de la discusión de este año girará en torno a un tema sumamente relevante, y también controversial, que es el de la evaluación de las competencias de los estudiantes.
El rol de la evaluación como promotora del desarrollo de competencias de los estudiantes
Documento de discusión preparado por Hugo Labate1 con el apoyo de personal de la OIE
Braslavsky (1999) propone que los sujetos del siglo XXI deberán ser capaces de protagonizar un proceso hacia lo desconocido, de manejarse más con incertidumbres que con certezas, y que para construirse a sí mismos como sujetos requieren desarrollar competencia e identidad. En todo el planeta los educadores reconocen esta necesidad y se observan esfuerzos que buscan desarrollar las competencias de los estudiantes a través de la actualización de los curriculums y de la promoción de nuevas prácticas y materiales de uso en la enseñanza, pero frecuentemente hay una dimensión curricular poco revisada: la de la evaluación.
1 Hugo Labate es especialista en desarrollo curricular y en diseño y desarrollo de actividades para la construcción de capacidades para profesionales en el campo de la educación. Actualmente se encuentra trabajando como consultor para diversas organizaciones tales como la UNESCO‐OIE, UNICEF‐Argentina, y diversas universidades en América Latina.
¿Qué papel juega la evaluación en el desarrollo de competencias? Para evaluar competencias complejas, debemos observar evidencias de que los estudiantes pueden elegir y combinar varios procedimientos que han aprendido, de tal forma que sean capaces de resolver un problema nuevo de manera apropiada. La discusión que sigue destacará algunos de los desafíos que genera el hecho de identificar y poner en práctica modelos evaluativos capaces de promover el desarrollo de competencias y de la autonomía intelectual por sobre las respuestas automatizadas. Evaluación en el currículo Cuando se aborda el tema de la evaluación hay que tener en cuenta que se trata de un componente curricular de alta influencia. Como lo señala Boud (1995), los estudiantes pueden llegar a escapar con dificultad de los efectos de una mala enseñanza, pero no pueden escapar de los efectos de una mala evaluación; la modalidad de evaluación elegida puede tener más impacto sobre el aprendizaje que los propios materiales de enseñanza. Crossouard (2007) nos recuerda resultados de la investigación que señalan que la evaluación educativa tiene alto impacto en la formación de la identidad de los sujetos, ya que la calificación que proporcionan las escuelas como instituciones sociales establecidas contribuye a desarrollar nuestra autoestima (o lo contrario) y a fortalecer una autoimagen que nos permitirá la inclusión social (o lo contrario). Pero además, el impacto de las prácticas e iniciativas relacionadas con la evaluación se halla determinado casi tanto por su valor educativo específico como por la cultura y la política. Black y Wilian (2005) plantean que estas prácticas dependen fuertemente del contexto cultural del país en que se aplican. Por lo tanto, instalar una discusión sobre evaluación y competencias significa abrir debates que trascienden la toma de decisiones técnicas a nivel de los ministerios de educación. Al decir de Perrenoud (1998), la problemática de la evaluación reside en si se evalúa con una intención formativa o con una intención selectiva y potencialmente excluyente, y este no es un problema metodológico sino político. Currículo inclusivo y evaluación para la promoción del desarrollo de las competencias de los estudiantes El currículo inclusivo acomoda las necesidades de todos los estudiantes y busca educarlos exitosamente al tiempo que celebran la diversidad que de esto resulta (Opertti et al., 2010). Sobre todo, el currículo tiene que alcanzar estos propósitos de tal forma que beneficien a todos los estudiantes por igual. Por lo tanto, el currículo debe ser: Estructurado y capaz de ser enseñado de tal manera que permita la participación de todos los estudiantes; Sustentar un modelo de aprendizaje que sea inclusivo por sí mismo – por lo tanto, necesita acomodar una serie de estilos de aprendizaje y enfatizar las habilidades y conocimientos que son relevantes para los estudiantes;
Suficientemente flexible para responder a las necesidades de determinados educandos, comunidades y grupos culturales y lingüísticos; y Estructurado alrededor de niveles variados de capacidades, de tal manera que el progreso pueda ser evaluado de forma que permita a los educandos experimentar el éxito. (UNESCO, 2008)
Como visión posible de lo que constituiría una “evaluación auténtica”, que promueva el desarrollo de las competencias de los sujetos, Godinho y Wilson (2005) proponen que una evaluación auténtica Es cultural y socialmente inclusiva, y apropiada en función del desarrollo del estudiante; Es rica, pues valora diversos aspectos del aprendizaje, p. ej. las competencias sociales, de pensamiento, etc., que suelen ser especialmente difíciles de evaluar con los métodos convencionales; Es relevante pues se halla conectada con el aprendizaje y la experiencia vital de los estudiantes; Es útil pues ayuda a formular juicios válidos y confiables, informa sobre la enseñanza y permite reflexionar sobre ella; Está integrada con los demás procesos que suceden en el aula.
La idea de una evaluación inclusiva y promotora del desarrollo de competencias se contrapone claramente con los propósitos selectivos que han tenido tradicionalmente las prácticas de evaluación hasta el presente, por lo que resulta obvio que una evolución hacia prácticas de evaluación más inclusivas requerirá de cambios a diversos niveles, entre ellos que los docentes desarrollen nuevos modos de relación profesional, entre sí, con la institución escolar, y con los estudiantes, y al mismo tiempo que la comunidad revise los criterios acerca de qué clase de evaluación considera aceptable. En lo que sigue de este documento, se formulan algunos desafíos para lograr esta visión y se plantean preguntas en formato abierto con la intención de estimular la discusión con los colegas.
Visión de conjunto2 Semana 1: ¿Cuáles son los temas y las visiones actuales relacionadas al mejoramiento de los formatos de evaluación en su región, vistas desde las perspectivas de los docentes, investigadores y otros tomadores de decisiones en materia de educación? Los retos clave incluyen: 1. Los docentes y la comunidad en general tienen supuestos y teorías implícitas sobre qué prácticas constituyen una “buena evaluación”, y estos supuestos se han construido a lo largo de sus propias experiencias como estudiantes, lo que los vuelve “naturales” y resistentes al cambio. 2. Los formatos de evaluación y las escalas de clasificación asociadas son ejemplos de dispositivos estabilizados por convenciones sociales. Si se propone un cambio que la sociedad no entiende o no acepta, las reformas mejor intencionadas no logran instalarse. 3. Los docentes tienen diferentes niveles de conocimiento y experiencia en el desarrollo y uso de instrumentos de evaluación y prácticas que podrían permitirles la implementación de enfoques más inclusivos cuando evalúan las competencias de sus estudiantes, y la efectividad y costo de estas prácticas es un tema de discusión. 4. El uso formativo de las situaciones de evaluación para promover aprendizajes profundos y desarrollar competencias puede poner en cuestión las prácticas tradicionales de enseñanza y el lugar de poder de los docentes, en particular porque algunas competencias se ponen de manifiesto en situaciones de trabajo grupal, con lo que resulta difícil asignar la calificación individual. Semana 2: ¿Cuáles son las implicaciones de los enfoques de evaluación basados en exámenes para la certificación de los procesos de enseñanza/aprendizaje y de los resultados a nivel de su región? Los retos clave incluyen: 5. Los exámenes de alta consecuencia que se implementan tienen efectos prácticos y simbólicos, algunos de ellos negativos. Por ejemplo, dejar a estudiantes excluidos del sistema y categorizar negativamente a algunas escuelas como “malas”, o llevar a los docentes a que enseñen sólo lo que estas pruebas miden en lugar de enseñar el currículo. También pueden tener efectos positivos que se pueden demostrar a través del compromiso público sobre altas expectativas de aprendizaje para todos los estudiantes, o actuando como incentivos para la mejora de la escuela.
2 Por favor haga clic en las semanas para ir directamente a las secciones del documento.
6. Las evaluaciones basadas en estándares son una tendencia en crecimiento. Sin embargo, sus resultados pueden usarse para discriminar – y potencialmente excluir – a aquellos estudiantes que no alcanzan un determinado estándar en el tiempo esperado, así como para culpabilizar a aquellos docentes que no logran que sus estudiantes alcancen el mismo estándar. 7. La importancia que se le otorga a la calificación y certificación de los alumnos desde el punto de vista social suele impulsar a los docentes a concentrar sus esfuerzos en evaluaciones sumativas más que en evaluaciones formativas. 8. La evaluación queda frecuentemente reducida a lo que es fácil de evaluar y calificar. Esto envía a los estudiantes un “mensaje oculto” que los lleva a adoptar formas de aprender útiles para pasar exámenes y no para lograr una comprensión a fondo. Semana 3: ¿Qué tipo de prácticas de evaluación podrían jugar un rol positivo en el desarrollo de las competencias del estudiante en su región? Los retos clave incluyen: 9. Ciertos formatos de evaluación, por ejemplo los exámenes de opción múltiple, se eligen por razones prácticas de facilidad de aplicación o porque se los considera estadísticamente sólidos, dándose por cierto que eso significa que son justos y confiables. Sin embargo, esto no quiere decir que sean válidos como evidencia de un aprendizaje profundo y sustentable. 10. Los formatos de evaluación más comunes suelen dar poca importancia a la observación del desempeño de los alumnos en situaciones cuasi—auténticas, y por lo tanto proporcionan pocas evidencias del logro de las competencias. 11. Los procedimientos para dar retroalimentación sobre los resultados de exámenes nacionales en el proceso de mejora de documentos curriculares y materiales de enseñanza son muy escasos. Por otro lado, las evaluaciones estandarizadas producen impactos elevados y directos sobre las prácticas de enseñanza, y actúan, por lo tanto, como un “currículo paralelo”. Referencias
Semana 1: ¿Cuáles son los temas y las visiones actuales relacionadas al mejoramiento de los formatos de evaluación en su región, vistas desde las perspectivas de los docentes, investigadores y otros tomadores de decisiones en materia de educación? Los retos clave: 1. Los docentes y la comunidad en general tienen supuestos y teorías implícitas sobre qué prácticas constituyen una “buena evaluación”, y estos supuestos se han construido a lo largo de sus propias experiencias como estudiantes, lo que los vuelve naturales y resistentes al cambio. Pajares (1992) propone que las concepciones de los docentes son producto de su experiencia educativa como estudiantes, y sugiere que se pueden encontrar concepciones muy similares entre docentes y estudiantes. Así por ejemplo, los docentes (y también los estudiantes) suelen pensar que una evaluación auténtica consiste en un examen. Sin embargo, cambiar las normas [y prácticas habituales] que existen dentro de una escuela es difícil de alcanzar, sobre todo cuando hay tanta presión por la competencia y bajo el entendido que los docentes tienden a trabajar solos para enfrentar el problema. La idea de que una evaluación formativa tiene que ver con el desempeño de los estudiantes, y que habría que considerar las modalidades de aprendizaje, los estilos cognitivos y las inteligencias múltiples de los estudiantes (Coil, 1996), resulta un desafío importante. Avanzar hacia la inclusión no siempre se entiende o es bienvenido donde la gente está acostumbrada a sistemas de segregación, o donde los educadores tienen miedo de lidiar con la diversidad. Las agencias gubernamentales y las organizaciones de la sociedad civil necesitan trabajar juntas para promover la educación inclusiva – no es sólo un tema de los educadores, sino que también concierne a organizaciones, familias y comunidades, asociaciones profesionales, investigadores, formadores de maestros y proveedores de servicios. Es necesario movilizar la opinión a favor de la inclusión y empezar un proceso de construcción de consenso en una etapa temprana. (CIE Doc. Ref., 2008) Se puede diferenciar entre prácticas evaluativas que buscan comparar a los individuos entre sí (evaluación referenciada a una distribución normal o norma‐referenciada) y las que buscan recoger evidencias y emitir juicios acerca de la naturaleza y magnitud de los avances de los individuos hacia los requisitos de desempeño fijados como parámetros (evaluación referenciada a criterios, Hagar et al 1994). El primer tipo de prácticas evaluativas está asociado al supuesto de que “siempre” hay una proporción de alumnos que falla, más allá de lo buena que sea la enseñanza e independientemente de la diversidad de puntos de partida de los alumnos. Evaluar bajo este supuesto ayuda a sostener la exclusión.
¿Qué conocimiento basado en investigación tenemos sobre las representaciones docentes acerca de la evaluación? ¿Cómo evaluamos a los futuros docentes? ¿De una manera consistente con la forma en que luego queremos que evalúen a sus alumnos? ¿Qué peso tiene en su contexto la idea de que “no todos pueden aprobar”?
2. Los formatos de evaluación y las escalas de clasificación asociadas son ejemplos de dispositivos estabilizados por convenciones sociales. Si se propone un cambio que la sociedad no entiende o no acepta, las reformas mejor intencionadas no logran instalarse. Microcaso: Cambio de la escala numérica de calificación en Argentina por una escala conceptual y posterior contrarreforma. Hasta 1986, la escala de calificación en las escuelas secundarias usaba notas numéricas de 1 a 10, con 7 como nota mínima de aprobación.
En 1986, 3 años después de la recuperación de la democracia, el Ministerio de Educación cambió la escala por otra basada en “conceptos”: S, A, N, que significaban “Superó los objetivos”, “Alcanzó los objetivos” y “No alcanzó los objetivos”. Esta escala no diferenciaba rangos internos entre los estudiantes que alcanzaban los objetivos ni entre los que no los alcanzaban.
En 1988 se introdujo un concepto entre S y A: AMS, que significaba “alcanzó los objetivos muy satisfactoriamente”
En 1992, luego de una larga historia de quejas y debates en la prensa en los que estuvieron involucrados padres, maestros y especialistas en educación, el Ministerio reinstaló el sistema clásico de notas numéricas (1 a 10), porque “es necesario asegurar la comunicación oportuna y adecuada de los resultados a lo largo de todo el proceso educativo, de manera de permitir la intervención de las escuelas y las familias para corregir los factores que podrían afectar dichos resultados”, forma elíptica de decir que las familias no entendían la escala conceptual porque no les permitía saber si a sus hijos les iba bien o no en la escuela ni los maestros podían hacer comparaciones entre los rendimientos de los alumnos.
FUENTE: Elaboración propia a partir de reglamentaciones emitidas por el Ministerio de Educación de la Nación – Argentina. ¿Qué resistencias sociales podrían imaginarse en el caso de que se proponga un cambio en la modalidad de evaluación o en las formas en que se comunican los resultados? ¿Qué posibilidades hay de que un cambio en la política de evaluación sea percibido socialmente como un intento de “disminuir la exigencia”?
3. Los docentes tienen diferentes niveles de conocimiento y experiencia en el desarrollo y uso de instrumentos y prácticas de evaluación que les permiten la implementación de enfoques más inclusivos cuando evalúan las competencias de sus estudiantes, y la efectividad y costo de estas prácticas es un tema de discusión. Las herramientas que permiten evaluar producciones complejas o inferir el grado de desarrollo de una competencia se pueden analizar desde dos perspectivas complementarias: a) su forma y contenido (rúbricas, listas de cotejo, escalas
descriptivas) y b) el tipo de resultado que se comunicará a partir de ellas (perfil analítico de habilidades, resultado global, nota). Como resultado, las herramientas para la evaluación formativa abarcan un conjunto amplio de estrategias y esquemas de recolección y comunicación de la información, algunas de las cuales se mencionan en la Tabla 1. Tabla 1 — Estrategias y formas de registro en la evaluación de competencias
Forma de evaluación
Estrategia Modo de registro
Observación Trabajo de grupo, resolución de problema, centros de aprendizaje, salidas de campo, juegos, historias de aprendizaje
Notas personales, listas de cotejo de habilidades, criterios de calificación, registro en fotos, video, audio
Muestras de trabajos
Productos del trabajo individual: mapas conceptuales, dibujos, hojas de actividades, tareas de escritura, reflexiones personales, representaciones visuales, monografías, informes
Portafolios (digitales o físicos), perfiles de los estudiantes, libretas de apuntes, archivos
Presentaciones Representaciones teatrales, debates, entrevistas, ópera, raps, poesías, canciones, danzas, mesas redondas
Criterios de calificación, rúbricas, evaluación por pares, autoevaluación, retroalimentación descriptiva (oral y escrita)
Productos Modelos, murales, collages, proyectos de escritura, proyectos comunitarios, presentaciones públicas, borradores de diseño, PowerPoint
Criterios de calificación, rúbricas, evaluación por pares, autoevaluación, retroalimentación descriptiva (oral y escrita)
FUENTE: Moss & Godinho (2005) Para que los docentes (especialmente los menos expertos) puedan realizar este tipo de observaciones múltiples de las producciones de los estudiantes, se requiere disponer de criterios de evaluación y de herramientas de registro en formatos amigables, que deberían ser producidos por equipos de docentes en colaboración con expertos, prestando particular atención a las condiciones laborales de los docentes y a los aspectos prácticos de la gestión de tiempo y aula. Una de las necesidades más importantes para formar a los docentes en prácticas inclusivas tiene lugar en la formación inicial regular, o través de eventos cortos de formación en servicio. Un currículo básico de formación para docentes debe incluir, por lo tanto, consejos sobre como: traducir los resultados de investigación relevantes (incluyendo la investigación sobre el funcionamiento del cerebro) en prácticas efectivas de evaluación; evaluar el progreso de todos los estudiantes a través del currículo, incluyendo la forma en que deberán ser evaluados aquellos estudiantes cuyos logros son bajos y su progresos lentos; usar las evaluaciones como una herramienta de evaluación para toda la clase, así como diseñar planes individuales para los estudiantes; observar a los estudiantes en situaciones de aprendizaje, incluyendo el
uso de listas de revisión simples y esquemas de observación; relacionar la conducta de educandos particulares a patrones normales de desarrollo (esto es particularmente importante para los maestros de niñas y niños); involucrar a los padres de familia y alumnos en el proceso de evaluación; trabajar con otros profesionales – y saber cuando llamarles para solicitar un consejo especializado y cómo utilizar sus evaluaciones para propósitos educativos.3 ¿Cuáles de estas opciones podrían ser transferidas fácilmente a los docentes en su contexto? ¿Cuáles serían aceptadas y puestas en uso? ¿Qué tipo de acciones de capacitación docente serían necesarias para ponerlas en uso? ¿Cuánto tiempo se dedica en la formación docente a trabajar modelos actualizados de evaluación? ¿Qué estrategias de dialogo sobre políticas de evaluación serían necesarias para poner en práctica este tipo de evaluaciones en reemplazo de las actualmente en uso?
4. El uso formativo de las situaciones de evaluación para promover aprendizajes profundos y desarrollar competencias puede poner en cuestión las prácticas tradicionales de enseñanza y el lugar de poder de los docentes, en particular porque algunas competencias se ponen de manifiesto en situaciones de trabajo grupal, con lo que resulta difícil asignar la calificación individual. A nivel internacional, la evaluación contextual está subdesarrollada. El hábito cultural de atribuirles todas las dificultades de los educandos a los educandos mismos es una tendencia que permanece marcada y es un tema que muchos países deberán abordar bajo el entendido de que se encuentran en un contexto local, nacional e internacional de educación inclusiva.4 Las expectativas preexistentes sobre las relaciones humanas en el aula vuelven problemático el trabajo colaborativo entre docentes y estudiantes. Una postura docente que se vea como colaboradora con sus alumnos para el logro de los aprendizajes, y que por lo tanto privilegie el uso de la evaluación para retroalimentar a los alumnos sobre sus avances, significa que docentes y alumnos se asuman como “socios en el aprendizaje”. Ello podría traer aparejado que el docente atraviese situaciones donde hay mayor simetría de poder que pondrían en cuestión luego su rol como juez de los desempeños en el momento de la evaluación para la certificación (una relación de poder fuertemente asimétrica). Para hacer de las prácticas evaluativas algo más
3 UNESCO-OIE. Defining an Inclusive Education Agenda: reflections around the 48th session of the International Conference on Education. [Definiendo una Agenda sobre Educación Inclusiva: reflexiones en torno a la 48ª sesión de la Conferencia Internacional de Educación]. (Ginebra: UNESCO-OIE, 2008). 4 Ibid. (Ginebra: UNESCO-OIE, 2008).
inclusivo, los tomadores de decisiones deben identificar y aceptar nuevas formas de trabajo con docentes de educación especial, psicólogos, trabajadores sociales y profesionales médicos; sin embargo, es fundamental tener en cuenta que los socios más importantes serán los colegas, los padres de familia y los propios estudiantes. Un aspecto de la evaluación colaborativa implica también algunos temas particulares. De acuerdo con Oandasan y Reeves (2005), hay poca bibliografía sobre las maneras de evaluar las competencias vinculadas con el conocimiento, las habilidades y las actitudes que se requieren para una práctica colaborativa. Las ventajas de la evaluación del trabajo grupal, aparte de reducir la carga de trabajo para calificar a los individuos, residen en los beneficios educativos de incluir en las competencias habilidades importantes como el trabajo en equipo, el liderazgo, la comunicación y la organización. Sin embargo, es complejo asegurar el empleo de una estrategia de evaluación que sea justa y que pueda establecer los niveles de contribución de cada miembro del grupo; algunas estrategias que lo permitirían se apoyan en dar cierto peso en la calificación a la evaluación que hacen los pares y a la autoevaluación. ¿Qué aspectos habría que considerar en la formación y capacitación docente para desarrollar este rol dual de colaborador y juez? ¿Qué procedimientos alternativos de meta—evaluación habría que incluir para prevenir o corregir los sesgos introducidos cuando la evaluación sumativa queda en manos de un solo docente? ¿Qué dificultades plantearía incluir la auto‐evaluación y la co‐evaluación entre pares para evaluar la contribución de los estudiantes individuales a un producto grupal? Autorizar y promover estas prácticas ¿sería un riesgo que estarían dispuestos a aceptar los decisores de política en su contexto?
Semana 2: ¿Cuáles son las implicaciones de los enfoques de evaluación basados en exámenes para la certificación de los procesos de enseñanza/aprendizaje y de los resultados a nivel de su región? Los retos clave incluyen: 5. Los exámenes de alta consecuencia que se implementan, tienen efectos prácticos y simbólicos, algunos de ellos negativos, como por ejemplo, dejando a estudiantes excluidos del sistema y categorizando negativamente algunas escuelas como “malas”, o llevando a los docentes a que enseñen sólo lo que estas pruebas miden en lugar de enseñar el currículo. También pueden tener efectos positivos que se pueden demostrar a través del compromiso público sobre altas expectativas de aprendizaje para todos los estudiantes, o actuando como incentivos para la mejora de la escuela. Microcaso: La política del Examen Nacional (UN) como prueba estandarizada nacional de los estudiantes secundarios en Indonesia El UN es un examen nacional estandarizado dirigido a todos los estudiantes de escuelas secundarias del país, quienes lo rinden en el grado 12 de la escuela secundaria superior y en el grado 9 de la escuela secundaria básica. La nota de aprobación que deben lograr los candidatos para pasar el examen se aumenta año tras año, de 3,01 en 2003 a 5,01 en 2006. Si los estudiantes no superan esta nota, se los considera “desaprobados” y deben repetir todas las asignaturas al año académico siguiente, sin importar cuál haya sido el desempeño global del estudiante a lo largo de su escolaridad. Los que se oponen al examen dicen que es “injusto” usarlo como base para tomar una decisión tan importante sobre la vida futura de los estudiantes, ya que todavía existen grandes diferencias de calidad entre las escuelas de distintas regiones de Indonesia. Además, se dice que el UN ha producido muchos efectos negativos sobre los maestros, los estudiantes, los padres, los administradores escolares y el currículo. Por su parte, el gobierno dice que el UN es importante como criterio para evaluar el éxito de los procesos de enseñanza y aprendizaje a escala nacional, y que permite formular programas para mejorar la calidad educativa nacional. Entrevistas tomadas en estudios cualitativos muestran que el UN lleva a algunos maestros a “enseñar para el examen”, reduciendo el currículo; los ha impulsado a trampear y los hace sentirse presionados ante las altas expectativas que tienen los directores de escuelas y los padres de que ellos ayuden a sus alumnos a pasar el examen. Por consiguiente, muchos maestros plantean que se sienten inseguros y preocupados de que sus estudiantes no lleguen a aprobar; tienen miedo de que la sociedad los catalogue como docentes ineptos. La presión es aún mayor para los administradores escolares, porque tanto el Ministerio de Educación como el público en general usan las notas de los exámenes como criterio para determinar la calidad de las escuelas. FUENTE: Extractado a partir de Afrianto (2008) Cuando los resultados de un examen tienen un elevado impacto sobre los actores educativos, los estudiantes se ven impulsados a hacer lo que sea con tal de tener éxito, y ese “lo que sea” no siempre significa aprender. Black and Wilian (2005) informan que en los Estados Unidos, como resultado de la Ley de 2001 “Que ningún niño se quede atrás” (“No Child Left Behind”) se determina que una escuela está realizando un “progreso anual adecuado” (AYP, por su sigla en
inglés) hacia las metas, si la proporción de estudiantes evaluados con “suficiente” en los exámenes anuales estatales supera el porcentaje fijado para el estado para ese año. Cuando las escuelas no logran alcanzar el AYP sufren severas consecuencias y, como resultado, muchas escuelas y distritos escolares invierten tiempo y dinero en sistemas para monitorear lo que enseñan los docentes y lo que aprenden los estudiantes. Para asegurarse de que los docentes cumplan con todo el currículo, la mayoría de los distritos han desarrollado “cronogramas curriculares” que especifican qué páginas de los textos prefijados hay que cubrir cada semana (y a veces, cada día). En opinión de Harlen (2005), el uso de exámenes de alta consecuencia impulsa a los docentes a enfocarse en el contenido de los exámenes, entrenando a los estudiantes para que puedan responder preguntas específicas o ciertos formatos de pregunta, y adoptando estilos de enseñanza por transmisión. En estas circunstancias, los docentes hacen poco uso formativo de las evaluaciones para ayudar al aprendizaje. El resultado de este énfasis en aprobar los exámenes es hacer subir los puntajes —mientras se siga usando el mismo tipo de examen—, pero tal mejora de los puntajes no significa mejoras del aprendizaje. Sin embargo, los exámenes de gran escala pueden también ayudar a identificar acciones para mejorar las oportunidades de muchos educandos. Sobre los datos del Programa para la Evaluación Internacional de Alumnos de la OCDE (PISA, por sus siglas en inglés), el reporte: Donde los estudiantes inmigrantes tienen éxito – Una Revisión Comparativa del Desempeño y Compromiso en PISA 2003, muestra como los estudiantes inmigrantes son educandos motivados y tienen actitudes positivas hacia la escuela, pero como, a pesar de estas disposiciones de aprendizaje, se desempeñan a niveles significativamente inferiores en matemáticas, lectura, ciencia, así como en competencias para la solución de problemas, en comparación con sus compañeros que han nacido ahí. Este informe muestra como en algunos países, donde existen diferencias relativamente bajas en el desempeño entre estudiantes inmigrantes y nativos o donde las diferencias de resultados de los estudiantes de segunda generación se han reducido significativamente en comparación a aquellos observados en los estudiantes de primera generación, tienden a tener programas de apoyo lingüístico bien establecidos con metas y estándares claramente definidos, mientras que en otros países donde los estudiantes inmigrantes se desempeñan a niveles significativamente bajos, el apoyo lingüístico tienen a ser menos sistemático. (UNESCO, 2008) ¿Qué actores sociales verían o ven como deseable una política de exámenes nacionales de alta consecuencia? ¿En su contexto, hasta qué punto los docentes adaptan su enseñanza a los exámenes de alta consecuencia y a los exámenes comparativos internacionales?
¿Hasta qué punto se cree en su contexto que unos buenos resultados en los exámenes estandarizados nacionales o internacionales tiene correlación con un buen aprendizaje? ¿Están convencidos los tomadores de decisiones a nivel ministerial de la utilidad de los exámenes de alta consecuencia?
6. Las evaluaciones basadas en estándares son una tendencia en crecimiento. Sin embargo, sus resultados pueden usarse para discriminar – y potencialmente excluir – a aquellos estudiantes que no alcanzan un determinado estándar en el tiempo esperado, así como para culpabilizar a aquellos docentes que no logran que sus estudiantes alcancen el mismo estándar. Opinión docente: evaluaciones estandarizadas en Massachussets
Afirma un maestro de escuela media básica a la que asisten muchos alumnos recientemente inmigrados, “Si se toma al MCAS (la prueba estandarizada que administra el estado de Massachussets, EE.UU) como el único criterio para juzgar a las escuelas, a los directivos, a los maestros y superintendentes de distrito, tenemos un desastre entre manos. Ya es bastante difícil hacer que los maestros quieran quedarse en las escuelas urbanas que atienden alta proporción de estudiantes de nivel socioeconómico bajo, pero con esto habrá un enorme incentivo para que los docentes busquen traslado a sistemas escolares que atienden a familias más acomodadas. Todos sabemos a quienes les irá mejor en esta prueba y por qué, de modo que ¿cómo podemos esperar que los maestros se queden en escuelas donde no solo su empleo sino su reputación puede resultar destruida?” FUENTE: Wheelock, A. (2008), in [www.fairtest.org]
Opinión experta: el ranking de escuelas en Chile
“No se puede comparar entre escuelas; no es igual evaluar el trabajo de una escuela que atiende a sectores populares que el trabajo de una escuela con estudiantes de ingresos medios o altos. Los puntos de partida, los recursos y los procesos son diferentes, y también lo serán los resultados. Esperar que todas las escuelas chilenas alcancen los mismos resultados en Matemáticas, por ejemplo, es demasiado simplista y particularmente injusto para las escuelas de sectores pobres, en donde buena parte de los esfuerzos de los docentes no se reflejarán directamente en los resultados de una prueba estandarizada, como sí lo harán en una escuela de sectores medios—altos, donde menos esfuerzo produce mejor resultado porque una parte importante del trabajo educativo se lleva a cabo fuera de la escuela, en hogares con adecuados recursos, entre ellos, el tiempo y la atención de los padres.” FUENTE: Adaptado de Mella, O. (2010)
¿Qué nivel de aceptación tiene en su contexto una prueba referida a criterios? ¿Por qué? ¿Qué consecuencias sobre los niveles de promoción vs. niveles de retención podría tener la implementación de una prueba basada en criterios? ¿Es razonable/justo evaluar con distintos criterios a alumnos procedentes de diferentes sectores sociales?
7. La importancia que se otorga a la calificación y la certificación de los alumnos desde el punto de vista social suele impulsar a los docentes a concentrar sus esfuerzos en evaluaciones sumativas más que en evaluaciones formativas. Los padres de los alumnos interactúan con la información producida en las evaluaciones a través de indicadores que resumen el desempeño de sus hijos, ya sean éstos notas numéricas o una escala de letras. Estas notas condensan el juicio global de un docente, y dado que el docente espera que se lo consulte o cuestione acerca de la nota que ha puesto a cada alumno, dedica su tiempo y energía a producir la evidencia suficiente para emitir la calificación (evaluación sumativa o con fines de certificación). Practicar una evaluación formativa significa en cambio recoger evidencias del desempeño de los estudiantes para modificar la propia enseñanza, de manera de satisfacer mejor las necesidades de aprendizaje de los alumnos, decidir en qué punto del aprendizaje están, hacia dónde necesitan seguir, y cómo ayudarlos a llegar ahí. En ese sentido, practicar una evaluación formativa requiere utilizar energía y tiempo para devolver a los estudiantes señales que los ayuden a avanzar en su aprendizaje. Sin embargo, Perrenoud (1998) propone que plantear una oposición entre evaluación sumativa y evaluación formativa es un falso dilema, puesto que en realidad se trata de usar los mismos datos para dos objetivos diferentes. Mientras todavía hay tiempo de trabajo, los datos recogidos en las evaluaciones se reinvierten en adaptar las estrategias de enseñanza y aprendizaje, y cuando termina el curso, será momento de realizar una apreciación global del trabajo realizado. ¿Qué balance encuentra usted entre las prácticas docentes de “evaluar para calificar” y de “evaluar para mejorar el aprendizaje”? ¿En su opinión existe alguna contradicción entre que sea el mismo docente el que realiza la evaluación formativa y la evaluación para la certificación?
8. La evaluación queda frecuentemente reducida a lo que es fácil de evaluar y calificar. Esto envía a los estudiantes un “mensaje oculto” que los lleva a adoptar formas de aprender útiles para pasar exámenes y no para lograr una comprensión a fondo. Harlen (2005) señala que las pruebas que tienen alto impacto en la vida futura de los estudiantes inevitablemente se diseñan para que sean lo más “objetivas” posible, porque para evitar injusticias se valora que el proceso de corrección y calificación sea confiable. El resultado es reducir lo que se evalúa a aquello que se puede corregir y calificar de manera fácil y confiable. Por lo general, esto lleva a no incluir en las evaluaciones tareas que muestran aprendizajes valiosos, por ejemplo la resolución de problemas o el pensamiento crítico.
Wiliam (2000) propone al respecto un ejemplo concreto relacionado con las prácticas evaluativas en ciencias naturales. La mayor parte de los docentes de ciencias acuerdan en que los saberes procedimentales son una parte importante del contenido del currículo de ciencias; por lo tanto, una evaluación de ciencias naturales debería evaluar los procedimientos al igual que otras formas más tradicionales de conocimiento científico. Pero, como evaluar los saberes procedimentales es costoso, y quienes velan por la eficiencia de las evaluaciones señalan que los resultados de los exámenes prácticos y los escritos muestran buena correlación, resulta que no hay necesidad de realizar la costosa evaluación de los procedimientos. Lo que ocurre entonces es que se eliminan de la evaluación los aspectos prácticos de la ciencia. En el corto plazo, eso transmite el mensaje de que las actividades prácticas en ciencias no son tan importantes como los aspectos escritos. La consecuencia de mediano plazo es que los docentes, comprensiblemente ansiosos por ayudar a que sus alumnos saquen los mejores resultados posibles en la evaluación, dediquen menos tiempo a los aspectos prácticos de la ciencia, con lo que ya no resultará válido hacer extrapolaciones de la competencia práctica de los alumnos a partir de su nota en la prueba de ciencias. ¿Qué características de las prácticas evaluativas en su región se pueden señalar como contradictorias con un aprendizaje profundo? ¿Qué nivel de reclamos existe en su contexto acerca de que la evaluación no promueve el desarrollo de competencias complejas? ¿Qué se dice frente a los reclamos de que los estudiantes “apenas estudian para pasar la prueba y después se olvidan de todo”?
Semana 3: ¿Qué tipo de prácticas de evaluación podrían jugar un rol positivo en el desarrollo de las competencias del estudiante en su región? Los retos clave incluyen: 9. Ciertos formatos de evaluación, por ejemplo los exámenes de opción múltiple, se eligen por razones prácticas de facilidad de aplicación o porque se los considera estadísticamente sólidos, dándose por cierto que eso significa que son justos y confiables. Sin embargo, esto no quiere decir que sean válidos como evidencia de un aprendizaje profundo y sustentable. Realizar una evaluación significativa, en tanto descriptiva del trayecto individual de aprendizaje de cada estudiante, de sus logros y sus procesos, no puede resolverse de manera abreviada, confiando en evaluaciones estandarizadas, sino que debe basarse en prácticas evaluativas mucho más ricas y complejas que dar un examen (Walker 2005). Para Scallon (2007), no es posible inferir una competencia a partir de un examen formado por muchas preguntas de respuesta corta o de opción múltiple, pues las competencias sólo se podrían poner en evidencia cuando los sujetos tienen que realizar una “producción” concreta (composición, representación musical, construcción, presentación oral) a la que ellos mismos deben darle forma y estructura. La demostración de la competencia es un fenómeno complejo que hay que mirar a través de distintas ventanas (dimensiones o criterios). Los docentes tienen que evaluar los aspectos fuertes o débiles de la producción y seguir la progresión de cada estudiante a lo largo del tiempo. Esto significa un problema desde el punto de vista de la certificación: cómo expresar en forma concisa el juicio acerca de un desempeño complejo a través de una nota. Tardif (2006) plantea que la evaluación de competencias es contraria a la yuxtaposición de una serie de “pruebas” diseñadas en forma aislada e independiente, y que debe desarrollarse a lo largo del tiempo como para poder determinar el desarrollo de la competencia. ¿Es suficiente el tiempo que los docentes dedican a la evaluación? ¿Cuánto trabajo de preparación hay que hacer para diseñar una situación que permita evaluar competencias? ¿Tienen los docentes suficiente confianza para proponer este tipo de situaciones “fluidas” y para evaluar los diferentes productos de los estudiantes?
10. Los formatos de evaluación más comunes suelen dar poca importancia a la observación del desempeño de los alumnos en situaciones cuasi—auténticas, y por lo tanto proporcionan pocas evidencias del logro de las competencias. Microcaso: Ideas de los docentes de Argelia sobre la evaluación basada en competencias A un grupo de docentes argelinos se le propone discutir la siguiente situación: en una prueba escrita, cuatro estudiantes tienen que completar las partes faltantes de un diálogo. Para ello leen las frases de uno de los dos personajes y deben completar las frases del otro personaje en un espacio en blanco destinado a ese fin. Los estudiantes A, B, C y D hicieron lo que sigue:
El estudiante A respondió en buen francés, sin errores de ortografía, pero sus respuestas no tenían coherencia con las frases dadas en el diálogo.
La estudiante B dio respuestas adecuadas para las frases del diálogo, usando frases bien estructuradas pero con muchos errores de ortografía.
El estudiante C también respondió adecuadamente a las frases disparadoras, sin errores de ortografía, pero las respuestas no estaban sintácticamente bien formadas.
La estudiante D no escribió ninguna respuesta en los espacios en blanco; en vez de eso escribió debajo un texto completo donde refirió todo el diálogo en discurso indirecto en muy buen francés.
Cuando se le preguntó a los maestros qué calificación le pondrían a cada uno de los cuatro estudiantes, en el que más divergencias hubo fue en el caso D; algunos le ponían un 0 y otros un 10 (sobre 10), pero en general, la calificación de D era consistentemente la más baja. Pero cuando se les preguntó a los maestros “¿En qué estudiante tendría más confianza de que puede realizar tareas que muestren dominio del lenguaje?”, contestaron todos que en D, mostrando que le daban la peor calificación al estudiante más competente. FUENTE: Roegiers, X. (2005) El caso anterior muestra la brecha que existe entre la forma en que se entiende la noción de competencia en la escuela y en la sociedad, pues cuando los maestros evalúan un resultado, le dan más peso a que el estudiante cumpla con la consigna que a su habilidad real. Las prácticas evaluativas en vigor en las escuelas pueden por lo tanto producir un efecto contradictorio: hay estudiantes que pasan entre 6 y 8 años de escuela primaria aprobando evaluaciones de lengua y matemática, pero luego no pueden enfrentar una situación de la vida cotidiana en la que tengan que emplear la lectura, la escritura o el cálculo para resolver, situación que suele llamarse “analfabetismo funcional”. El conocimiento conceptual, el saber hacer y algunas destrezas prácticas pueden verificarse en situaciones concretas evaluables de forma atomística, pero la competencia se infiere a partir de situaciones problemáticas o tareas complejas que requieren a los estudiantes movilizar varios recursos. Tal y como lo plantea Perrenoud (1996, 1997, 1999), se trata de situaciones no necesariamente excepcionales ni extremadamente difíciles, pero que deben incluir algún tipo de toma de decisión por parte del alumno, por ejemplo si valen las reglas conocidas, o si hay que dejar de lado esas reglas o adaptarlas al caso que se trabaja.
Una evaluación de competencias no puede por lo tanto replicar el modelo tradicional de evaluar conocimientos; se precisa pues que la escuela proponga más evaluaciones basadas en tareas contextualizadas. ¿Hasta qué punto las formulaciones con que se definen los resultados de aprendizaje esperados en el currículo de su país permiten u orientan la formulación de evaluaciones de competencias? ¿Existe una tensión entre evaluar en función de situaciones “de la vida real” y evaluar contenidos disciplinares? ¿Existen en su contexto buenos modelos de evaluación a través de situaciones complejas que puedan ser adaptados a diferentes contextos educativos? ¿Qué tipo de formación docente o capacitación necesitan los docentes para generar este tipo de situaciones de evaluación? ¿Es realista tratar de implementar situaciones de evaluación de competencias en función del tiempo escolar disponible? ¿Habría que hacerlo para todos los niveles escolares, o para algunos niveles o años en particular?
11. Los procedimientos para dar retroalimentación sobre los resultados de exámenes nacionales en el proceso de mejora de documentos curriculares y materiales de enseñanza son muy escasos. Por otro lado, las evaluaciones estandarizadas producen impactos elevados y directos sobre las prácticas de enseñanza, y actúan, por lo tanto, como un “currículo paralelo”. Opinión experta: Relación entre las agencias de currículo y evaluación, vistas desde una perspectiva curricular Etiopía: “…Las débiles redes de conexión entre los desarrolladores del currícula y los especialistas en pruebas resultan en el desarrollo curricular débil que no aborda temas de evaluación de manera apropiada. Es este sentido, [la prueba] no evalúa lo que debería…” Kenya: “… El currículo es desarrollado por el Instituto de Educación de Kenia (KIE, por sus siglas en inglés), mientras que la evaluación sumativa nacional es desarrollada por el Consejo Nacional de Examinación de Kenia (KNEC, por sus siglas en inglés). […] Para asegurar que el KNEC prepare temas que están en conformidad con el currículo, el KIE evalúa todas las pruebas y da retroalimentación al KNEC. [Sin embargo] el KNEC, por su parte, ha desarrollado directrices para todas las pruebas de tal manera que éstas informen a los docentes sobre lo que se espera de los estudiantes [y] los docentes han interpretado estas directrices como guías de enseñanza/aprendizaje, negando a los educandos que logren los objetivos de aprendizaje tal y como se estipulan en el currículo.” Seychelles: “[hay una necesidad por] formación de calidad en evaluación formativa para […] el personal de las unidades de Pruebas y Acreditación & Aseguramiento de la Calidad, así como para los desarrolladores de currículo.” Tanzania: “Lo que el Consejo Nacional de Examinación de Tanzania evalúa no refleja adecuadamente los logros de los alumnos en términos de las competencias estipuladas en el currículo. La evaluación no informa adecuadamente los logros de los alumnos con respecto al currículo debido a las limitaciones de los instrumentos utilizados, la duración, la cobertura y la consistencia. Existe un enlace inadecuado entre la evaluación y el desarrollo de currículo; como gestores clave, aún deben ser inducidos en los procesos de diseño e implementación, especialmente a nivel del aula.”
Costa de Marfil: “El gobierno de Costa de Marfil ha decidido cambiar hacia una formación basada en competencias y evaluación desde el 2000. […] A pesar de que los docentes y los formadores de docentes están al tanto de evaluar a los estudiantes con este criterio, no han desarrollado aún todas las herramientas para coordinar la evaluación con la docencia, especialmente a nivel nacional de evaluación. En este sentido, las evaluaciones generales se enfocarán nuevamente en una formación basada en objetivos, lo cual represente un gran problema, ya que las evaluaciones no estarán coordinadas con lo que se enseña […]”
Fuente: Extractos de las presentaciones de expertos en currículo en África en el Seminario de Formación de UNESCO‐BEPA, Dar es Salaam, julio 2009. Como se pudo ver los extractos citados, cuando un país o estado lleva a cabo políticas de evaluaciones estandarizadas, suelen surgir algunas brechas entre las agencias encargadas del diseño del currículo y aquellas encargadas de las evaluaciones nacionales, las cuales persiguen diferentes objetivos y responden a diferentes marcos lógicos ( relevancia curricular vs. validación evaluativa). Los expertos en currículo toman normalmente una visión unilateral de la evaluación como parte del proceso curricular, tal y como se ha visto en muchas de las recomendaciones que se presentan en materiales curriculares dirigidos hacia las prácticas evaluativas. Estas recomendaciones siguen normalmente la línea de la teoría constructivista del aprendizaje, la cual promueve evaluaciones “auténticas” que deberían basarse en el desempeño, al tiempo que deberían ser utilizadas con fines formativos. Sin embargo, es difícil encontrar instancias donde el flujo de información sea revertido, donde los diseñadores de currículo hagan buen uso de los resultados de las pruebas para revisar y renovar los mismos. ¿Qué problemas surgen a la hora de asegurar la calidad cuando se fusionan los equipos a cargo del desarrollo curricular y aquellos a cargo de las evaluaciones? ¿Qué impactos tiene, sobre el rol de los docentes, la coexistencia de un “currículo paralelo” representado por el contenido de las evaluaciones nacionales? ¿Qué estrategias podrían concebirse para producir conocimiento sobre las prácticas de evaluación real a nivel de la escuela, como una forma de fortalecer la capacidad de los diseñadores del currículo?
References Afrianto (2008) — Reformulation of national examination policy in Indonesia ‐ http://adsindonesia.or.id/alumni/ASAC2008Papers/Afrianto‐paper.pdf
Black, P., Wiliam, D. (2005) — Lessons from around the world: how policies, politics and cultures constrain and afford assessment practices. The Curriculum Journal, Vol. 16, No. 2, June 2005, pp. 249 – 261
Boud, D. (1995) — Assessment and learning: contradictory or complementary? In: P. Knight (Ed.) Assessment for Learning in Higher Education. London: Kogan Page, 35‐48.
Braslavsky, C. (1999) — Re—haciendo escuelas: hacia un nuevo paradigma en la educación latinoamericana. Aula XXI Santillana—Convenio Andrés Bello, Buenos Aires—Bogotá.
Coil, C. (1996) — Tools for Teaching and Learning in Integrated Classrooms. Australia: Hawker Brownlow Education. Cited in Moss, J., Godinho, S. (2005)
Crossouard, B. (2009) — A sociocultural reflection on formative assessment and collaborative challenges in the states of Jersey. Research Papers in Education Vol. 24, No. 1, March 2009, 77–93:
Hagar, P., Athanasou, J., Gonczi, A. (1994) — Assessment Technical Manual. Canberra: Australian Government Publishing Service. Cited in McDonald, R. et al (1995): New Perspectives on Assessment. Studies in technical and vocational education; 4. Paris: Section for Technical and Vocational Education, UNESCO.
Harlen, W. (2005) — Teachers’ summative practices and assessment for learning – tensions and synergies — The Curriculum Journal, Vol. 16, No. 2, June 2005, pp. 207 – 223
Jonnaert, Ph., Ettayebi, M., Defise, R. (2009). — Curriculum et compétences : un cadre opérationnel. Bruxelles : De Boeck.
Mella, O. (2010) — Debate sobre el SIMCE: ¿Deben evaluarse los sistemas educativos? — http://www.emol.com/educacion/programas/educadores20/pdf2010/simce.pdf)
Moss, J., Godinho, S. (2005) — From profiles to rich tasks: the situated nature of 'authenticity' in the context of reforming curriculum and assessment practices. Paper presented at the British Educational Research Association Annual Conference, University of Glamorgan, 14‐17 September 2005
Oandasan, I, Reeves, S. (2005) — Key elements of interprofessional education. Part 2. Factors, processes and outcomes . Journal of Interprofessional Care 19 (Suppl.1), 39‐48
OECD. (2006) — Where Immigrant Students Succeed: A Comparative Review of Performance and Engagement in PISA 2003, Paris: OECD.
Opertti, R., Duncombe, L. (2010) — Inclusive education and inclusive curriculum: Moving the EFA agenda forward [forthcoming].
Pajares, M.F. 1992. — Teachers’ beliefs and educational research: Cleaning up a messy construct. Review of Educational Research 62, no. 3: 307–332. Cited in Brown, GTL; Hirschfeld, GHF — Students’ conceptions of assessment: Links to outcomes Assessment in Education: Principles, Policy & Practice, Vol. 15, No. 1, March 2008, 3–17
Perrenoud, Ph. (1998) — L’évaluation des élèves. De la fabrication de l’excellence à la régulation des apprentissages, Bruxelles, De Boeck. / (1999) Dix nouvelles compétences pour enseigner. Invitation au voyage, Paris, ESF. / (2000) D’une métaphore l’autre : transférer ou mobiliser ses connaissances ?, in Dolz, J. et Wiggins, G. (1989) A true test : Toward more authentic and equitable assessment, Phi Delta Kappa, 70, pp. 703‐714.
Roegiers, X. (2005) — La refonte de la pédagogie en Algérie – Défis et enjeux d'une société en mutation, Alger: UNESCO‐ONPS, pp. 107‐124
Scallon G. (2007) — L'évaluation des apprentissages dans une approche par compétences. Bruxelles: De Boeck, 2e éd. (1re éd. 2004).
Tardif, M. (2006) — L'évaluation des compétences : Documenter le parcours de développement. Montréal: Chenelière Education. – Cited in Endrizzi, L., Rey, O.: Dossier d'actualité n° 39 – November 2008 Assessment: a central issue for learning http://www.inrp.fr/vst/LettreVST/english/39‐november‐2008_en.php
UNESCO‐IBE. (2008) — “Inclusive Education the Way of the Future: Reference Document”, ED/BIE/CONFINTED 48/3, UNESCO‐IBE: Geneva.
Walker, K. (2005) — How can I ensure that my child is learning at the right rate, and what types of assessment are most important in early childhood and primary years? The Education Age, 29/8/2005, cited in Moss, J., Godinho, S. (2005)
Wheelock, A. (2008) — High‐Stakes Test‐Based Accountability Policies: Problems and Pitfalls. posted 2008 en www.fairtest.org
Wiliam, D. (2000) — The meaning and consequences of educational assessments. Critical Quarterly, vol 42 nr 1 pp 105‐127.