EVALUACIÒN DEL APRENDIZAJE. PRUEBAS ESTANDARIZADAS.

 

MEDICIÒN Y EVALUACIÒN

Toda enseñanza implica evaluación.

La evaluación es la toma de decisiones acerca del desempeño de un estudiante y sobre las estrategias de enseñanza adecuadas. También procedimientos que se utilizan para obtener información acerca del desempeño de los alumnos.

La medición es la evaluación expresada en términos cuantitativos. Nos indica cuánto, con qué frecuencia o qué tan bien, usando puntuaciones, escalas o calificaciones., con un estándar o con el desempeño de los demás estudiantes.

También permite que los maestros comparen el desempeño de un estudiante en una tarea específica

Cada vez se utiliza con mayor frecuencia este término para describir el proceso de recopilación de información acerca del aprendizaje de los estudiantes.

 ¿QUÉ SIGNIFICAN LAS CALIFICACIONES EN LAS PRUEBAS?

En las pruebas estandarizadas, los reactivos y las instrucciones se probaron para asegurarse de que funcionen y en caso necesario, se modifican y se aprueban nuevamente. La versión final de la prueba se aplica a una muestra normativa, la cual sirve como grupo comparativo para todos los estudiantes que resuelvan la prueba.

Algunas mediciones en que se basan las comparaciones y las interpretaciones son:

Distribuciones de frecuencias: Consiste simplemente en una lista del número de individuos que obtienen cada calificación, o que caen dentro de cada rango de puntuaciones en una prueba otro procedimiento de medición.

Medidas de tendencia central y desviación estándar.:

Media: El promedio aritmético de un grupo de puntuaciones y el resultado se divide entre el número de puntuaciones en la distribución.

La media ofrece una manera de medir la tendencia central, es decir, la puntuación que es típica o representativa de la distribución total de las puntuaciones.

Mediana: Es la puntuación intermedia de la distribución, el punto donde la mitad de las puntuaciones son menores y la otra mitad son mayores.

Moda: Es la puntuación que ocurre con mayor frecuencia.

La desviación estándar es la medida de que tanto varían las puntuaciones en la distribución. Cuanto menos sea la desviación estándar, más dispersas estarán las puntuaciones en la distribución.

La distribución normal: es la distribución que ocurre con mayor frecuencia , donde las puntuaciones se distribuyen de manera uniforme alrededor de la media.

TIPOS DE PUNTUACIONES

Rango percentil: Porcentaje de quienes en una muestra normativa obtuvieron una calificación igual o menor que la puntuación de un individuo.

Equivalente al grado: Medida del grado escolar que se basa en la comparación con muestras normativas de cada grado.

Estándar: Calificaciones basadas en la desviación estándar.

INTERPRETACIÒN DE LAS PUNTUACIONES DE LAS PRUEBAS.

La confiabilidad se refiere a la consistencia interna o la precisión de una prueba.

Una prueba confiable brinda una lectura consistente y estable de las habilidades de una persona de una ocasión a otra, suponiendo que las habilidades del individuo permanecen constantes.

La puntuación real de un estudiante es la media de todas las puntuaciones que obtendría si la prueba se le aplicara muchas veces. Es el promedio hipotético de todas las puntuaciones de un individuo, si fuese posible la repetición de la evaluación en condiciones ideales.

El intervalo de confianza es el rango de puntuaciones donde la puntuación particular de un individuo tiene mayores probabilidades de caer.

Para que una prueba tenga validez, las decisiones e inferencias basadas en la misma deben ser sustentadas por evidencias, es decir, la validez se juzga en relación con el uso o propósito especifico, en relación con la decisión real tomada y con las evidencias que sustentan dicha decisión.

El sesgo de evaluación son las cualidades de un instrumento de evaluación, que ofenden o castigan injustamente a un grupo de individuos, por su género, condiciones particulares de educación, raza, origen étnico, etc.

FORMAS DE PRUEBAS ESTANDARIZADAS

Pruebas de rendimiento

Pruebas de diagnóstico

Pruebas de aptitudes

Aquellas que miden cuánto aprendieron los estudiantes en un área de contenidos

Pruebas administradas de forma individual para identificar problemas especiales de aprendizaje.

Están diseñadas para mediar las habilidades que se desarrollan durante muchos años y para vaticinar el éxito que tendrá un estudiante en el futuro al aprender material con el que no está familiarizado.

 

 

 PROBLEMAS DE LA EVALUACIÓN ESTANDARIZADA

La controversia sobre las pruebas estandarizadas se ha enfocado en su papel y en su interpretación, en su uso extensivo para evaluar a las escuelas, los problemas de responsabilidad basados en las calificaciones de las pruebas, y en la evaluación de los maestros. S la prueba se ajusta a los objetivos importantes del plan de estudios, si se aplica  a estudiantes que realmente estudiaron el contenido el plan de estudios durante un periodo razonable, si está libre de sesgo, si se ajusta a las destrezas del lenguaje de los estudiantes y si se administra adecuadamente, entonces los resultados brindan alguna información útil acerca de la eficacia de las escuelas. Sin embargo, los estudios de las pruebas reales muestran consecuencias indeseables como el estrechamiento del plan de estudios y la deserción escolar temprana de algunos alumnos. Los maestros deberían utilizar los resultados para mejorar la instrucción, y no para crear estereotipos de los estudiantes ni para justificar bajas expectativas.

 NUEVAS TENDENCIAS EN LAS PRUEBAS ESTANDARIZADAS

Las pruebas estandarizadas continúan siendo polémicas. En respuesta a la insatisfacción con las formas tradicionales de evaluación, han surgido nuevos modelos para enfrentar algunas de las dificultades más comunes de las pruebas.

EVALUACIÒN AUTÈNTICA.

Son procedimientos que miden las habilidades que miden las habilidades de los estudiantes para resolver problemas importantes de la vida real, para pensar de manera creativa y actuar con responsabilidad. Tales métodos consideran que la evaluación debería revelar el potencial del aprendizaje futuro y ayudar a identificar intervenciones para desarrollar dicho potencial. Las pruebas estandarizadas del futuro serán más variadas y tendrán más formatos de construcción de respuesta.

CAMBIOS EN LA SAT

En el 2005 el examen SAT incluyó un ensayo escrito, lectura más crítica y matemáticas de mayor nivel. Se eliminan las analogías y las comparaciones cuantitativas.

El equipo del PEI generalmente decide si los estudiantes que forman parte de un programa de este tipo participan contestando las pruebas escolares y así es así que adaptaciones o ajustes se realizarán

CONCLUSIONES

Las pruebas estandarizadas,  tiene tantas ventajas como desventajas, una de las desventajas que quizás o por lo menos a mi parecer una de las más importantes, es que no dan espacio a la diversidad, como bien es sabido todo estudiante es distinto del que tiene a su lado, aprenden de distinta manera, captan la información y la procesan en ellos de formas diferentes, con distintos métodos, al igual que sus metodología de trabajo, entonces si ya sabemos que son distintos unos de otros, ¿por qué pensar que reaccionaran de la misma forma ante una herramienta de evaluación?

Al imponer una evaluación estandarizada, solo se saca provecho de ciertas cualidades o habilidades de los estudiantes; un claro ejemplo de esto la prueba de selección universitaria,  es una prueba escrita de selección múltiple, y dentro de este ejemplo, pongámonos en la situación que el estudiante domina la materia o los contenidos, y además una de sus principales habilidades es la redacción y/o la oratoria, al verse frente a estas preguntas de selección múltiple, lo más probable es que su resultado no sea el que él esperaba y consciente de sus conocimientos obtenga un puntaje bajo.

¿Y qué pasa con los alumnos de distintos contextos sociales y/o educativos?, ¿y cuál es la diferencia que existe entre una persona que vive en D.F con una que vive en Chiapas ?, ¿o una que vive en el campo con otra que vive en la ciudad?, ¿será posible que todas estas diferencias puedan separarse del proceso de evaluación?