Alejandra Taborda - María Elena Brenlla
En el ámbito de la salud mental, la evaluación y el diagnóstico constituyen un pilar central para delinear abordajes que apunten tanto al examen de las potencialidades como a la detección y asistencia de dificultades en las personas. La valoración de las funciones intelectuales, tan requerida a partir de las exigencias de especialización que advienen con la modernidad, continúa enfrentando un sinfín de desafíos.
Interrogantes tales como ¿qué entendemos por procesos intelectuales?, ¿cómo seleccionar y estandarizar estímulos para captar, a través de las respuestas emitidas, la complejidad propia de las funciones cognitivas?, ¿cómo acotar los sesgos que pueden ocurrir en la medición psicométrica? y ¿cómo interpretar los resultados obtenidos atendiendo a las particularidades subjetivas? siguen suscitando controversias. Ello se refleja tanto en las conceptualizaciones que orientan la construcción de pruebas psicológicas como en los posicionamientos éticos que implican las tareas de evaluación y diagnóstico. El conocimiento del desarrollo de los instrumentos psicológicos, sus sustentos teóricos, sus fortalezas y debilidades, así como también la literatura que resulta de aplicaciones recientes y revisadas en diversos escenarios y poblaciones, son algunos de los aspectos relevantes a considerar para dar respuestas a los interrogantes planteados.
Las pruebas psicométricas de inteligencia remiten a las Escalas de Binet creadas en París en 1908 y 1911, las sucesivas adaptaciones de los Tests de Stanford-Binet realizadas por Terman (1916; 1937; 1960) para su aplicabilidad en los Estados Unidos y las innovaciones propuestas por Wechsler a partir de 1939.
Los autores citados se abocaron a articular la psicología experimental de aquella época con la cuidadosa observación de las peculiaridades de cada sujeto concreto. En palabras de Yela (1991), “Binet, Terman, Wechsler. Tres hitos capitales en la historia de los test. (…) Los tres son los más psicométricos entre los psicólogos clínicos y los más clínicos entre los psicólogos psicométricos” (p. X). Sus aportes lograron revertir la predictibilidad limitada o nula de los estudios de las diferencias individuales realizados en los laboratorios de Wundt a partir del desarrollo de tareas sencillas, medición de respuestas simples, estudio de aspectos elementales y máxima pulcritud experimental. También resultaron superadores del test de Galton que evaluaba la inteligencia –con alta fiabilidad y limitada validez– a partir de la implementación de tareas sensorio-motrices.
En pos de alcanzar un adecuado potencial diagnóstico de la ca-pacidad para resolver diversas situaciones que plantea la complejidad cotidiana, las escalas de inteligencia construidas con rigor metodológico por Binet y, posteriormente, por Wechsler, reunieron una muestra de variadas tareas. Las Escalas de Binet demandaban prioritariamente la puesta en juego del lenguaje, el juicio, la memoria, la comprensión y el razonamiento. La primera versión del test fue construida en 1908 para niños y adolescentes de 3 a 13 años de edad. Luego, en 1911, se editó la segunda versión que extendía su aplicabilidad hasta los 15 años. Ambos instrumentos procuraban diferenciar entre alumnos que podían adaptarse al sistema educativo normal de aquellos que necesitaban un refuerzo extra. Al respecto, el autor advirtió que el test presentaba limitaciones sustanciales a tener en cuenta, entre ellas que los diversos modos de expresión de la inteligencia se resisten a ser captados cuantitativamente, por lo que requieren de valoraciones cualitativas, y que el ambiente influye en el desarrollo intelectual. Binet señaló la presencia de francas similitudes en los resultados obtenidos en el test en niños procedentes de ambientes semejantes, en cambio los provenientes de familias acomodadas solían presentar una edad mental superior a la de los que vivían en los suburbios. De este modo, Binet ya planteaba debilidades en el paradigma psicométrico que mantienen vigencia en la actualidad.
Los requerimientos surgidos en la Primera Guerra Mundial en cuanto a la selección de militares promovió la extensión de la evaluación de la inteligencia en adultos. Otis, discípulo de Terman, hizo su aporte con la construcción del test Army Alpha de administración colectiva para la valoración del cociente intelectual (CI). El instrumento reunía tareas verbales similares a la escala del Stanford-Binet. Además, para hacer factible la evaluación de inmigrantes que no dominaban el idioma ingles elaboró la escala Army Beta integrada por estímulos no verbales. A posteriori, los psicólogos del ejército crearon el test Army Performance Scale Examination, de aplicación individual, sobre personas que, por un motivo u otro, no era recomendable evaluar colectivamente y requerían de exámenes más minuciosos. Las tareas no verbales incluidas en la escala, tales como Figuras Incompletas, Historietas, Dígitos o Rompecabezas, sentaron notables antecedentes en el ámbito de la evaluación de la inteligencia (Flanagan y Kaufman, 2006; Jones y Thissen, 2007).
Entre los muchos psicólogos que trabajaron en la construcción y aplicación de las escalas Army, se encontraba el joven David Wechsler. Wechsler había nacido en Rumania en 1896 y a los pocos años emigró con su familia a los Estados Unidos. Realizó sus estudios en el City College y en la Columbia University de Nueva York, donde a los 21 años obtuvo el grado de maestrando.
A poco de iniciarse la I Guerra Mundial, Wechsler se sumó a los profesionales que ingresaron a las fuerzas armadas de su país. Fue asignado a Camp Logan en Texas donde tuvo la oportunidad de aprender y trabajar junto a pioneros de la psicología científica como Karl Pearson, Charles Spearman, Edward Thorndike y Robert Yerkes. Wechsler era uno de los psicólogos encargados de puntuar los protocolos del Army Alpha Test y de evaluar con más completud, utilizando el Stanford-Binet Test, a aquellos reclutas que habían tenido un bajo desempeño. Esta época significó no solo la oportunidad de trabajar con profesores prominentes sino también una inestimable experiencia clínica en la evaluación de la inteligencia. En 1918, junto con Pearson y Spearman, fue enviado a la University of London para profundizar en la investigación de la capacidad intelectual.
Posteriormente obtuvo una beca del American Field Fellow-ship para estudiar en Francia. En París trabajó bajo la dirección de los famosos psicólogos H. Piéron y de L. Lapicque. Más tarde, en 1925, completaría sus estudios de doctorado en psicología experimental bajo la dirección de Robert Woodworth. En 1932 fue nombrado psicólogo en jefe de la Clínica de la Universidad de Nueva York, la prestigiosa Bellevue Psychiatric Hospital.
Fue en ese contexto donde Wechsler articuló los aportes precedentes y desarrolló una nueva propuesta que reunía tanto una valoración global como la evaluación de la capacidad verbal y de ejecución. Las escalas creadas por el autor, desde su primera versión publicada en 1939 (Wechsler-Bellevue Intelligence Scale I –WBI– ), fueron desarrolladas sobre la base del concepto de inteligencia operacionalizado como: “la capacidad agregada y global del individuo para actuar con propósito, para pensar racionalmente y para habérselas de manera efectiva con su medio ambiente. Es global porque caracteriza la conducta individual como un todo; es un agregado porque se halla compuesta de elementos o habilidades, las cuales, aunque no completamente independientes, son cualitativamente diferenciales” (Wechsler, 1955: 4). Conforme a esta concepción funcional resulta nodal evaluar la inteligencia en la conjunción de diferentes habilidades intelectuales, su combinación y el modo en que ellas se enlazan con atributos tales como la planificación y conciencia de objetivos, el entusiasmo que despierta la tarea, la dependencia e independencia, la impulsividad, la ansiedad y persistencia. Si bien estos aspectos motivacionales y afectivos no se ofrecen visiblemente para su evaluación psicométrica, están siempre implicados tanto en el desempeño del test como en la modalidad con que se enfrentan los desafíos que supone el cotidiano vivir.
En síntesis, la inteligencia es concebida como parte de un complejo conjunto, es decir, de la personalidad en sí, y admite ser conocida a partir del comportamiento que promueven estímulos estandarizados, adecuados a la edad de sus destinatarios. Concepción teórica que se refleja en la composición de las diversas versiones del test y en las ponderaciones asignadas a cada subtest. Si bien ningún test cubre integralmente el amplio espectro de habilidades intelectuales, las escalas de Wechsler fueron diseñadas para evaluar aspectos cognitivos lo suficientemente amplios como para permitir que los resultados constituyeran índices representativos de la capacidad intelectual.
Los avances en las operacionalizaciones del polifacético constructo “capacidad intelectual”, los estudios sobre especificidades evolutivas y las actualizaciones en metodología psicométrica que apuntan a potenciar la validez y fiabilidad de los tests, respaldó la construcción de sucesivas versiones. El WISC-R, publicado en 1974, fue la última de las escalas, editada en vida del autor; sus seguidores han mantenido, con oportunas transformaciones, la vigencia del instrumento. Desde sus inicios y más allá de la pérdida de su mentor, todos y cada uno de los tests de inteligencia de Wechsler se posicionaron en un lugar internacional de reconocimiento y popularidad preferencial, tanto en el ámbito de la investigación como en el de la evaluación clínica y psicométrica de la inteligencia (Alfonso et al., 2000; Flanagan, 2000; Flanagan y Kaufman, 2006; Kaufman et al., 1997). En la figura 1.1. se ilustra la secuencia con que fueron publicadas originalmente las versiones del test.
Figura 1.1. Escalas de Inteligencia de Wechsler.
A diferencia de otros países con más desarrollo en tests y en coincidencia con los latinoamericanos, en la Argentina la diversidad de instrumentos psicológicos para la evaluación de la capacidad intelectual es más acotada y, con frecuencia, la mayoría de ellos son importados. Respecto de las escalas de Wechsler en nuestro medio, las siguientes versiones fueron adaptadas, estandarizadas y publicadas por Editorial Paidós:
Las diversas versiones de la prueba, desde 1939 (Wechsler-Bellevue I) hasta 1989 (WPPSI-R) mostraron similitudes en la evaluación de las funciones cognitivas a través de las clasificaciones: CI Verbal (CIV), CI de Ejecución (CIE) y CI Total (CIT).
Los estudios factoriales realizados por Cohen (1959) y las posteriores investigaciones sobre el WISC-R desarrolladas por Kauf-man (1975) describieron una estructura trifactorial que sirvió de apoyatura para que en el WISC-III se introdujeran modificaciones relevantes que ampliaron –con la incorporación de la valoración de Puntuaciones Índices (PI) Comprensión Verbal, Organización Perceptiva, Velocidad de Procesamiento y Ausencia de Distractibilidad– las tradicionales clasificaciones diagnósticas (CIV, CIE y CIT). Esta modalidad se mantuvo en el WAIS-III (1997), donde los PI se denominan Comprensión Verbal, Organización Perceptiva, Velocidad de Procesamiento y Memoria de Trabajo. El WPPSI-III (2002), teniendo en cuenta la edad de sus destinatarios, agrega a la evaluación de CIV, CIE y CIT las ponderaciones de Índice Velocidad de Procesamiento y Puntaje Compuesto Lenguaje General.
La cuarta generación del test, iniciada con el WISC-IV (2003), instituye una nueva propuesta que condensa nuevas conceptualizaciones sobre las funciones cognitivas elaboradas sobre la base de los avances en neurociencia y sobre el modelo de inteligencia fluida y cristalizada. Además, incorpora actualizaciones de los estímulos, modificaciones en las pautas de administración, progresos en metodología psicométrica y considera las nuevas normas que se desprenden de la legislación señaladas en el Acta sobre Educación de Personas con Discapacidad (IDEA, Individuals with Disabilities Education Act). Los cambios se reflejan en el abandono de la tradicional clasificación de CI Verbal y de Ejecución, en procura de evaluar los dominios cognitivos específicos implicados en los Índices Comprensión Verbal, Razonamiento Perceptivo, Memoria Operativa y Velocidad de Procesamiento. Las aperturas y actualizaciones descriptas se reflejan también en la última versión de la Escala WAIS-IV (2008) y WPPSI-IV (2012). La figura 1.2. presenta una reseña histórica de la evolución de las escalas de Wechsler y la figura 1.3. sintetiza las Puntuaciones Compuestas en las actualizaciones de las mismas. Para una descripción detallada de los antecedentes de las escalas de Wechsler en español, consúltese la revisión de Piacente (2012).
Figura 1.2. Revisión histórica de las escalas de Wechsler.
|
|
Figura 1.3. Calificaciones CI y PI de las escalas de Wechsler en su devenir histórico. |
Las escalas de Wechsler desde su primera edición, se evalúan a partir de la transformación de puntuaciones directas de los subtests en puntajes equivalentes, con una media de 10 y una desviación estándar de 3, a efectos de hacerlas comparables entre sí. La suma de estas puntuaciones se transforman en Cociente Intelectual (CI) de desviación a partir de una escala métrica con una media de 100 y una desviación estándar de 15. Esta misma metodología se aplicó para el cálculo de las Puntuaciones Índices (PI) introducidas a partir del WISC-III (figura 1.4).
Cabe subrayar que los procesos de ajustes de contenidos y tipificación de las pruebas psicológicas construidas en el extranjero son una condición sine qua non, dado que la evaluación psicométrica puede resultar distorsionada por múltiples causas, entre las que han de destacarse las siguientes:
|
|
Figura 1.4. Unidades de medida de Puntuaciones Escalares de los subtests (M = 10 DE = 3) y de los CI y/o PI de las Escalas (M = 100 DE = 15). |
Desde este posicionamiento, el análisis de validez y fiabilidad de las pruebas psicométricas resulta ineludible tanto para quienes las construyen o adaptan y estandarizan, como para los usuarios encargados de interpretar –en términos de evaluación y/o diagnóstico– las particularidades de cada producción. La idoneidad del instrumento para captar lo que pretende evaluar se explora a través de la conjunción de los estudios de:
Por otra parte, los coeficientes de fiabilidad, los errores estándar de medición y los intervalos de confianza que rodean los puntajes del test, indican tanto la precisión de la medida con la que se ha explorado el constructo como la significación estadística de las diferencias entre los puntajes y la frecuencia con que tales diferencias se registran en la población de referencia.