CAPÍTULO 2
Antecedentes y tipos de interpretación de las escalas de Wechsler

Alejandra Taborda – María Elena Brenlla

A medida que se fue expandiendo el uso de las escalas de Wechsler, también se desarrollaron investigaciones acerca del funcionamiento intelectual, se refinaron métodos para el análisis estadístico de los datos y se generaron enfoques acerca de cómo entender la evaluación psicológica. En consecuencia, las ideas acerca de cómo interpretar los tests de Wechsler se fueron modificando con el tiempo. Por ello, a continuación se describen brevemente qué tipos de interpretación fueron aplicados a ellos y cuáles fueron las tendencias más importantes desde la primera publicación del WISC hasta el momento.

2.1. Tipos de interpretaciones

2.1.1. Análisis normativo

Una de las características fundamentales de las escalas de Wechsler en general y del WISC-IV en particular es que, en los estudios de tipificación, se transforman las Puntuaciones Directas en otras más fácilmente interpretables. En particular, en los subtests del WISC-IV, los valores brutos se transforman a Puntuaciones Escalares o equivalentes según una escala común, donde la media es de 10 y el desvío estándar de 3. Estas puntuaciones para cada subtest van en un rango de 1 a 19. Sobre la base de estas puntuaciones se construyen las Puntuaciones Compuestas (Cociente Intelectual Total e Índices) que implican una media de 100 y un DE de 15. Estas transformaciones posibilitan el análisis normativo, vale decir comparaciones externas con la muestra de tipificación que son la esencia de las comparaciones interindividuales. Por ejemplo, cuando se analiza el CI o Índices obtenidos por un sujeto y se concluye que su nivel intelectual es “medio”, “medio alto” o “medio bajo” dicha inferencia se realiza sobre la base del análisis normativo.

2.1.2. Análisis ipsativo

En el análisis ipsativo, en cambio, el marco de referencia para las comparaciones es la producción del individuo y no el grupo normativo, posibilitando un análisis intraindividual del rendimiento. Por ejemplo, cuando se calcula la media obtenida por un niño en el Índice de Comprensión Verbal para analizar qué subtests son los que contribuyen en mayor o menor medida a su producción, el punto de referencia es el propio niño y no los datos de la muestra normativa. Según Cattell (1988) las evaluaciones ipsativas restringen la varianza intraindividual. Por ello, es un tipo de análisis muy utilizado en el ámbito clínico.

2.2. Continuidades y discontinuidades en la interpretación de las escalas de Wechsler

A lo largo del tiempo y al compás de las numerosas investigaciones que acompañan las modificaciones introducidas en los tests de Wechsler, las interpretaciones diagnósticas de la prueba trazan su propio trayecto. Flanagan y Kaufman (2006) reseñan la descripción que realiza Kamphaus et al. (1997) sobre la historia de la interpretación de los tests de inteligencia en general y, en particular, los aportes de Wechsler. Al respecto refieren secuencialmente cuatro tendencias: 1) cuantificación de un nivel general; 2) aplicación clínico de un perfil; 3) análisis psicométrico del perfil, y 4) aplicación de la teoría.

2.2.1. Cuantificación de un nivel general

Wechsler (1939) –bajo la influencia de las operacionalizaciones vigentes en aquel momento que señalaban la prevalencia de un factor “g” (Spearman) o identidad global, congruente también con lo propuesto por Terman, Binet et al.– ofreció su propia definición de inteligencia. La concibió como “el conglomerado o capacidad global de una persona para actuar con una finalidad, pensar racionalmente e interactuar con su entorno de modo efectivo” (p. 3). Con esta construcción conceptual, que guió la interpretación de los resultados en el test, el autor evitó centralizar la evaluación en una capacidad concreta, aunque ella fuese primordial en el desempeño intelectual, como por ejemplo la capacidad de razonar verbalmente, o abstraer o realizar cálculos, entre otras. De esta manera, si bien fue un pionero en reconocer factores no intelectivos en la capacidad intelectual, ello no fue obstáculo para que Wechsler diseñara una medida global –el Cociente Intelectual por desviación– que presentó diferencias sustantivas con los anteriores. Convencionalmente, el CI expresa una razón o número índice. Por ejemplo, el cálculo del CI de Stern consistía en la división entre la Edad Mental y la Edad Cronológica (CI = EM/ECx100) (Cortada de Kohan, 1977). Pronto este modo tropezó con un problema técnico importante: que las medidas correspondientes a diferentes niveles de edad no resultaban comparables. Por esta razón, Wechsler propuso el CI de desviación. Este consiste en puntuaciones z (z = X–M/DE) transformadas, con valores de referencia que incluyen una media de 100 y un desvío estándar de 15. Dado que este CI no se obtiene mediante cocientes, la justificación para el nombre de CI estriba en la familiaridad general de la expresión y no en el cálculo que lo origina. En la actualidad, es una de las puntuaciones transformadas más usadas en psicología y su mérito es permitir comparaciones respecto del grupo de referencia apropiado. De este modo, si bien la línea teórica dominante de esa época posicionó la clasificación del CI en un punto nodal de evaluación en los tests, los aportes de Wechsler (1939) gradualmente abrieron el camino a la segunda tendencia interpretativa, en pos de captar el modo particular con que cada sujeto delinea su desempeño.

2.2.2. Análisis clínico de un perfil

La característica mas importante introducida con la Escala de Inteligencia Wechsler-Bellevue I y II (WB-I; WB-II), que anunció una interpretación más allá de la clasificación según el CI Total, fue la agrupación de los tests en los conjuntos Verbal y de Ejecución para captar diversos modos, verbales y no-verbales, en la expresión de la capacidad intelectual.

Paulatinamente, el diagnóstico se centralizó en las variaciones obtenidas en los subtests y en las puntuaciones CI. Desde esta óptica, la evaluación es concebida como una actividad in-terpretativa en la que los puntajes de los tests son solo una de las apoyaturas que respaldan la elaboración de descripciones psicológicas amplias e integradas de cada sujeto en particular. Posicionamiento que sienta las bases para el pasaje de conceptualizaciones focalizadas en la evaluación de la inteligencia como constructo unitario a las posteriores operacionalizaciones teóricas y técnicas sobre el diagnóstico de sujetos habitantes de un tiempo, un espacio, una época, con sus articulaciones entre cultura y singularidades personales.

Las vicisitudes que planteó la lectura de los perfiles obtenidos en las escalas de Wechsler promovió la búsqueda de integrar diferentes marcos teóricos, entre ellos los paradigmas clínicos y psicogenéticos.

Los desarrollos desde el punto de vista clínico fueron iniciados por Rappaport, Gil y Shafer (1946), consecutivamente ampliados por Schafer (1948) y por Shapiro (1954), entre otros. En la Argentina, tal como señala Cayssials (1998), estos aportes tomaron mayor difusión a partir de las obras Interpretación clínica de la Escala de Inteligencia de Wechsler para niños de Glasser y Zimmerman (1967) e Interpretación clínica de la Escala de Inteligencia de Wechsler para adultos de Zimmerman y Woo-Sam (1973).

Los autores citados coinciden en señalar que la insistencia en ubicar a los sujetos en categorías predeterminadas conlleva a olvidar la dinámica individual, y es precisamente la posibilidad de dilucidar esta dinámica, la esencia del diagnóstico. Por lo tanto, será el estudio del tipo de éxitos y fracasos o equivocaciones lo que haga posible elaborar perfiles cualitativos y fenomenológicos de los atributos personales. Desde esta óptica, la evaluación cualitativa permite observar y describir cómo se ponen en juego los conocimientos intelectuales adquiridos, los métodos para resolver problemas, las posibilidades de verbalizar significativamente y de eludir-aludir los componentes emocionales en el momento de solucionar problemas que requieren respuestas cognitivas. Así como también, las modalidades adaptativas y defensivas desplegadas frente a la tensión de ser examinado. En otras palabras, ¿cómo se enfrentan los momentos iniciales?, ¿qué conductas surgen en el transcurrir?, ¿de qué modo y frente a qué estímulos aparece la inhibición/excitación?, ¿muestra necesidad de aprobación?, ¿cómo resuelve los enigmas del puedo/no puedo?, ¿cómo consigue el éxito/fracaso?, ¿cómo reacciona frente a él?, ¿qué significa saber/no saber?

Esta perspectiva abrió líneas de trabajo que ubicaron a los tests en el marco de procesos diagnósticos, como instrumentos intermediarios, interlocutores capaces de facilitar la tarea de desentrañar “sentidos”, inmersos en un diálogo en el que se articulan diferentes lenguajes. Mannoni (1973), señala: “se deben considerar los tests como ensayos (con sus posibilidades de errores) y no como textos legislativos que ordenan tal o cual orientación” (p. 217).

En busca de ampliar la interpretación cualitativa, Pain (1974), por su parte, desde un modelo dialéctico estructuralista de la inteligencia provee bases explicativas para el análisis de los subtests de la Escala de Wechsler para adultos (WAIS); pasibles de hacer extensibles a los subtests del WISC, según los estudios de Cayssials (1998) y a los del WPPSI, según Taborda (2002). Sus aportes se focalizan en los procesos psicológicos implicados en la resolución de cada subtest, teniendo en cuenta la dimensión tanto diacrónica inferible del nivel genético de las estructuras cognitivas presentes como la sincrónica expresada a través de la relación entre los componentes de distintos comportamientos.

Las integraciones que ofrecen tanto el enfoque psicogenético como el clínico han desencadenado acuerdos y controversias teóricas y técnicas sobre la temática. Respecto del primero, Guilford (1967) refiere que Piaget logra desarrollar una teoría del conocimiento y su evolución, más que de la inteligencia. A su vez, autores como Cayssials (1998), Pain (1974), Sattler (1992) y Taborda (2002) coinciden en considerar que, si bien los marcos referenciales piagetianos y psicométricos difieren significativamente, no obstante, cuando se complementan, es posible elaborar descripciones más amplias de las habilidades cognitivas.

En cuanto al segundo enfoque, Flanagan y Kaufman (2006) señalan que si bien las contribuciones del análisis clínico de un perfil enriquecen la interpretación de los tests de Wechsler, esto no logra potenciar la validez en el análisis las discrepancias entre las puntuaciones registradas. Según Sattler (1992), no existen evidencias que apoyen la suposición de que patología y variabilidad en las puntuaciones registradas en los subtests estén relacionadas; por lo tanto las formulaciones sustentadas en el análisis del perfil deben ser consideradas a modo de hipótesis a verificar. Precisamente este es uno de los aspectos que promueve el desarrollo de investigaciones orientadas a incorporar nuevos lineamientos para la interpretación de los resultados.

2.2.3. Análisis psicométrico del perfil

Si bien la segunda ola tuvo el mérito de introducir una visión más cualitativa en la evaluación de los perfiles, pronto comenzó a ser criticada debido a los estudios psicométricos que interpelaban la validez de las inferencias clínicas que se realizaban. Los estudios factoriales de Cohen (1949, 1955, 1959) pusieron de manifiesto tres cuestiones. La primera fue que la medida global utilizada –el CI– mostraba varianza compartida entre los tests. De esta manera las ideas originales de Wechsler acerca de un factor global de la inteligencia se justificó empíricamente. La segunda, que de los datos podía deducirse una estructura trifactorial, lo cual puso en entredicho el modelo dicotómico (CIV y CIE) para el análisis del test. Estos hallazgos sustentaron la idea de tres factores principales a los que Cohen denominó Comprensión Verbal, Organización Perceptiva y Ausencia de Distractibilidad. Y, en tercer lugar, aludía a una limitada especificidad de los subtests, que interpelaba la validez de la interpretación individual de ellos. En esta dirección, Cohen (1959) demostró que los subtests contaban con una acotada varianza fiable específica que restringía el valor diagnóstico. Asimismo, estudios transculturales señalaron la importancia que reviste considerar en el análisis de los perfiles tanto si las diferencias entre puntuaciones son significativas o se deben al azar, como cuán común o, por el contrario, cuán infrecuente son esas variaciones en la población de sujetos normales de la misma edad de la persona estudiada.

La revisión del primer WISC –el WISC-R– fue el intento más significativo por aplicar el análisis psicométrico del perfil para la interpretación. En esta versión se empleó una muestra mayor, se actualizaron contenidos gráficos y verbales, se eliminaron los considerados vetustos y se procuró mejorar las pautas de administración y puntuación.

Kaufman (1979), desde un enfoque denominado psicometría razonada, presentó un abordaje integrador en el que subraya que el WISC, en sus diversas versiones, es un test de aplicación individual que, a su vez, requiere de una interpretación personalizada, capaz de describir hipótesis explicativas del patrón de puntuaciones obtenidas. Además, puso de relieve la complejidad dialéctica y solidaria existente entre el cómo se piensa y el qué se piensa, entendiendo por pensamiento toda actividad consciente, inconsciente, sensoriomotora, simbólica o conceptual, que supone procesos asimilativos a esquemas de acción previos y su coordinación. En otras palabras, el comportamiento intelectual está indisolublemente integrado en la estructura total de la personalidad. Los CIV y CIE pueden proveer un adecuado conocimiento de las funciones mentales en algunos sujetos, pero en otros es probable que se requiera atender a contribuciones tales como las derivadas del análisis factorial, la división de los subtests propuesta por Bannatyne (1974) o Meeker (1975), de la teoría del desarrollo o de la neuropsicología, del análisis clínico del test, del conocimiento de un dialecto y su impacto en la producción o de un conjunto de hipótesis que resultan solo aplicables a un niño o un adolescente en particular.

Más tarde, Kaufman (1994) diseñó un método interpretativo del WISC-III sobre el análisis del perfil según los ejes cognitivo, conductual y clínico. Allí se describen las habilidades intelectuales evaluadas en cada subtest de acuerdo al modelo de problemas de aprendizaje: Input, Integración, Almacenamiento, Output. Según este enfoque, para llevar adelante la labor interpretativa diagnóstica, se requiere que el examinador cuente con amplios conocimientos psicométricos y que esté actualizado sobre los aportes vigentes en varios campos de la psicología. Al respecto Cayssials (1998), sustentada en los desarrollos de Kaufman, afirma que “los que utilizan los tests deben ser mejores que los tests que utilizan”, es decir, deben aplicar sus conocimientos de Piaget, Guilford, Cattell, Glasser y Zimmerman, así como también poner en consideración las peculiaridades de la población de pertenencia, a fin de producir una interpretación del perfil teóricamente pertinente. En especial, es de hacer notar un aporte esencial de Cayssials, el de la idea del “sondeo adicional” (1998: 82-84) no solo para enriquecer el análisis cualitativo sino para precisar el dominio que está siendo evaluado. De este modo, el paradigma de la complejidad transversalizó la interpretación de los resultados psicométricos.

El abordaje integrador propuesto ha recibido diversas críticas, entre ellas, las de Sattler (1992) quien considera que las puntuaciones obtenidas en los subtests no miden procesos únicos y son menos confiables que las clasificaciones de los CI. Además, refiere que las escalas de Wechsler fueron históricamente construidas para tomar en cuenta los factores que contribuyen a la capacidad intelectual efectiva global de un individuo. En ningún caso se diseñaron subtests para medir habilidades primarias al estilo de Thurstone y Chave (1929) y tampoco se pretendió otorgarles un orden jerárquico. Asimismo Flanagan y Kaufman (2004) subrayan que a pesar de las múltiples investigaciones y sus reseñas sobre el análisis del perfil de los tests de Wechsler, esta modalidad interpretativa presenta limitaciones, principalmente por la debilidad de los soportes empíricos y teóricos. Estas aseveraciones se basan en los estudios de Mueller, Dennis y Short (1986) quienes, a partir del metaanálisis de 119 publicaciones con datos del WISC-R, concluyeron que la interpretación en términos de perfil presentaba restricciones para diferenciar entre varios grupos diagnósticos. Posteriormente, resultados similares fueron obtenidos por Glutting, McDermott y Konld (1997), Kamphaus (1993) Mc Dermott, Fantuzzo, Glutting, Watkins y Baggaley (1992).

2.2.4. Análisis del perfil como aplicación de la teoría

Como se indicó, evaluar un perfil del WISC solo sobre la base del análisis clínico puede conducir a errores de interpretación, ya que los estudios mostraron que la varianza específica de los subtests es poco fiable y, consecuentemente, el análisis de una prueba concreta –por ejemplo, Semejanzas– como medida de comprensión verbal puede ser incorrecto dado que este subtest comparte varianza también con la habilidad para la conceptualización verbal y la Inteligencia Cristalizada. A su vez, si bien fueron encomiables los esfuerzos de Kaufman por considerar en forma conjunta el análisis clínico y psicométrico del perfil, lo cierto es que pronto evidenciaron deficiencias debido a su bajo soporte empírico y a que no representaban una teoría de la inteligencia bien validada. No obstante, también es cierto que la construcción de teoría desde el enfoque psicométrico posibilita entender qué es lo que evalúa efectivamente un test. Máxime en el caso de las escalas de Wechsler que, como es conocido, se diseñaron sobre la base de un criterio clínico y no psicométrico. Kaufman (1971) apuntaba que los problemas para la interpretación del test se podían atribuir a esta falta de una base teórica para orientar a los profesionales.

Sobre todo el WISC-III ha sido profusamente criticado porque si bien incluyó índices específicos y se agregó un subtest nuevo (Búsqueda de Símbolos) no cambió sustantivamente con respecto al WISC-R ni se acopló a la teoría. Tengamos en claro que cuando Flanagan, Kaufman u otros autores señalan estos defectos hacen referencia específicamente a la falta de ajuste de las escalas de Wechsler con la teoría jerárquica de la inteligencia devenida de las propuestas de Cattel, Horn y Carroll y que, actualmente, se conocen con el nombre de teoría CHC. Piénsese que la mayoría de los tests aggiornados o diseñados en las dos últimas décadas –tales como el Test de Stanford-Binet 5 y el KABC-II– se realizaron sobre la base de la teoría CHC. En términos esenciales, la teoría CHC sostiene que las habilidades intelectuales se organizan en tres estratos: un estrato general, un estrato amplio (broad strata) y un estrato próximo (narrow strata). El primero designa a una habilidad intelectual general que, en términos psicométricos, se corresponde con el factor g; el segundo refiere a entre ocho y diez habilidades amplias (Inteligencia Cristalizada, Razonamiento Fluido, procesamientos visual y auditivo, memoria de corto plazo, recuperación a largo plazo, velocidad de procesamiento y conocimiento cuantitativo) y, el tercer estrato contiene cerca de 90 componentes que denotan habilidades limitadas y se subsumen al estrato anterior como razonamiento cuantitativo, inducción, fluidez asociativa, velocidad perceptual, desarrollo del lenguaje, conocimiento léxico, entre otras (Schneider y McGrew, 2012).

En procura de ofrecer un marco interpretativo que incluyera el rigor psicométrico y los hallazgos de la teoría CHC, Kaufman ideó un método de interpretación que publicó en Intelligent testing with the WISC-III. En este, retomaba las ideas ya expuestas en la psicometría razonada y las combinaba con métodos basados en aspectos teóricos. Por su parte, Flanagan y colaboradores diseñaron el método de batería cruzada (cross-battery) (Flanagan y Ortiz, 2001; McGrew y Flanagan, 1998), caracterizada por una integración sistemática de datos de habilidades cognitivas pero también de evaluaciones de rendimiento, con el objetivo de expandir la interpretación tradicional del perfil.

A pesar de los esfuerzos de Kaufman y Flanagan, los estudios mostraron que el WISC-III no concordaba con los hallazgos de la teoría CHC (Shaw, Swerdlik y Laurent, 1993). No obstante, siguió siendo el test más utilizado para evaluar la inteligencia en niños, lo que muestra que, a pesar de las críticas iniciales, los profesionales siguieron confiando en las escalas de Wechsler.

Con el advenimiento del siglo XXI y la acumulación de evidencia en favor de la CHC, se hizo necesario realizar una profunda revisión. En tal sentido, el WISC-IV representa indudablemente un cambio radical en la historia de los tests de Wechsler. Como se describe en el capítulo siguiente, las innovaciones más significativas responden a la idea de aggiornar el test a la teoría. Por ejemplo, se mantuvo el concepto de un factor global de la inteligencia –representado por el CI– pero se eliminaron el CI Verbal y el de Ejecución, ya que los estudios no apoyaron empíricamente la hipótesis de estos dos componentes pero sí la presunción de cuatro dominios específicos (Comprensión Verbal, Razonamiento Perceptivo, Memoria Operativa y Velocidad de Procesamiento) que agrupan tanto subtests clásicos del WISC como otros completamente nuevos. A su vez, los estudios factoriales confirmatorios llevados a cabo por Keith et al. (2006) sugirieron un reagrupamiento de los subtests en cinco componentes que, a juicio del autor, representan una manera mejorada de interpretar el test.

Debido a que los resultados de estudios llevados a cabo en nuestro medio para analizar los datos en función de la teoría CHC (Brenlla, 2011, 2013) presentan similitudes pero también diferencias respecto de cómo están compuestos los dominios en las investigaciones norteamericanas –muy probablemente debido a particularidades culturales en la adquisición de conocimientos– es que proponemos que en la interpretación de las escalas de Wechsler se consideren estos resultados. En este sentido, podríamos nominar a esta cuarta tendencia como de “análisis del perfil sobre la base de la aplicación contextual de la teoría”.

Como consecuencia, el método de interpretación que se brinda en este libro combina elementos del enfoque de Flanagan y Kauf-man (2001), la noción de “sondeo adicional” de Cayssials (1998) y los resultados de investigaciones realizadas en nuestro medio acerca de la correspondencia de los datos del WISC-IV con la teoría CHC (Brenlla, 2011, 2013). La figura 2.1. resume las tendencias interpretativas adoptadas a los largo del tiempo.

1º CUANTIFICACIÓN DE UN NIVEL GENERAL

  • Focalizada en la evaluación del CIT como entidad global.
  • La definición de inteligencia propuesta por Wechsler abrió la puerta a una estructura dual (CIV y CIE).

2º ANÁLISIS CLÍNICO DEL PERFIL

  • Interpretación de la diferencia verbal-ejecución.
  • Interpretación de la forma del perfil de los tests.
  • Interpretación de puntuaciones de test y respuestas a elementos.
  • Perfil de test como revelador de información diagnóstica.
  • Impacto significativo de Rapaport et al. (1946).

3º ANÁLISIS PSICOMÉTRICO DEL PERFIL

  • Aplicación de los datos psicométricos a la interpretación.
  • Interpretación de factores obtenidos empíricamente.
  • Incorporación de la especificidad de los tests en la interpretación.
  • Disminución del énfasis en la interpretación de un test en concreto.
  • Se cuestiona la validez del análisis del perfil.
  • Cohen (1959) tiene un impacto significativo.
  • Nuevas categorías de test (Bannatyne, 1974).
  • Enfoque de examen “inteligente” (Kaufman, 1979).

4º APLICACIÓN DE LA TEORÍA

  • Agrupación teórica de los tests.
  • Interpretación según la teoría CHC.
  • Interpretación según la PASS (Naglieri y Das, 1997).
  • Validación confirmativa de hipótesis.
  • Enfoque de examen “inteligente” (Kaufman, 1979, 1994).
  • Libro sobre Wechsler (Flanagan, McGrew y Ortiz, 2000).
  • Enfoque de batería cruzada CHC (Flanagan y Ortiz, 2001).

Figura 2.1. Descripción de las tendencias interpretativas.