| Tests de laboratorio y tests psicológicos como criterios diagnósticos |
|
|
Una cuestión de creciente importancia es el papel que debe asignarse a los hallazgos de laboratorio y a los tests psicológicos en el diagnóstico clínico (Widiger y Trull, 1991). El DSM-IV incluye en los apartados que se ocupan de algunos trastornos información sobre hallazgos de laboratorio. Pero estos datos no reciben todavía la categoría de criterios diagnósticos, lo cual es objeto de discusión. El test de supresión de dexametasona, por ejemplo, es probablemente tan válido para el diagnóstico de la melancolía como cualquiera de los signos y síntomas que conforman los criterios diagnósticos de ese trastorno (Zimmerman y Spitzer, 1989). En algunos trastornos, como los del sueño, la no inclusión de datos de laboratorio entre los criterios diagnósticos es todavía más difícil de entender; medidas polisomnográficas como la electroencefalografía, electrocardiografía, electromiografía, saturación de oxígeno en sangre, son básicas para establecer con cierto grado de seguridad la presencia de un trastorno del sueño o su diferenciación respecto de otros (Jacobs et al., 1988). En el DSM-IV se ha avanzado algo en este sentido, al incluir un apartado de hallazgos de laboratorio en la descripción de la mayoría de los trastornos.
Existen, no obstante, serias consideraciones que explican el recelo con el que se ve la posibilidad de incluir tests de laboratorio entre los criterios diagnósticos de los trastornos mentales. Se ha argumentado, por ejemplo, en contra de ello, aludiendo a la no disponibilidad de los instrumentos necesarios por parte de muchos centros (Kales et al., 1987). Por otro lado, la mayor parte de las veces no existen procedimientos uniformes de administración y puntuación de las pruebas de laboratorio, lo que puede llevar a que un mismo test sea aplicado y valorado de manera diferente en diferentes centros (Kupfern y Thase, 1989). Además, la velocidad con la que avanza la investigación haría que los tests de laboratorio que formasen parte de los criterios diagnósticos de algunos trastornos quedasen rápidamente anticuados (APA Task Force on Laboratory Tests in Psychiatry, 1987).
Pese a las dificultades (solventables) mencionadas, el número de tests de laboratorio contrastados que se podrían incluir entre los criterios diagnósticos de diferentes trastornos es enorme; por ejemplo (Widiger y Trull, 1991; Mohr y Beutler, 1990; Cowley y Arana, 1990; Freund y Blanchard, 1990): toxicología para los trastornos por abuso de sustancias, infusión de lactato para el trastorno de ansiedad con crisis de pánico, niveles de monoaminooxidesa para una gran variedad de trastornos, electroencefalograma para el delirium, tomografía axial computerizada, resonancia magnética nuclear y tomografía por emisión de positrones para la esquizofrenia, etc.
En un estatus similar al de las pruebas e laboratorio se encuentran, respecto al
diagnóstico clínico, los tests psicológicos. No es habitual encontrar resultados de
tests psicológicos entre los criterios diagnósticos de los trastornos mentales, aunque
sí que se pueden encontrar en algunos de los trastornos del desarrollo, como ocurre
cuando se establece el grado de retraso mental aludiendo a determinados intervalos de CI.
Pero sin duda el número de trastornos entre cuyos criterios diagnósticos podrían
figurar tests psicológicos es mucho mayor: pruebas neuropsicológicas para la
esquizofrenia, cuestionarios y tests objetivos para los trastornos de personalidad,
trastornos del estado de ánimo, de ansiedad, de la alimentación, etc. De hecho muchos
clínicos prefieren basar su diagnóstico en mayor medida en estos tests (p.ej. a partir
del perfil del MMPI) que en la valoración de signos y síntomas mediante la exploración
psicopatológica que se lleva a cabo durante la entrevista (Widiger y Trull, 1991).
Marcadores
Los datos de laboratorio (ya sean biológicos, cognitivos o conductuales) y los resultados de los tests psicológicos pueden tomarse como marcadores de los trastornos psicopatológicos. Iacono y Ficken (1989) clasifican los marcadores en tres tipos: de episodio, de vulnerabilidad y genéticos. Los marcadores de episodio sólo se manifiestan durante las fases sintomáticas, por lo que no son apropiados para identificar sujetos de alto riesgo. Sí que son adecuados, en cambio, para delimitar el inicio y el final de un episodio activo, y para guiar al clínico acerca del momento de inicio y del final de las intervenciones terapéuticas. Un ejemplo de marcador de episodio es la reducción de latencia del sueño REM, respecto a la depresión (Kupfer, 1982), que recupera valores normales tras la remisión clínica del trastorno (Avery, Wildschiodtz y Rafaelsen, 1982). Los marcadores de vulnerabilidad son rasgos estables que se encuentran presentes antes, durante y después de los episodios activos, por lo que son adecuados para identificar individuos de alto riesgo. Algunos pueden estar bajo control genético, pero otros aparecen y se relacionan con el trastorno en cuestión como consecuencia de factores o sucesos ambientales (anoxia en el nacimiento, etc.). La diferencia entre un marcador de vulnerabilidad bajo control genético y un marcador genético está en que el primero se expresa en familiares que pueden estar o no genéticamente predispuestos a desarrollar el trastorno, en cambio un marcador genético siempre indica predisposición genética a desarrollar el trastorno. Ejemplos de marcadores de vulnerabilidad bajo control genético pero que no son marcadores genéticos vienen dados por rasgos como el color de la piel; al menos en determinados entornos sociales los individuos de raza negra tienen más predisposición a sufrir trastornos mentales que los de raza blanca, siendo por tanto el color de la piel un marcador de vulnerabilidad controlado genéticamente, pero no es un marcador genético de ningún trastorno mental puesto que no existen datos que hagan pensar en que existe una relación fisiológica entre el color de la piel y algún tipo de trastorno mental, es decir los genes que determinan los trastornos mentales y los que determinan el color de la piel no están relacionados (Iacono y Ficken, 1989). Un marcador genético es cualquier rasgo heredado que indica la presencia de un gene o una serie de genes patológicos. Existen diferentes posibilidades de asociación entre un marcador genético y un genotipo patológico (Gottesman y Shields, 1972; Baron et al, 1987):
La identificación y validación de marcadores requiere una secuencia de estudios que comienzan con comparaciones entre sujetos normales y sujetos que sufren un trastorno. Aquellas variables que discriminen adecuadamente entre estos dos grupos pueden ser candidatas a convertirse en marcadores de episodio. Hay que considerar, sin embargo, la posibilidad de que los grupos comparados difieran no sólo respecto a la presencia o ausencia del trastorno sino también en alguna otra condición que pueda afectar a la expresión de la variable estudiada (raza, edad, medicación, drogas, ciclo menstrual, etc.) (Andreassi, 1980). Si, tras controlar la posible influencia de variables extrañas, se encuentra que la característica diferenciadora de sujetos normales y sujetos diagnosticados permanece tras la remisión de los síntomas, entonces es posible que el marcador sea de vulnerabilidad o genético. Si el marcador es genético, estudios realizados con personas normales deberán demostrar que (Iacono y Ficken, 1989):
Los estudios con pacientes deberán mostrar que (Iacono y Ficken, 1989):
Los criterios para la identificación de marcadores de vulnerabilidad son similares a los expuestos para los marcadores genéticos. Sin embargo, un marcador de vulnerabilidad que no esté bajo control genético no será heredable.
Una de las aplicaciones futuras más importantes de los marcadores será probablemente el refinamiento de los diagnósticos; pero también tienen aplicaciones interesantes en la delimitación de grupos de alto riesgo, en la predicción del curso del trastorno en individuos particulares, en la identificación del modo de transmisión hereditaria, y en la especificación de los mecanismos de la patogénesis (Iacono y Ficken, 1989).
Al basarse de manera casi exclusiva en descripciones de síntomas, las clasificaciones actuales de los trastornos mentales favorecen agrupaciones en las mismas categorías diagnósticas de subgrupos etiológica y patofisiológicamente distintos. Ello tiene consecuencias negativas importantes, puesto que la heterogeneidd patogénica puede conducir a imprecisiones en la profilaxis, el pronóstico y el tratamiento. Los marcadores de episodio pueden ser útiles para delimitar grupos que comparten mecanismos patofisiológicos similares. Los marcadores genéticos permiten definir grupos etiológicamente homogeneos (Buchsbaum y Haier, 1983).
El proceso patogénico va mucho más allá de las fases clínicas de los trastornos. Por otro lado, la investigación centrada en las fases clínicas suele prestar más atención a los factores precipitantes inmediatamente anteriores a la aparición manifiesta del trastorno que a otros más distantes en el tiempo. Los estudios longitudinales con sujetos de alto riesgo permiten superar algunos de estos sesgos, pudiendo utilizar marcadores genéticos y marcadores de vulnerabilidad para seleccionar los sujetos a estudiar (Venables, 1978).
Los marcadores genéticos y los marcadores de vulnerabilidad (en menor medida los marcadores de episodio) tienen también utilidad en la formulación de predicciones respecto al curso de los trastornos en individuos particulares. Aquellos en los que los marcadores se expresen con mayor intensidad tendrán mayor riesgo de sufrir el trastorno, de padecer episodios más severos, y tendrán peores pronósticos a largo plazo (Iacono, 1987).
Los diferentes modelos genéticos que se formulan para trastornos específicos son puestos a prueba normalmente examinando su prevalencia en gemelos mono y dizigóticos. Al analizar sólo sujetos clínicos, se excluyen casos subclínicos que junto con aquellos conformarían una muestra más representativa de la población afectada, a la vez que se incluyen casos afectados por posibles formas no genéticas del trastorno, con lo que los resultados pueden estar lejos de reflejar el modo en que la predisposición es transmitida (Iacono y Ficken, 1989). En cambio, la utilización de marcadores genéticos permite seleccionar sujetos a partir de su predisposición genética, independientemente de la forma clínica de presentación del trastorno (Gershon, 1978). El estudio de los marcadores genéticos puede, asimismo, proporcionar información sobre el grado de homogeneidad o heterogeneidad de la etiología genética de un trastorno. Si una alteración tiene varios marcadores genéticos pero se observan correlaciones elevadas entre ellos en pacientes y familiares, cabe pensar que existe una etiología genética común para diferentes manifestaciones del trastorno: Si, por el contrario, los marcadores genéticos no guardan relación entre ellos, probablemente lo que era conceptualizado como un trastorno particular será mejor descrito como una clase de trastornos (Iacono y Ficken, 1989).
Los marcadores también son útiles para estudiar la patogénesis de los trastornos. No
obstante, los marcadores no están siempre relacionados con componentes causales de la
patogénesis. Los marcadores de episodio, por ejemplo, pueden ser resultado de algún
aspecto ambiental que acompaña al trastorno (medicación, estrés, etc.), o un producto
colateral de la patogénesis. Por otro lado, hay que tener cuidado al realizar
generalizaciones sobre la patogénesis a partir del estudio de marcadores en sujetos
normales, puesto que el proceso subyacente al marcador puede estar alterado en pacientes
que sufren un trastorno (Iacono et al, 1984).
Tests psicológicos
De acuerdo con Cronbach y Gleser (1965) y Tack (1980), la primera tarea en el proceso de evaluación psicológica consiste en formular el problema de modo adecuado, puesto que la demanda inicial del cliente es insuficiente muchas veces para guiar al clínico en la elección de las técnicas adecuadas. Cada vez más el trabajo en relacionado con la salud mental se realiza en equipo, es por ello que, como resultado de la necesaria división del trabajo y de la especialización creciente, el evaluador reciba una demanda concreta por parte de otros miembros del equipo clínico que pueden estar interesados en la información procedente de unos tests determinados que les permitan contrastar hipótesis diagnósticas previamente formuladas. Si la demanda y los objetivos a conseguir no vienen delimitados por el remitente, la primera tarea del evaluador consistirá en concretarlos. En segundo lugar se formulan hipótesis sobre el problema, a partir de las cuales se diseñará el plan de la evaluación y se escogerán las técnicas más adecuadas. Finalmente se elaborarán las conclusiones pertinentes y se proporcionará la información adecuada sobre las mismas al cliente y/o, en su caso, al remitente (Vizcarro y Arévalo, 1990). El proceso de evaluación es completamente equiparable, por tanto, como subraya Fernández Ballesteros (1992) al proceso hipotético-deductivo que caracteriza al método científico.
Cattell (1986) propone una clasificación de los tipos de datos utilizables para el análisis del temperamento que se puede aplicar a la evaluación psicológica general. En ella se distingue entre datos L, datos Q y datos T. Diferentes corrientes evaluativas (conductual, psicométrica, etc.) se han caracterizado por la utiización preferente de uno u otro de estos tipos de datos. Los datos L se refieren a observaciones del comportamiento cotidiano, ya sea conductas cuantificables objetivamente o calificaciones mediante las que se clasifica a los sujetos. Por su menor dificultad de obtención se utilizan habitualmente más las calificaciones que la observación objetiva de conductas, pero aquellas conllevan graves problemas relativos a su baja fiabilidad y validez (aunque su validez aparente es elevada). Para solventar tales problemas se hace necesario dedicar grandes recursos no siempre disponibles, tales como un tiempo prolongado de observación y la utilización de varios calificadores bien entrenados. Los datos Q son los de autoinforme, usualmente obtenidos a través de las respuestas que el sujeto da a un cuestionario. Los inconvenientes de este tipo de datos también son conocidos: efectos de deseabilidad social, aquiescencia, etc. Gran parte de los inconvenientes referidos a los datos L y Q pueden evitarse mediante los datos T. Estos son obtenidos situando al sujeto ante una situación de prueba objetiva, entendiendo como tal aquella en la que el sujeto debe realizar una tarea, desconociendo lo que se está midiendo con ella (o bien, pese a conocerlo, tiene que emitir una respuesta de tal naturaleza que no puede ser modificada en determinada dirección). Galton y J. Mk. Cattell se encuentran entre los pioneros de la utilización de este tipo de pruebas.
Si un test psicológico puede ser definido como como una situación artificial y estandarizada, reconocida como tal por el sujeto y en la cual éste se implica voluntariamente disponiéndose a responder dentro de unos límites impuestos a las cualidades de las respuestas por una serie de limitaciones, con medidas o clasificaciones que siguen unas determinadas reglas para garantizar un grado de consenso aceptable entre diferentes examinadores, un test objetivo es, además de lo anterior, aquel en el que el sujeto no conoce de qué manera está siendo medido su comportamiento ni qué clase de inferencias se realizarán a partir de sus respuestas (Cattell y Warburton, 1967). Dado que la situación y el modo de respuesta en un test objetivo son tales que el sujeto no puede falsear su respuesta o distorsionarla para acomodarla a su autoconcepto o con la finalidad de obtener una puntuación determinada, el grado de objetividad de un test se relacionará con una mayor validez (al reducir la posibilidad de engaño) y con una mayor fiabilidad (al reducir la posibilidad de cambios en la distorsión motivacional de una administración a otra), aunque la objetividad del test no es condición suficiente para garantizar una fiabilidad y una validez aceptables (Andrés y Gutiérrez, en prensa).
Scheier (1958) ofrece una serie de criterios para sistematizar las diferencias entre los tests objetivos y los cuestionarios o las calificaciones.
Los tests objetivos han sido ampliamente utilizados para la investigación y la evaluación clínica. Entre los antecedentes significativos del estado actual de desarrollo de los tests objetivos cabe citar a Heymans y Wiersma (1906), Hartshorne y May (1929), Oates (1929), Cattell (1933), Line y Griffin (1935), French (1951), y Eysenck (1947, 1952, 1970). Cattell y Warburton publicaron en 1967 un compendio que reunía una gran cantidad de pruebas objetivas, junto con discusiones detalladas acerca de posibles taxonomías de dichas pruebas. También se han construido baterías de tests objetivos como el Objective-Analytic Test Kit, de Cattell y Schuerger, 1978).
Las pruebas que se ajustan (si bien con diferentes grados) a la definición dada de test objetivo son muy diversas. Además de las que se pueden encontrar en las referencias mencionadas anteriormente, Cronbach (1970) cita medidas de este tipo correspondientes a los orígenes teóricos más diversos: los tests calificados habitualmente como proyectivos, pruebas sobre preferencias musicales y artísticas, medidas de estilos cognitivos, pruebas sobre preferencias humorísticas, y los análisis de la configuración del rendimiento en pruebas de inteligencia.
Schuerger (1986) distingue cinco clases de tests proyectivos: de asociación de palabras (p.ej., Kent-Rosanoff, 1910), de completar frases (p.ej. Rotter Incomplete Sentences Blanck), de dibujo (p.ej. el test de dibujo de una persona -DAP- de Machover, 1971; o el casa-árbol-persona -HTP- de Buck, 1948), de relato de historias a partir de una imagen (TAT, CAT, etc.) y de manchas de tinta (como el Rorschach). El inconveniente de estos tests es su baja fiabilidad interobservadores, derivada de sistemas de puntuación en los que hay una fuerte carga subjetiva. Otros tests perceptivos, fuera de la categoría de los tests proyectivos son, por ejemplo, el Test Gestáltico Visomotor de Bender y el Test de Figuras enmascaradas; los resultados de ambos permiten obtener información sobre el temperamento y la personalidad gracias a sus correlaciones con diferentes rasgos (Horn, 1977). Respecto a la relación del patrón de rendimiento obtenido en pruebas de inteligencia con el temperamento, la personalidad o determinadas características psicopatológicas pueden citarse, por ejemplo, los estudios de Matarazzo (1972), Gittinger (1964) y Schueger, Kepner y Lawler (1979) a partir de las escalas de Wechsler. Los estudios sobre el sentido del humor tienen un antecedente en Freud (1938); posteriormente se han hecho investigaciones como las de Cattell y Luborsky (1950) y Tollefson (1959). La relación de las preferencias musicales con la personalidad y características psicopatológicas ha sido estudiada principalmente por Cattell y Saunders (1954), Cattell y Anderson (1953) y Cattell y McMichael (1960), aunque no se ha desarrollado más allá de la obtención de los datos iniciales de esos estudios. El tema de las preferencias pictóricas ha sido algo más estudiado, incluyéndose varios tests de este tipo en el compendio de Cattell y Warburton (1967); algunos aspectos estudiados han sido la preferencia por dibujos familiares o extraños, figurativos o abstractos, etc. (Cattell, Hundleby y Pawlik, 1965; Cattell y Warburton, 1967).
En realidad, como ocurre con la validez, la objetividad no es una propiedad del test sino de las inferencias que se hacen a partir de los resultados que con él se obtienen. Por ello, incluso datos obtenidos mediante cuestionarios podrían ser calificados como datos T, si las respuestas dadas no se interpretaran como datos de introspección sino como datos de decisión (Tous, 1986). La utilización restringida de los tests objetivos, en comparación con la amplia difusión de los cuestionarios, se debe a los inconvenientes de tipo económico que conllevan. La evaluación basada en tests objetivos resulta cara, larga, compleja y difícil (Eysenck, 1970), se requiere personal cualificado para su administración, soportar un mantenimiento de equipos que resulta costoso y entornos adecuados.
La distinción entre datos L, datos Q y datos T permite clasificar los métodos de evaluación en función de las distintas estrategias de recogida de información que utilizan, ya sea en situaciones naturales o artificiales. Estas estrategias pueden situarse en una dimensión que representa el grado de control que se ejerce sobre la recogida de información. Vizcarro y Arévalo (1990) proponen, de acuerdo con Cone (1981), añadir a ésta una segunda dimensión referente al grado en que un método evalúa la conducta de interés en el momento y el lugar de su ocurrencia, o bien se refiere a un momento y lugar más alejados. El mismo método puede situarse en diferentes puntos de esta dimensión de evaluación directa / indirecta, en función de la naturaleza de la variable que se pretenda medir; así la conducta agresiva se evalúa de manera más directa mediante la observación que mediante el autoinforme, pero a las ideas delirantes se accede de modo más directo a través del autoinforme.
Dentro de cada método existen, no obstante, técnicas muy diversas, por lo que la situación de cada método en el espacio delimitado por las dos dimensiones referidas puede también variar en función de la técnica específica que se considere. Esta variabilidad de técnicas resulta especialmente elevada en el método de entrevista. En la entrevista se puede recojer información proporcionada por el propio sujeto, a la vez que se realiza una observación de su conducta durante la sesión.
Aun otras clasificaciones de las técnicas evaluativas son posibles, pero la más corriente es sin duda aquella que las distingue en función del marco teórico general en el que se han desarrollado. De acuerdo con Vizcarro y Arévalo (1990) las técnicas evaluativas pueden clasificarse según ese criterio en: psicométricas, proyectivas, subjetivas y conductuales.
El enfoque psicométrico tradicional, denominado "itemétrico" por Cattell (Cattell y Kline, 1978), es normativo, es decir, está basado en la comparación del sujeto evaluado con la norma que viene dada por un grupo de referencia. Requiere por tanto la utilización de instrumentos estandarizados cuyas puntuaciones, representativas de características psicológicas consistentes y estables (rasgos), se distribuyen de manera conocida en la población con la cual se quiere comparar a un sujeto. La mayoría de los tests de inteligencia y de personalidad (normal y anormal) que se utilizan en la actualidad pertenecen a este enfoque diferencialista, habiéndose construido de una de las dos formas posibles: a) mediante estrategias factoriales (p.ej. el PMA -test de aptitudes primarias de Thurstone-, o el 16 PF de Cattell); b) mediante estrategias empíricas (como el MMPI o las escalas de Wechsler).
Ya en 1944 Cattell había distinguido entre dos tipos de unidades de medida utilizables en psicología: las unidades solipsistas y las unidades interactivas. Por medición solipsista se entiende aquella en que la puntuación no tiene otra referencia que el propio sujeto al que se asigna. La medición interactiva, en cambio, se basa en los efectos observables de un rasgo sobre el entorno social, físico o biológico, permitiendo por tanto equiparar la medición psicológica con la de las ciencias físicas al utilizar las unidades comunes de masa, espacio y tiempo. Pertenecen a este grupo los tiempos de reacción, las medidas fisiológicas, etc. Pero la medición más empleada en psicología no es ninguna de estas dos, sino una derivada de la interactiva que consiste en que los sujetos son ordenados y reciben una puntuación típica, en términos de la distribución de referencia, a partir de la puntuación directa obtenida en una situación de interacción con una prueba artificial. Para este tipo de puntuación se emplea la denominación de normativas. Además de estas formas puras, es posible elaborar procedimientos de medida a partir de sus combinaciones como, por ejemplo, tomando al individuo estandar en lugar de al grupo. La población de referencia no es, en ese caso, un grupo sino una población de medidas intraindividuales. A esta clase de puntuaciones se las denomina ipsativas.
Tanto las puntuaciones normativas como las ipsativas se basan en la estandarización, aunque con procedimientos distintos. Un procedimiento de estandarización consiste en obtener puntuaciones que derivan de las distribuciones observadas en poblaciones de sujetos; son las puntuaciones normativas. Otro procedimiento consiste en derivar las puntuaciones a partir de distribuciones observadas en poblaciones de estímulos (o situaciones); las puntuaciones así obtenidas son ipsativas. La ipsatización es, por tanto, una forma de estandarización intraindividual, mientras que las puntuaciones normativas son reflejo de la estandarización interindividual. No obstante, ambos métodos no son excluyentes puesto que se puede hacer una doble estandarización normativizando puntuaciones ipsativas. Hay aún un tercer tipo de estandarización: la temporal; ésta es también, como la ipsatización, una forma de estandarización intraindividual, pero en la que no se toman transversalmente medidas de un sujeto en varios tests sino que se mide longitudinalmente el rendimiento de un sujeto en un mismo test en varias ocasiones.
No hay que confundir la orientación ipsativa con el método idiográfico defendido por Allport (1937), por cuanto las relaciones ipsativas son atribuidas en teoría a toda una población (las relaciones entre eventos psíquicos encontradas en un sujeto son generalizables a grupos de personas). Si las puntuaciones normativas dan cuenta de las diferencias interindividuales, las ipsativas se refieren a las diferencias intraindividuales, pero en ambos casos se pretende generalizar a la población y no limitar los resultados a individuos aislados.
Las medidas interactivas tienen dos grandes ventajas sobre las ipsativas y las normativas: 1) son más permanentes, puesto que sobreviven a las disoluciones de poblaciones y a los cambios culturales (parafraseando a Cattell -1944-: ¿es más valioso saber que Cervantes tenía un vocabulario de 18.000 palabras a los nueve años o que tenía un percentil de 90 en un test de vocabulario de aquella época?); 2) las medidas normativas llevan muchas veces a pensar que es suficiente con ordenar a los sujetos respecto a una característica determinada y a no profundizar en mayor medida acerca de la naturaleza de esa característica, mientras que las medidas interactivas sugieren por sí mismas hipótesis relativas a esa naturaleza, puesto que pueden considerarse como definiciones operacionales o indicadoras de constructos.
De acuerdo con la caracterización realizada de los diferentes tipos de medidas, las técnicas conductuales de evaluación, que aparecen como alternativa a la evaluación psicométrica tradicional, se caracterizan por la utilización preferente de medidas ipsativas. Estas técnicas de evaluación conductual se han desarrollado en estrecha relación con el tratamiento, por lo que su objetivo fundamental es concretar la conducta problema y las variables que la elicitan o mantienen (Vizcarro y Arévalo, 1990). El resultado de un individuo en estas pruebas no es interpretado por comparación con el resultado de otras personas, sino frente a un nivel funcional de rendimiento (APA, 1985), de manera similar a lo que ocurre en la evaluación pedagógica (Martínez Arias, 1981). Su finalidad no es suministrar información acerca de la posición de un individuo respecto a una población de referencia, sino respecto a un estado determinado a priori (el objetivo terapéutico) definido para cada individuo en particular (Plessen, 1981). Es por ello que se ha dado en llamar a este enfoque evaluativo como "orientación a criterios", por contraposición a la "orientación a normas" de la evaluación tradicional. No obstante, Cone y Hawkins (1977) reconocen el papel auxiliar de las normas a la hora de fijar criterios. De hecho, el rechazo absoluto a la aproximación normativa es más la excepción que la regla entre los evaluadores conductuales (Weiss, 1968; Dickson, 1975; Kazdin, 1977; Kanfer y Nay, 1982; Epstein, 1983; Silva, 1989). En la práctica la distinción entre la orientación a normas y la orientación a criterios resulta mucho más borrosa que en la teoría. Messik (1975), por ejemplo, llama la atención acerca del hecho de que a la hora de establecer criterios se realizan habitualmente apreciaciones normativas explícitas o implícitas; y a las mismas conclusiones apunta la revisión sobre teoría y método de tests realizada por Weiss y Davison (1981).
Por estas y otras razones Silva (1989) sugiere que las diferencias metodológicas entre la evaluación psicológica tradicional y la conductual son más aparentes que reales. Cuando se ha cuestionado la aplicación al campo de la evaluación conductual de las técnicas psicométricas desarrolladas en el contexto de la evaluación psicológica tradicional, se ha corrido el riesgo de olvidar que la psicometría no se compromete respecto al nivel de inferencia de las variables objeto de medición. Aunque su desarrollo se ha producido inicialmente en el marco de la evaluación psicológica tradicional, ello no quiere decir que sus procedimientos de valoración de la calidad de los instrumentos de medida sean exclusivamente aplicables a constructos hipotéticos. No obstante, algunas características de la evaluación conductual hacen que la aplicación de los principios psicométricos no pueda realizarse de manera irreflexiva y automática. Una de esas características es la estrecha integración funcional de la evaluación conductual con la terapia de conducta. Cabe esperar, como resultado de la intervención terapeutica, que la conducta varíe a través del tiempo (o de situaciones); por ello, es difícil separar la varianza de error en las medidas obtenidas de la verdadera varianza de la conducta (Haynes y Wai'Alai, 1994). Una manera de superar esa dificultad requiere llevar a cabo valoraciones de la validez concurrente; tomando más de una medida de la variable (por ejemplo, mediante varios observadores, o mediante varios métodos de medida).
En la actualidad los defensores de la evaluación conductual no pretenden excluir otros enfoques. Fernández Ballesteros (1994) señala que la evaluación conductual está especialmente indicada cuando se pretende evaluar un cambio de conducta, pero si el objetivo es otro las técnicas de evaluación más adecuadas también pueden ser otras; por ejemplo, si el evaluador tiene el cometido de elaborar un diagnóstico diferencial tendrá que utilizar un sistema de clasificación basado en entidades nosológicas; si tiene que orientar o seleccionar lo más adecuado será emplear un modelo de rasgos.
Resta por comentar el papel de otras dos clases importantes de técnicas de evaluación psicológica: las proyectivas y las subjetivas. Las técnicas proyectivas se basan en el supuesto de que al colocar al sujeto ante una situación no estructurada e inusual, sus respuestas se verán influidas en menor grado que lo habitual por censuras internas o sociales, descubriendo así, con palabras de Exner, sus "necesidades, intereses y organización psicológica general" (Exner, 1976). Al igual que en la evaluación conductual, el interés por utilizar datos normativos es variable entre quienes utilizan las técnicas proyectivas. En general no se ha considerado necesario referir la ejecución del sujeto a normas grupales, pero también se ha defendido el interés de hacerlo y se ha trabajado en esa dirección (Exner, 1974; Zubin, Eron y Schumer, 1965).
Fernández Ballesteros, Vizcarro y Márquez (1983) distinguen cinco clases de técnicas proyectivas: estructurales, como el Rorschach, en las que el sujeto debe organizar un material visual poco estructurado para informar lo que le sugiere; temáticas, como el TAT, en las que se utiliza material visual con un grado de estructuración respecto al contenido ligeramente mayor que en las anteriores; expresivas, como el Test del Arbol, en las que se pide algún tipo de producción que generalmente suelen ser dibujos; y asociativas, como el Test de Frases Incompletas, que proponen al sujeto la tarea de asociar líbremente ante estímulos que se le presentan o completar diferentes materiales.
Finalmente, entre las técnicas subjetivas se encuentran pruebas de orígenes teóricos dispares como el Diferencial Semántico de Osgood Suci y Tannenbaum (1967), la técnica REP de Kelly (1955), a la vez que otras desprovistas de un sustrato teórico específico como las listas de adjetivos (Gough y Heilbrun, 1965; Lubin, 1965). No obstante, Fernández Ballesteros (1980) y Vizcarro y Arévalo (1990) indican que todas ellas se acercan notablemente a los aspectos centrales del enfoque fenomenológico, dado el interés prioritario que conceden a la percepción o experiencia subjetiva que el individuo tiene de las personas o acontecimientos significativos para él.
Fernández Ballesteros (1992) sugiere un procedimiento de "embudo" para determinar las técnicas de evaluación más indicadas en cada momento del proceso evaluativo. En un primer momento las técnicas más apropiadas son aquellas capaces de obtener información sobre un amplio espectro de conductas, avanzando progresivamente hacia niveles mayores de especificidad y exactitud. La entrevista, las técnicas de autoinforme como los cuestionarios, y la heteroevaluación por parte de allegados al paciente resultan especialmente indicadas para las primeras fases del proceso; mediante ellas se pueden construir las hipótesis iniciales sobre el caso. Posteriormente se introducen técnicas más costosas, pero también más precisas, que permiten contrastar las hipótesis formuladas; es entonces cuando la aplicación de pruebas objetivas resulta imprescindibles.
Información complementaria:
Evaluación de la ira en adultos y niños
Información complementaria:
Los tests a debate