Dos pruebas de Amplitud de Memoria Operativa para el Razonamiento Two working memory measures for reasoning
Autores: Francisco Gutiérrez Martínez, Juan Antonio García Madruga, Nuria Carriedo López, José-Oscar Vila y José María Luzón Encabo, Localización: Cognitiva, ISSN 0214-3550, Vol. 17, Nº 2, 2005 , pags. 183-210
Correspondencia: Francisco Gutiérrez Martínez. Dpto. Psicología Evolutiva y de la Educación. Facultad de Psicología. U.N.E.D. c/ Juan del Rosal, 10 . Ciudad Universitaria. 28040 MADRID Tfno.: 91- 3987948 Fax.: 91-3987951- e-mail:
[email protected]
1 Resumen La concepción de la memoria a corto plazo como una memoria operativa (MO) ha permitido analizar e interpretar en forma productiva las diferencias individuales que se observan en la ejecución de tareas cognitivas complejas, como el razonamiento o la comprensión lectora. Sin embargo, permanecen sin resolverse algunas dificultades relativas a la medida de la MO, principalmente la forma de involucrar el doble componente de almacenamiento-procesamiento que se le atribuye. En este estudio se proponen dos nuevas medidas de la amplitud de la memoria operativa para el razonamiento. La estimación se realiza a partir de un índice de recuerdo, según un procedimiento semejante al propuesto por Daneman y Carpenter, (1980) en su ya clásica “Prueba de Amplitud Lectora”. Sin embargo, en lugar de utilizar una tarea de lectura como tarea secundaria, las pruebas de amplitud de razonamiento se basan en una tarea de inferencia –bien con analogías verbales, bien con anáforas–. La demanda de un procesamiento más profundo y semántico y específicamente ligado a las capacidades de razonamiento permite hipotetizar que estas nuevas pruebas serán más sensibles a las diferencias individuales existentes en el razonamiento deductivo. Los resultados muestran que las pruebas de amplitud de razonamiento, y en particular la prueba de analogías, correlacionan mejor con la ejecución en diversas tareas de razonamiento deductivo que la prueba de amplitud lectora. La diferente implicación del Ejecutivo Central en las diversas pruebas de memoria se utiliza como marco explicativo básico de este estudio.
Palabras clave: memoria operativa, razonamiento, prueba de amplitud lectora.
2 Abstract The conception of short-term memory as a working memory (WM) has allowed a productive analysis and interpretation of individual differences in a diversity of complex cognitive tasks, such as text comprehension and reasoning. However, important problems related to the measurement of WM remain, particularly those concerning how to account for its dual processing-storage function. Two new WM measures for reasoning are proposed in this work. Their rationale is similar to that of Daneman and Carpenter’s (1980) classical “Reading Span Test” (RST). However, instead of using a reading task as a secondary task, our Reasoning Span Test employs an inferential task based on verbal analogy or anaphora. These new tests demand deeper semantic processing usually involved in the ability to reason. We therefore hypothesize an increased sensitivity to individual differences in reasoning abilities given these new reasoning span measures. Our results confirm this by showing that reasoning span measures, particularly analogy, correlate with the diverse reasoning measures better than the RST. We discuss the results as reflecting different processing demands placed upon the Central Executive for reasoning versus reading span measures.
Key Words: working memory; reasoning; Reading Span Test.
3 Introducción Como bien es sabido, el concepto de “memoria operativa” (MO) se introdujo en la Psicología Cognitiva fundamentalmente a partir del trabajo de Atkinson y Shiffrin (1968, 1971), en el que comienzan a contemplar la denominada “memoria a corto plazo” (MCP) como una memoria activa –una memoria “en funcionamiento”– y no únicamente como un almacén de información; lo que supone la superación de la visión tradicional puramente estructuralista del sistema de memoria humana. Posteriormente, Baddeley y Hitch (1974) consolidarían este nuevo enfoque al proponer un modelo en el que, reconociendo y enfatizando la naturaleza activa de la MCP, ésta se analiza explícitamente en términos de una memoria “operativa” o “de trabajo” (working memory) dentro del funcionamiento cognitivo general; en concreto, se concibe como la capacidad que permite manipular y mantener temporalmente la información que se va necesitando durante la realización de cualquier tarea cognitiva. En referencia a este planteamiento básico, cabe destacar dos aspectos relacionados que han tenido –y siguen teniendo– particular trascendencia dentro del campo. Por un lado, el modelo de Baddeley y Hitch (1974; véase también Baddeley, 1986) se opone a la inicial visión de la MO como una capacidad simple de carácter general, presentándose como un sistema complejo constituido por un “ejecutivo central” y dos subsistemas esclavos: el “retén fonémico” (que después denominarían “lazo articulatorio o lazo fonológico”), y un componente periférico análogo, pero encargado de la información viso-espacial. Por otro lado, desde el punto de vista funcional se asume que este sistema tripartito de memoria no sólo se ocupa del almacenamiento temporal de la información sino que también interviene de forma simultánea en su control y procesamiento activos. Este es el sentido en que se le atribuye una naturaleza "operativa", si bien el modelo reconoce limitaciones estructurales en cuanto a capacidad y permanencia de la información en el sistema. Precisamente, en relación con el manejo de estas limitaciones, el “ejecutivo central” (EC, en adelante) es el que se postula como componente central o “director”, pues no sólo se encargaría de controlar y coordinar los otros subsistemas, sino también de llevar a cabo los procesos de control implicados en las estrategias de codificación y recuperación de la información, los procesos atencionales y la manipulación del material mantenido en los sistemas subsidiarios. Además, sería también el encargado de controlar y poner en marcha los procesos necesarios para la transferencia de la información al almacén a largo plazo (MLP), así como la recuperación e integración de la información proveniente de éste almacén; si bien –tal y como se propone en una última revisión del modelo (véase Baddeley, 2000)–, estos procesos se realizarían por mediación de un nuevo componente, el denominado “retén episódico” (episodic buffer; véase la Figura 1). ******Insertar la Figura 1 por aquí****** Memoria operativa y diferencias individuales Con este modelo básico de MO se ha pretendido dar cuenta de múltiples datos y fenómenos no sólo sobre el funcionamiento de la memoria (Baddeley, 1990, 1992), sino también sobre como ésta interviene dentro de la cognición en general (véase p. ej., Richardson et al., 1996); lo que explica que actualmente el concepto de MO se haya convertido en un referente central dentro de los modelos de funcionamiento cognitivo y tanto en relación con las habilidades de pensamiento más generales, como en relación con tareas específicas. Sin embargo, junto a este claro consenso sobre el importante papel de la MO en la cognición, también se ha producido un notable desacuerdo sobre la mejor manera de conceptualizarlo, habiéndose desarrollado y propuesto un amplio número de teorías que difieren tanto en su rango de aplicación como en sus postulados concretos (véase Miyake y Shah, 1999). Por supuesto, estos nuevos desarrollos se alejan en mayor o menor medida del modelo original de Baddeley; si bien, desde un punto de vista general, se ha seguido reconociendo la utilidad de una propuesta que combina distintos componentes especializados con un control ejecutivo central y en la que se destaca su capacidad limitada como principal fuente de restricciones en la ejecución (Miyake y Shah, 1999). En particular, este último supuesto –la idea de una
4 capacidad limitada– es compartido por la mayoría de los modelos y constituye, de hecho, el punto de partida de la amplia línea de investigación que se ha generado con el fin precisar el papel de la MO como posible fuente de las diferencias individuales observadas en la ejecución cognitiva. Sencillamente, desde este enfoque diferencial, se asume que la capacidad limitada de la MO impone restricciones de manera variable entre los individuos, lo que explicaría –al menos, en parte– su mejor o peor desempeño en tareas con fuertes demandas cognitivas. Muchos de los estudios empíricos realizados según este planteamiento tienden a mostrar, en efecto, una relación clara entre las estimaciones de la MO de los sujetos y su ejecución en distintas tareas; lo cual se ha puesto especialmente de manifiesto respecto a las diferencias individuales observadas en ámbitos particularmente demandantes, como el de la comprensión lectora y también en el del razonamiento. En conjunto, sin embargo, los resultados obtenidos no ofrecen un patrón completamente consistente; lo que ha llevado a poner en evidencia las dificultades metodológicas existentes en torno a la evaluación de la amplitud, supuestamente variable, de la MO (véase p. ej., Phillips y Forsaw, 1998). En función de los diferentes modelos teóricos de partida se han propuesto distintos tipos de medidas no estandarizadas que, por tanto, no ofrecen garantías acerca de su fiabilidad y validez (véase p. ej., Waters y Caplan, 1996). De hecho, las correlaciones encontradas entre las mismas han sido relativamente pobres (Gilinsky y Judd, 1994; Elosúa, García Madruga, Gutiérrez, Luque y Gárate, 1997), con lo que resulta dudoso que todas ellas incidan en el mismo tipo de capacidad. Esto es lo que explica en parte el hecho de que aún se mantenga muy viva la controversia acerca de una cuestión capital dentro del campo: la naturaleza general o específica de la MO. Mientras que los resultados de algunos estudios sugieren la intervención de una capacidad general independiente de las tareas concretas a las que se aplica o con las que se evalúa, en la línea del EC de Baddeley (véase p. ej., Kyllonen y Christal, 1990), otros parecen reflejar la actuación de dispositivos de procesamiento más específicos; en concreto y en correspondencia con los subsistemas del modelo de Baddeley, se ha barajado la hipótesis de un doble ejecutivo, uno especializado en la representación y manejo de la de la información simbólico-verbal y otro encargado de la información espacial (Daneman y Tardif, 1987; Shah y Miyake, 1996). En la actualidad, no obstante, esta controversia parece tender a suavizarse al reconocerse la incidencia de ambos tipos de factores (generales y específicos) en la ejecución y, consecuentemente, la necesidad de que los modelos de MO integren múltiples componentes con diferentes funciones (véase Baddeley y Logie, 1999; Capon, Handley y Dennis, 2003; Engle, Kane y Tuholski, 1999; Rosen y Engle, 1997). La raíz del problema, obviamente, es de orden teórico y tiene que ver con la dificultad de articular en las medidas la doble función (de almacenamiento y de procesamiento) que se atribuye a la MO en la tradición abierta por el modelo de Baddeley y Hitch; sobre todo al no estar claramente –o unilateralmente– repartidas entre los componentes del modelo. Obviamente, sólo a partir de medidas independientes de la carga que suponen ambas funciones puede establecerse si los aspectos del procesamiento específicos de las tareas, están o no contribuyendo significativamente en las estimaciones de amplitud; y, consecuentemente, sólo así puede decidirse si la ejecución depende o no de capacidades de MO específicas. Sin embargo, puesto que se asume que ambos aspectos se mantienen a partir de (compiten por) los mismos –y limitados– recursos, su relación será de transacción o “balance” (trade-off) en su consumo, con lo que resultará difícil separar ambos componentes en las medidas obtenidas. Precisamente, ha sido en la perspectiva diferencial que estamos considerando en la que se ha enfatizado, no tanto la limitación global de los recursos disponibles en la MO –que se asumen relativamente constantes–, como la consecuente necesidad de compartirlos y gestionarlos adecuadamente para las funciones simultáneas del almacenamiento y del procesamiento. En este sentido, se ha partido de la idea de que la amplitud y funcionalidad de la MO no atañe a una capacidad absoluta, sino relativa a la eficacia con que se realicen las operaciones
5 específicas de las tareas: cuanto más eficaz sea el procesamiento menos recursos consumirá, lo que se traduciría en una ampliación funcional de la capacidad de almacenamiento. La “Prueba de Amplitud Lectora” Este tipo de planteamiento es el que subyace a una gran parte de la investigación sobre el papel de la MO en la cognición y, de hecho, constituye el fundamento en el que se apoya el tipo de medida que se ha utilizado predominantemente y cuyo principal referente sigue siendo la “Prueba de Amplitud Lectora” (en adelante, PAL) de Daneman y Carpenter (1980; véase la adaptación española en Elosúa, Gutiérrez Martínez, García Madruga, Luque y Gárate, 1996; véase asimismo Gutiérrez-Calvo, Jiménez y Castillo, 1996). Frente a las medidas tradicionales de memoria a corto plazo –que sólo implican demandas de almacenamiento–, esta prueba constituye un intento explícito por involucrar los dos componentes de la MO, procesamiento y almacenamiento, en su dinámica interdependiente –y mutuamente restrictiva– combinando dos tareas. En su versión más clásica, los sujetos deben leer una serie de frases no relacionadas y al final tratan de recordar (en orden) la última palabra de cada una de las frases leídas. El número de frases aumenta progresivamente (de 2 hasta 6 frases), de manera que el máximo número de palabras finales que el sujeto es capaz de recordar (entre 2 y 6), se toma como un índice apropiado de la amplitud de su MO. Obviamente, en este contexto, se asume que la lectura de las frases carga el componente de procesamiento, mientras que la recuperación de las palabras incidiría sobre la capacidad de almacenamiento. Puesto que ambas funciones compiten por unos recursos limitados, se supone que los buenos lectores, al ser más eficientes en su procesamiento, podrán dedicar más recursos al almacenamiento, lo que se reflejará en un mayor número de palabras recordadas; de ahí que los autores propusieran esta prueba como una medida de la MO específica para la comprensión lectora. Ciertamente, se han encontrado significativas correlaciones entre la PAL (en diferentes versiones) y diversas medidas de comprensión lectora (véase Baddeley et al., 1985; Carpenter, Miyake y Just, 1994; Daneman y Carpenter, 1980, 1883; Daneman y Tardif, 1987; García Madruga et al., 1997); y ha servido incluso para establecer relaciones entre la MO y aspectos específicos de la comprensión, tales como la integración de la información o la elaboración de inferencias (véanse p. ej., los estudios de Estévez y Gutiérrez-Calvo, 2000; Gutiérrez-Calvo, Castillo y Espino, 1996). Pero la capacidad predictiva de PAL respecto a la comprensión, se ha confirmado también independientemente del contenido de la tarea –p. ej., utilizando material numérico en vez de verbal (véase Oakhill, Yuill y Parkin, 1986, Yuill, Oakhill, y Parkin 1989; García Madruga et al, 1997)–. Y, por otro lado, la medida también se ha mostrado predictiva de otros aspectos del funcionamiento cognitivo, especialmente aquellos que tienen que ver con la adquisición de nueva información y su posterior recuerdo (Engle, 1996); todo lo cual sugiere que se trata de una estimación de la capacidad de algún componente central de la MO y no de susbsistemas específicos (Baddeley, 1990; Baddeley y Hitch, 1994; Conway y Engle, 1994; Engle y Conway, 1998). A fin de cuentas, incluso si asumimos la hipótesis de una capacidad de MO relativa a la eficacia del procesamiento específico, el balance y adecuada gestión de los recursos para las dos funciones simultaneas – procesamiento y almacenamiento– también reclama fundamentalmente el control y coordinación por parte de un EC de dominio general. En este sentido, algunas recientes propuestas defienden la idea de que la ejecución en la PAL y pruebas similares probablemente refleja el funcionamiento del EC en relación con alguna de sus funciones. Concretamente, se ha considerado como posible índice de control atencional –en términos de capacidad de inhibición (Engle y Oransky, 1999; Rosen y Engle, 1998) o susceptibilidad a la interferencia (Withney, Arnett y Driver, 2001)–, aunque también se ha sugerido que puede estar relacionada con aspectos relativos a la velocidad de procesamiento, sobre todo en estudios evolutivos sobre las diferencias que se producen con la edad (Byrne, 1998; Fry y Hale, 1996; Salthouse y Meinz, 1995).
6 Lo cierto, en cualquier caso, es que también existen múltiples estudios en los que o bien no se han encontrado las correlaciones esperadas entre los índices obtenidos con la PAL y medidas de comprensión (Baddeley, Logie, Nimmo-Smith y Brereton, 1985; Caplan y Waters, 1999; Light y Anderson, 1985), o bien no han sido mayores que las encontradas con tareas de amplitud simples (de memoria inmediata) que supuestamente sólo inciden en el componente de almacenamiento (véase Engle, Carullo y Collins, 1991). Los resultados quizá hayan sido particularmente inconsistentes en el campo del razonamiento (véase Logie y Gilhooly, 1998), si bien las relaciones entre razonamiento y PAL resultan claras cuando se comparan los sujetos más extremos (altos y bajos en MO; véase Meilán, García Madruga y Vieiro, 2000). Memoria operativa y razonamiento Las principales teorías sobre razonamiento, han reconocido explícitamente el papel de la MO en los procesos de inferencia. En particular, la teoría de los "modelos mentales" (TMM) incorpora la MO como base de sus principales planteamientos y predicciones (véase Johnson-Laird, 1983; Johnson-Laird y Byrne, 1991, 2000). Según esta teoría, el razonamiento es un proceso esencialmente semántico por el que el sujeto trata de representar los “modelos de la situación” compatibles con el significado de las premisas, a fin de derivar una conclusión informativa. Estos modelos mentales se construyen, se mantienen y se manipulan dentro de la MO, de manera que su amplitud limitada se identifica como la principal fuente de restricciones en la ejecución: cuanto mayor sea el número de modelos a construir para establecer la conclusión, más difícil será el problema (véase en la Tabla 1 la representación prevista en relación con las principales conectivas en el razonamiento proposicional). Siendo así, en ciertos casos podría comprometerse la capacidad disponible o incluso excederse; de ahí que se postule, adicionalmente, la necesidad de un procesamiento “estratégico” que permita manejar eficazmente la información dentro de los límites de la MO. En este sentido, se asume que el razonador sigue, en general, un principio de economía cognitiva por el que sólo representa explícitamente la mínima información necesaria para dar una respuesta. ******Insertar la Tabla 1 por aquí****** A partir de este planteamiento, la teoría permite dar cuenta de gran parte de la evidencia recogida en torno a la ejecución con tareas de razonamiento deductivo y, particularmente, de razonamiento proposicional, en las que el razonador debe hacer inferencias a partir de premisas que incluyen las principales conectivas lógicas (conjunción, disyunción, condicional, etc.). Por ejemplo, la teoría predice acertadamente que los problemas de conjunciones –cuya representación requiere sólo un modelo– serán más fáciles que los problemas de condicionales –que usualmente requieren construir múltiples modelos– (véase la Tabla 1). De acuerdo con el principio de economía cognitiva, la teoría postula que al interpretar premisas condicionales (Si p, entonces q) el razonador inicialmente tiende a representar de forma explícita sólo el primer modelo (P Q); con lo que también puede explicar el hecho de que las inferencias derivadas a partir de este primer modelo –la correcta “Modus Ponens” (MP: p, luego q) y la falacia de “Afirmación del Consecuente” (AC: q, luego p) sean significativamente más frecuentes que las derivadas a partir del despliegue de los otros dos modelos restantes (¬P Q; ¬P ¬Q) relativos a la negación del antecedente: la inferencia correcta “Modus Tollens” (MT: no q, luego no p) y la falacia de “Negación del Antecedente” (NA: no p, luego no q). Dicho de otro modo, la TMM predice acertadamente que realizar la inferencia válida MP y la falacia AC será relativamente fácil, dado que sólo reclaman representar el primer modelo. Por el contrario, realizar la inferencia correcta MT y evitar las falacias (AC y NA), será más difícil puesto que requieren necesariamente desplegar los modelos relativos a la negación del antecedente (véase p. ej., García-Madruga et al., 2001; Gutiérrez et al., 2002). Obviamente, este tipo de planteamiento, en cuanto implica representaciones semánticas y una actuación estratégica, resulta acorde con la idea de que es la capacidad del Ejecutivo Central la que está más comprometida en los procesos de inferencia y, por tanto, la
7 más directamente involucrada en las diferencias individuales observadas. De hecho, múltiples estudios realizados con el denominado paradigma de la doble-tarea, han mostrado el efecto disruptor que en las tareas de razonamiento tienen otras tareas concurrentes que supuestamente detraen recursos del EC (Baddeley, 1986, 1990, 1996; Toms, Morris y Ward, 1993; Klauer, Stegmaier y Meiser, 1997), siempre que la carga que suponen sea lo suficientemente alta (véase Halford, Bain y Maybery, 1984; Gilhooly, Logie, Whetherick y Whynn, 1993). En este sentido, y en relación con los problemas de razonamiento proposicional, la predicción general ha sido que los razonadores con mayores recursos de MO, tenderán a realizar mayor número de respuestas inferenciales correctas y menor número de falacias, que aquellos con menor amplitud de MO, lo que estará relacionado con su mayor capacidad para representar y manejar múltiples modelos. Por el contrario, los sujetos con una MO baja mostrarán mayor tendencia a respuestas basadas en estrategias de procesamiento poco demandantes –como la comentada anteriormente– o directamente no inferenciales –por ejemplo, en los condicionales se pueden dar respuestas simétricas respecto a la premisa categórica, que solo implican emparejar superficialmente los términos del enunciado–. Estas hipótesis se han comprobado de forma directa en estudios como los de Meilán, García Madruga y Vieiro (2000), en los que se compararon las respuestas de sujetos Altos y Bajos en MO respecto a dos diferentes tipos de problemas condicionales (con formulaciones “si-entonces” y “a menos que”); o los de Gilhooly et al. (véanse Gilhooly, Logie, Wetherich y Wynn, 1993; Gilhooly, Logie y Wynn, 1999) en los que se exploraban las distintas estrategias utilizadas por los sujetos en el razonamiento silogístico en relación con la amplitud de MO. Este tipo de evidencia, sin embargo, no se ha visto claramente confirmada en los estudios correlacionales, en los que con frecuencia diversas medidas similares a la PAL de Daneman y Carpenter, se han mostrado poco estables o escasamente predictivas de la ejecución en razonamiento (véanse García Madruga, Gutiérrez, Carriedo, Luzón y Vila, 2004; Markovits, Doyon y Simoneau, 2002). Un caso aparte es el estudio de Barrouillet y Lecas (1999; véase asimismo Barrouillet, 1996; Kyllonen y Cristal, 1990) en el que se encontró un correlación alta entre MO y razonamiento condicional, aunque los sujetos estudiados eran niños y adolescentes quienes suelen mostrar intercorrelaciones más altas entre diversos componentes cognitivos (véase, García Madruga et al., 1997). De acuerdo con lo dicho, pensamos que las dificultades de PAL en este contexto, pueden tener un doble origen. En primer lugar, si las diferencias relevantes en relación con el razonamiento atañen a algún aspecto del funcionamiento del Ejecutivo Central –como suponemos–, la tareas para la medida de la MO implicada deben suponer suficiente carga en el componente de procesamiento a fin de que se pongan de manifiesto las diferencias existentes. Esto, sin embargo, no está garantizado en la PAL en su versión clásica, dado que la lectura de frases puede realizarse de forma puramente superficial –no semántica– al solicitar el recuerdo de una palabra arbitrariamente seleccionada; y decimos “arbitrariamente” en el sentido de que no es estrictamente relevante a ese procesamiento semántico: la última palabra de una frase no tiene –en principio– ningún valor especial desde el punto de vista de la comprensión; con lo que el sujeto puede dedicar sus recursos directamente al almacenamiento de esa última palabra sin necesidad de una procesamiento comprensivo de la frase como tal. Es decir, el hecho de que la demanda se centre en una palabra concreta, hace posible que la lectura se realice de forma mecánica –no comprensiva– y, por tanto, no necesariamente se producirá la diferencial carga de la capacidad de procesamiento que se pretende. De hecho esta es la razón por la que algunas de las versiones de PAL que se han utilizado, incluyen algún tipo de control de la lectura comprensiva, generalmente a partir de cuestiones de verificación de las frases utilizadas (véase p. ej., Daneman y Carpenter, 19801; GutiérrezCalvo, Jiménez y Castillo, 1996). Pero por otro lado, si es, en efecto, la mayor o menor eficiencia en el procesamiento el que marca las diferencias –en el sentido de comprometer más o menos recursos de control y atencionales del EC–, la tarea implicada en la medida debe ser relevante en el ámbito en el
8 que trata de ser predictiva, aunque las capacidades del EC involucradas (p. ej., la capacidad para inhibir asociaciones irrelevantes) sean inespecíficas. En este sentido, obviamente, la tarea de lectura es pertinente para predecir comprensión pero no necesariamente lo es para predecir razonamiento. Por todo ello, y a fin de corregir ambos tipos de dificultad hemos investigado dos nuevas medidas que obligan a un proceso de razonamiento: los sujetos deben realizar una serie de inferencias para posteriormente recordarlas. A continuación describimos estas nuevas pruebas y presentamos los resultados de un primer estudio sobre su valor predictivo en torno a la competencia en razonamiento proposicional. 1. Dos Pruebas de Amplitud para el Razonamiento (PAR) Las nuevas pruebas que hemos desarrollado mantienen la estructura de la PAL, en el sentido de que la amplitud de la MO se sigue estimando a partir de una tarea de recuerdo organizada en varios niveles de dificultad creciente según el número de elementos-palabras a recordar (de 2 a 5). Sin embargo, la naturaleza de esos elementos-palabras es muy diferente: mientras que en la PAL, como hemos explicado, lo que los sujetos deben retener y recuperar es una palabra no relevante al proceso de comprensión que se pretende, en las nuevas pruebas lo que se debe recordar es el resultado directo de un proceso de razonamiento; en concreto, las inferencias realizadas al tratar de resolver bien una analogía verbal o bien una anáfora pronominal. En ambos casos el problema se plantea a través de un frase inicial seguida de algunas alternativas de respuesta, entre las cuales el sujeto debe seleccionar la correcta. El siguiente es un ejemplo de la tarea con analogías: Cortar es a tijeras, como dibujar es a ... lápiz papel Puesto que la relación que se plantea en primer término es “servir para” o “hacer con”, la respuesta correcta es “lápiz”. Como en este caso, el distractor (“papel”) siempre guardaba alguna relación semántica con la situación de referencia pero no coincidente con la relación analógica planteada. Las anáforas2 se plantean de forma similar: Pablo lo dibujó al amanecer, cubierto de una espesa niebla. bosque selva pastor En este caso la respuesta correcta es “bosque” por ser la única alternativa que concuerda con el pronombre “lo” de la frase, tanto desde el punto de vista semántico como gramatical. En contraste, como puede apreciarse, cada uno de los distractores sólo mantiene una de estas concordancias. Del mismo modo que en la PAL, estos problemas se presentan en series crecientes (de 2 a 5) con tres ensayos en cada una de ellas (véase en el Apéndice el conjunto completo de problemas para cada serie y ensayo). El sujeto debe leer en voz alta las frases iniciales, seleccionando después la respuesta que considera correcta; y al final de la serie trata de recordar en el orden adecuado las respuestas que ha dado. De este modo, aunque la carga del componente de almacenamiento es idéntica a la que se produce en la PAL, la carga en el componente de procesamiento se hace a través de una inferencia y no de la mera lectura; es decir, puesto que las palabras a recordar son el producto de una inferencia, la tarea requiere un procesamiento semántico, de carácter profundo. Así, de acuerdo con la idea de transacción entre ambos componentes, puede suponerse que los buenos razonadores necesitarán dedicar menos recursos a este procesamiento, con lo que mostraran mayor capacidad de almacenamiento. Es decir, siguiendo la misma lógica que en la PAL, el máximo número de inferencias correctamente recordadas, tanto en la tarea de analogías como en la de anáforas, puede tomarse como un índice de la amplitud de la MO para el razonamiento; y de ahí que las hayamos denominado respectivamente, Prueba de Amplitud para el Razonamiento con analogías (PAR-anl) y Prueba de Amplitud para el Razonamiento con anáforas (PAR-anf). Se ha argumentado que este tipo de medida de la MO resulta circular, ya que se pretende obtener una estimación de la MO, predictiva de la competencia en razonamiento, a partir de una tarea que ya es de razonamiento (véase Philips y Forshaw, 1998). Sin embargo,
9 no necesariamente existe este inconveniente ya que para ambas pruebas se seleccionaron inferencias simples con muy escaso nivel de dificultad. En concreto, sólo se utilizaron en la elaboración de las pruebas problemas que fueron resueltos por más del 95% de los participantes. Es decir, aisladamente la tarea de razonamiento no se mostró discriminativa respecto a la habilidad de razonamiento de los sujetos, tal y como pudimos confirmar posteriormente en el estudio que enseguida presentaremos. Desde un punto de vista racional, por tanto, la tarea sí resulta apropiada y su utilidad como predictor o no del razonamiento debe resolverse empíricamente. A continuación presentamos un primer estudio realizado con este propósito. Planteamiento e hipótesis A fin de comprobar la utilidad de las nuevas pruebas (PAR-anl y PAR-anf) como medidas de MO y su valor predictivo con respecto a la capacidad de razonamiento, hemos llevado a cabo un estudio correlacional en el que las hemos comparado con la PAL. El objetivo, lógicamente, era contrastar su validez en los dos sentidos relevantes: como medidas de MO esperábamos que correlacionaran positivamente con PAL (validez de constructo); pero como medidas de la MO específicamente involucrada en las tareas de razonamiento, esperábamos que sus correlaciones con la ejecución observada en estas tareas fuesen significativamente mayores que las obtenidas con la PAL (validez de criterio). Entre sí, por el contrario, no esperábamos, en principio, que mostrasen diferencias significativas en esta capacidad predictiva, ya que –como hemos explicado– las dos pruebas están construidas con la misma lógica desde un punto de vista racional. Para contrastar, pues, estas hipótesis además de aplicar las tres pruebas de MO, examinamos a los sujetos en una tarea de razonamiento proposicional. En concreto, se les presentaron un conjunto de problemas en los que debían generar una conclusión a partir de dos premisas dadas. La primera premisa era en unos casos una sentencia condicional (si p entonces q)3 y en otros una disyunción incluyente (p o q o ambos). La segunda premisa en todos los casos era categórica al afirmar o negar uno de los términos (p, q, no-p, y no-q) lo que, en el caso de los condicionales, suponía presentar las cuatro formas inferenciales clásicas ya mencionadas: MP, AC, NA y MT (véase en la Tabla 2 un ejemplo de cada tipo). *****Insertar la Tabla 2 por aquí***** Situándonos en el marco de la TMM y de acuerdo con lo dicho en el punto anterior, la principal hipótesis en relación con esta tarea fue que PAR-anl y PAR-anf alcanzarían correlaciones significativas y más altas que PAL con la ejecución correcta global. Pero, en particular, esperábamos que este contraste fuese más marcado con respecto a la ejecución derivada de la representación de múltiples modelos, dado que deben suponer mayor carga en la MO. Por otra parte, esperábamos también que las respuestas erróneas que implican un procesamiento superficial, sin carga de memoria operativa, serían producidas preferentemente por los sujetos con una menor amplitud de MO; es decir, hipotetizábamos también correlaciones negativas entre las pruebas de MO –especialmente las pruebas PAR–, y las respuestas erróneas superficiales. Para el enunciado condicional “si entonces”, las respuestas que exigen modelos mentales múltiples son las inferencias NA y MT, que requieren desplegar la representación inicial y acceder al modelo (¬P ¬Q); así como las respuestas correctas de “No hay conclusión” que suponen el rechazo de las falacias NA y AC, para lo cual es necesario representar asimismo el modelo (¬P Q). Como respuesta errónea superficial puede darse la inferencia AC, ya que también resulta accesible mediante el mero emparejamiento de los valores del enunciado: si p entonces q y q, luego p. En este sentido, obviamente, la respuesta correcta a MP puede también alcanzarse por esta vía superficial. En el caso de la disyunción (“ p ó q, ó ambos”) , todas las respuestas válidas exigen la representación de dos o tres modelos. Como puede verse en la representación completa de la Tabla 1, para las premisas categóricas afirmativas (p y q), la respuesta válida "No hay conclusión", proviene de considerar los dos modelos alternativos que existen en cada caso: (P
10 Q) y (P ¬Q) en caso de afirmarse p; y (P Q) y (¬P Q) en caso de afirmarse q. Asimismo, para las premisas categóricas negativas (no p y no q), las respuestas válidas inversas (q y p, respectivamente) sólo pueden derivarse teniendo presentes los tres modelos (P Q), (P ¬Q) y (¬P Q), en cuanto permiten comprobar la inexistencia de un modelo de doble negación (¬P ¬Q) que lleva a evitar tanto la respuesta “No hay conclusión” como la tendencia a respuestas simétricas (no p, luego no q; y no q, luego no p). Por el contrario, las simétricas a partir de las premisas categóricas afirmativas ( p ó q, ó ambos; y p, luego q; y q, luego p), pueden ser derivadas directamente a partir del emparejamiento superficial de los valores mencionados en el enunciado. Por tanto, estas dos respuestas pueden ser consideradas como errores superficiales. Método Participantes En el estudio participaron 104 estudiantes universitarios de segundo ciclo, de los cuales fueron eliminados 15, bien por no haber realizado todas las tareas o bien porque no alcanzaron un nivel mínimo en las pruebas de MO –probablemente, debido a una escasa implicación en la tarea–. De esta forma, la muestra final estuvo compuesta por 89 participantes. Para la realización de la tarea de razonamiento se seleccionaron al azar un tercio de la muestra inicial, 30 participantes. Materiales Como ya hemos avanzado, como medida independiente de la MO se utilizó la prueba clásica de Daneman y Carpenter (1980) en la adaptación española (PAL) de Elosúa y cols. (1996). Por su parte, las nuevas pruebas –como también ya hemos dicho–, se diseñaron siguiendo la estructura de la PAL, con cinco niveles de dificultad. Así, en ambos casos, el conjunto de la prueba incluía 42 problemas de inferencia (bien analogías o bien anáforas), distribuidos en series de 2, 3, 4 y 5 problemas con tres ensayos en cada uno de estos niveles (6+9+12+15=42). Previamente a este conjunto de problemas de prueba o experimentales, cada participante recibía instrucciones sobre la tarea que incluían una fase de entrenamiento con tres ensayos del nivel 2, es decir otros 6 problemas. La selección de los problemas utilizados en ambas pruebas se realizó a partir de un estudio previo en el que se aplicó una amplia muestra como simples problemas de inferencia. A partir del mismo no sólo se seleccionaron según el índice de dificultad (a partir del 95 % de aciertos), sino también en función de un riguroso control de otros aspectos que pudieran tener algún efecto; por ejemplo, el grado de familiaridad de las palabras que constituían la respuesta correcta a las inferencias o el orden en el que aparecían dentro de las alternativas planteadas (véase en el Apéndice el material completo empleado en cada una de las dos pruebas, así como un cuadro-resumen donde se recogen los controles que se hicieron en estas pruebas). En cuanto a la tarea de razonamiento, incluyó 24 problemas con condicionales y disyunciones del tipo ya descrito, con 2 casos para cada tipo de premisa categórica. Así, en concreto, se presentaron 8 problemas de disyunciones y 8 de condicionales en su formulación canónica (si p entonces q). El orden se contrabalanceó de manera que cada formulación (condicional o disyuntiva) apareciera –en cuestionarios diferentes– con cada una de las premisas categóricas, lo que supuso presentar la tarea en 4 ordenes distintos. Diseño y procedimiento El diseño fue intrasujeto: todos los participantes realizaron las tres pruebas de MO (PAL, PAR-anl y PAR-anf), si bien, tal y como ya hemos mencionado, sólo un tercio de la muestra global (30 participantes), realizaron la tarea de razonamiento. Ésta siempre se aplicó en último lugar, mientras que el orden de aplicación de las pruebas de MO fue contrabalanceado. Las sesiones fueron individuales con una duración aproximada de una hora y media. Cada participante realizaba sucesivamente las tres pruebas de MO, lo que le ocupaba entre 30 y 45 minutos; y, tras un periodo de descanso de unos 10 minutos, se le entregaban unos
11 cuestionarios que contenían únicamente los ítem de anáforas y analogías utilizados previamente con el fin de comprobar que su índice de dificultad era mínimo. En una segunda sesión se aplicó la tarea de razonamiento a los 30 participantes seleccionados al azar dentro del conjunto de la muestra. Esta aplicación fue colectiva y tuvo una duración de 30 minutos aproximadamente. Tanto PAL como PAR-anl y PAR-anf, se aplicaron a través de ordenador en una versión informatizada. Cada frase o problema se presenta en el centro de la pantalla del ordenador (caracteres negros sobre fondo blanco) y el participante hace una lectura en voz alta. Cuando acaba la tarea de procesamiento –de lectura en la PAL (o sea, al leer la última palabra) o de inferencia en las PAR (o sea, al elegir una de las alternativas de respuesta)–, el experimentador presenta de inmediato una nueva frase o problema pulsando la tecla “intro”. Al final de cada serie de frases o problemas (según los niveles ya precisados), aparece una interrogación –"?"– para indicar al sujeto que debe tratar de recordar la última palabra de cada frese leída –en la PAL– o las respuestas dadas a los problemas de inferencia –en las PAR–. El paso de un nivel a otro se señalizaba mediante una pantalla indicativa intermedia, de manera que el sujeto podía utilizarla como una "pausa" antes de continuar. La prueba se daba por concluida en el nivel en el que el participante fracasaba en la tarea de recuerdo (manifestaba un recuerdo nulo o incompleto) de forma reiterada en los tres ensayos. Por lo que se refiere a la tarea de razonamiento, se presentó como una prueba de "lápiz y papel" en la forma de un cuestionario. Tras las dos premisas de cada problema (véase Tabla 2) aparecía de forma explícita la pregunta ¿Qué se puede concluir?, y una línea en blanco donde el participante debía escribir su respuesta. Criterios de puntuación Se siguió el criterio de puntuación desarrollado por Elosúa y cols., (1997) en su adaptación de la PAL –denominado criterio integrado–, aunque adaptado al planteamiento de las nuevas pruebas. Este criterio supone aplicar una puntuación entera que refleja el nivel que alcanza la ejecución del participante (por tanto, entre 2 y 5) y una puntuación decimal que matiza la actuación manifestada dentro de ese nivel, teniendo en cuenta los distintos ensayos. En concreto, puede describirse en referencia a las siguientes pautas: − No se consideran las respuestas a la tarea de recuerdo en un determinado ensayo cuando la tarea de procesamiento se ejecutaba incorrectamente; lo que, en el caso de las PAR supone no contabilizar los ensayos en los que alguna de las inferencias fuera incorrecta. − Cada ensayo en el que el recuerdo era correcto (completo y en orden) se registra como "positivo" (+) y si fallaba en el orden, como "negativo" (–); el recuerdo incompleto no se tuvo en cuenta (∅). − La puntuación de nivel, se consideraba alcanzada cuando dentro de los tres ensayos se registraban al menos uno positivo y otro negativo (+, –, ∅ ) o los tres negativos (–, –, –). Por ejemplo, un sujeto que recupere las tres inferencias en desorden en los tres ensayos del nivel tres –pero no en el nivel subsiguiente–, se le aplica la puntuación entera "3" como puntuación de nivel. − La ejecución inferior (∅,∅,∅), (–,∅,∅), (–,–,∅), (+,∅,∅), no permitía alcanzar el nivel correspondiente pero servía como bonificación para computar el decimal en el nivel inmediatamente inferior, que, lógicamente, habría sido el alcanzado. − Asimismo la ejecución superior (+,+,∅), (+,–,–), (+,+,–), (+,+,+), servía igualmente para bonificar la puntuación de nivel, implicando distintos incrementos proporcionales. La suma de ambos tipos de bonificaciones configuraban un rango de puntuación decimal entre 0,1 y 0,9; con lo que la puntuación en su conjunto tenía un carácter continuo y manejable a "nivel de razón" (para más detalles puede consultarse Elosúa y cols., 1997). Resultados y discusión Como puede observarse en la Tabla 3, las frecuencias encontradas para las distintas inferencias condicionales resultaron completamente acordes con las predicciones de la TMM, que consideran su dificultad en función del número de modelos involucrado. En este sentido,
12 cabe destacar que los porcentajes de respuesta de las inferencias MP y AC son claramente más altos que los de MT y DA. Estos resultados confirman la idea de que los razonadores tienden preferentemente a responder sobre la base de un solo modelo inicial (P Q) a partir del cual se accede a las inferencias MP y AC, evitando la sobrecarga que puede suponer el despliegue de los dos modelos necesarios para acceder a las inferencias MT y DA. *****Insertar la Tabla 3 por aquí***** Del mismo modo, los resultados encontrados con los problemas de disyunciones (véase la Tabla 4), también son interpretables de acuerdo con las previsiones de la TMM. Lo más destacable es la proporción de respuestas de "No hay conclusión", que se situó en torno al 50% en todos los casos. Para los problemas con las premisas categóricas afirmadas (p y q), como vimos más arriba ésta es la respuesta correcta, lo que sugiere que probablemente gran parte de los razonadores son capaces de representar los dos modelos relevantes para la resolución de estos problemas. No obstante, también encontramos que un porcentaje relevante de participantes dan respuestas simétricas incorrectas, que, como vimos, implican probablemente un ‘emparejamiento’ con los valores mencionados en el enunciado; así, a partir de “ p ó q, ó ambos” y “p”, los sujetos darán como respuesta “q”, y al revés. En el caso de las premisas categóricas negadas (no p y no q), la respuesta correcta es la inversa (q y p, respectivamente), lo que supone una dificultad mayor al reclamar, como vimos, la representación simultánea de los tres modelos; de ahí que sea menor la proporción de participantes que respondan correctamente con las inversas, y tiendan sobre todo a dar la respuesta de "No hay conclusión", que implica un trabajo semántico no exhaustivo, incompleto (véase García Madruga, Gutiérrez, Carriedo, Vila y Luzón, 2004, para una análisis más detallado de estos resultados en relación con las predicciones de la TMM). *****Insertar la Tabla 4 por aquí***** Pero, a fin de valorar la utilidad de las nuevas pruebas que hemos desarrollado, los resultados más importantes son los relativos al estudio correlacional. De entrada, tal y como esperábamos, PAL ofrece una estimación de la MO de los 89 participantes (Media =3,15; Desv. Típica = 0,61) significativamente superior a la obtenida a partir de las nuevas pruebas: M = 2,76 (dt = 0,55) para PAR-anf [t (88)= 6,03; p