ChapterPDF Available

Capítulo 1. Consideraciones básicas en la construcción de un cuestionario

Authors:

Abstract

Métodos y diseños de Investigación en Psicología. Volumen II Capítulo 1. Consideraciones básicas en la construcción de un cuestionario Rodolfo Ramos Álvarez Inmaculada Pérez López 1. INTRODUCCIÓN La construcción de un test es un proceso largo, y en muchas ocasiones complejo, que está conformado por diversos momentos cruciales. De manera resumida estas etapas pueden agruparse en dos fases: una primera, consistente en la construcción preliminar del test (elección del constructo y los ítems) y su administración a una muestra suficientemente amplia y heterogénea que permita la realización de los cálculos estadísticos necesarios encaminados a la validación del instrumento (fiabilidad, validez, índices de discriminación…); la segunda fase es aquella en la que, o bien se obtiene la elaboración definitiva del test tras efectuar, la mayoría de las veces, una serie de modificaciones surgidas por el trabajo de la primera fase, o bien se rechaza por no cumplir los requisitos mínimos exigidos por la comunidad científica a los instrumentos de medida en Psicología respecto a su calidad métrica y teórica. Existe consenso sobre los pasos previos básicos para la elaboración de un test (Estos pasan por la determinación por parte del experto o grupo de expertos de una serie de variables y parámetros, a saber:-El constructo que se desea medir. Determinar si es una variable cognitiva o no. En caso de seleccionar un constructo que desde el paradigma teórico de partida está jerarquizado, es decir, formado a su vez por otros constructos de menor envergadura, el constructor deberá declarar qué componentes de éste va a medir.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
Capítulo 1.
Consideraciones básicas en la construcción
de un cuestionario
Rodolfo Ramos Álvarez
Inmaculada Pérez López
1. INTRODUCCIÓN
La construcción de un test es un proceso largo, y en muchas ocasiones
complejo, que está conformado por diversos momentos cruciales. De manera
resumida estas etapas pueden agruparse en dos fases: una primera, consistente
en la construcción preliminar del test (elección del constructo y los ítems) y
su administración a una muestra suficientemente amplia y heterogénea que
permita la realización de los cálculos estadísticos necesarios encaminados a la
validación del instrumento (fiabilidad, validez, índices de discriminación…);
la segunda fase es aquella en la que, o bien se obtiene la elaboración
definitiva del test tras efectuar, la mayoría de las veces, una serie de
modificaciones surgidas por el trabajo de la primera fase, o bien se rechaza
por no cumplir los requisitos mínimos exigidos por la comunidad científica a
los instrumentos de medida en Psicología respecto a su calidad métrica y
teórica.
Existe consenso sobre los pasos previos básicos para la elaboración de un test
(Martínez Árias, 1996; Navas, 2001; Suárez, 2001; Trujillo y Ramos, 2005).
Estos pasan por la determinación por parte del experto o grupo de expertos de
una serie de variables y parámetros, a saber:
- El constructo que se desea medir. Determinar si es una variable
cognitiva o no. En caso de seleccionar un constructo que desde el
paradigma teórico de partida está jerarquizado, es decir, formado a
su vez por otros constructos de menor envergadura, el constructor
deberá declarar qué componentes de éste va a medir.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
- El tipo de prueba o pruebas que requerimos. El contenido de la
misma, su longitud, el formato que vamos a elegir.
- Cuál va a ser su forma de aplicación. Si será individual o
grupal.
Esta toma de decisiones, crucial en el proceso de construcción de un test,
puede verse facilitada por el establecimiento de una serie de preguntas, las
cuales, al ser respondidas, permiten avanzar al investigador (Navas, 2001).
Así se clarifican los objetivos del instrumento.
- ¿Qué se va a medir? Determinar y seleccionar las variables
objeto de estudio pudiendo ser: manifiestas o latentes
(cognitivas o afectivas).
- ¿A quién? La población a la que va dirigido el test va a
condicionar su construcción y a determinar en parte las
características que ha de tener la prueba. Por ejemplo, el
lenguaje empleado en los ítems y en las instrucciones no será el
mismo para un grupo de escolares de Educación Primaria que
para un grupo de adultos.
- ¿Qué se pretende? Es decir, cuál es el motivo por el que se
desea medir tal variable, o cuál va a ser la función de dicho test.
Respecto a las funciones que un test puede tener, algunas de las posibles son
las siguientes (Suárez, 2001):
- Diagnosticar. Es determinar el carácter de una patología y su
calificación mediante el examen de sus signos y síntomas
característicos.
- Seleccionar. Determinar si una persona es apta o no para una
función concreta.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
- Clasificar. Asignar a una u otra categoría previamente
establecida a los sujetos evaluados.
- Certificar. Acreditar si una persona es o no competente en un
área, una habilidad o una competencia, y si ha adquirido
satisfactoriamente los objetivos marcados.
- Aconsejar u orientar. Ayudar a los sujetos a elegir una de las
opciones que posee frente a las diferentes posibilidades que se le
presentan según sus intereses y/o capacidades: laborales,
familiares, de ocio… Son de amplio uso entre los
Departamentos de Orientación de Enseñanza Secundaria o en
los Equipos de Orientación de Zona.
- Describir o informar. Recabar información acerca de un
aspecto determinado, como por ejemplo, una situación de
aprendizaje.
2. ELEGIR EL CONSTRUCTO
Los constructos, al no ser directamente observables, precisan ser definidos en
términos concretos, mesurables y observables. Son entidades abstractas,
supuestas, bien definidas y articuladas, que consideramos que existen, aunque
no sean estrictamente visibles y que sirven para explicar determinados
fenómenos (Hayman, 1979; rez-Gil, Chacón y Moreno, 2000). Su
definición implica que para estudiarlos se requiere analizar las variables
derivadas de ellos, que son visibles y que funcionan como indicadores del
fenómeno no observable (Bisquerra, 1987). Es la operativización de las
variables.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
El problema surge al garantizar la validez de la operativización, es decir, el
grado en el que podemos afirmar que estamos realmente obteniendo datos del
constructo seleccionado y no de otro que se le aproxime teóricamente
(Elosua, 2003). Así, Ato (1991) realiza una propuesta sobre las fases en el
proceso de operativización de variables:
- Se define la variable.
- Se deducen sus aspectos principales.
- Se buscan indicadores o circunstancias empíricas concretas de
cada dimensión.
- Se construyen los índices: no todos los indicadores tienen el
mismo peso por lo que se les otorgará uno u otro valor
dependiendo de éste.
3. DETERMINAR EL CONTENIDO
La resolución de este momento pasa por dos consideraciones: a quién va
dirigido y cuál será su función. Una vez seleccionado el constructo, como
acabamos de decir, el siguiente paso metodológico es buscar conductas o
respuestas que sirvan de indicadores empíricos de la variable elegida. Pero,
¿qué elementos lo caracterizan? El hecho de que el constructo esté enmarcado
dentro de un modelo concreto hace que su representación empírica quede
perfilada de antemano, pues la posición teórica de partida determina en gran
parte qué indicadores podremos usar.
Crocker y Algina (1986) proponen algunas de las siguientes estrategias para
buscar los elementos que caracterizan a un constructo:
- Análisis de contenido. Realizar preguntas abiertas a los sujetos y
posteriormente las más recurrentes o comunes se utilizan como
indicadores principales del constructo.
- Revisión bibliográfica. Revisar o leer sobre las investigaciones
ya realizadas en ese campo.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
- Incidentes críticos. Los extremos del constructo se definen
mediante una lista de conductas críticas.
- Observación natural y directa. El constructo se define mediante
conductas observadas directamente.
- Opinión de expertos. Se definen los constructos recabando
información a través de personas que la poseen de primera mano.
- Especificar objetivos. En pruebas de rendimiento el constructo se
define a partir de la especificación de los objetivos que se
pretenden cumplir con un determinado programa.
- Muestreo del dominio del ítem. Utilizado en los tests de
acreditación y certificación y en los de descripción e información.
4. ELEGIR EL FORMATO
Decidir cuál va a ser el formato de un test supone elegir el formato de los
ítems, es decir, su forma de presentación y distribución general. También
implica determinar cómo será su aplicación, su forma de obtener la
información, cuándo se efectuará y qué instrucciones requerirá para su
presentación (Suárez, 2001). La distribución general del cuestionario tendrá
en cuenta el orden que van a llevar los diferentes ítems y la longitud que ha
de tener. En cuanto a la forma de obtener la información, podemos hacerlo
por escrito (en grupo o individualmente) o usando entrevistas personales y/o
cuestionarios (por correo, email o teléfono). Cómo se obtenga la información
condicionará la presentación y el formato de la prueba.
Por último, sobre la forma de presentación debemos decir que las
instrucciones pueden darse por escrito u oralmente, siendo en cualquier caso
aconsejable introducir ejemplos clarificadores que faciliten las respuestas del
sujeto.
Existen dos cuestiones a tener en cuenta para una correcta presentación del
cuestionario (Navas, 2001):
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
- Número de preguntas. La longitud del cuestionario, a quién va
dirigido y cómo se aplicará, son aspectos que dependen del tema, la
profundidad y la precisión con que se quiera evaluar. A mayor
número de preguntas la fiabilidad suele ser mayor (Martínez Árias,
1996; Muñiz, 1996; Navas, 2001), si bien este aspecto será tratado
en profundidad más adelante. En cualquier caso son cuestiones
prácticas (Meliá, 1990): evitar preguntas superfluas, procurar el paso
de una temática a otra con fluidez, y reducir, en la medida de lo
posible, todas las influencias que puedan aumentar innecesariamente
la fatiga del encuestado.
- Orden y ritmo de las preguntas en el test. Para ello se utilizan
distintos procedimientos. El más frecuente es comenzar con las
preguntas más simples para introducir poco a poco las más
complejas. Otras consideraciones de interés son (Navas, 2001): la
información más importante debe estar en la parte inicial del test; las
preguntas deben agruparse formando una unidad; procurar que los
grupos de ítems que se refieren a las mismas cuestiones estén
agrupados y, además, posean una coherencia secuencial en el
tiempo. En general, las preguntas más sencillas de contestar suelen
ubicarse al principio y al final, y las más estratégicas o importantes
para la investigación, entre ambas. Si estas preguntas se sitúan juntas
o al principio del cuestionario, el sujeto podría rechazarlo. Otra
técnica es iniciar el cuestionario con preguntas generales e ir
introduciendo progresivamente otras más concretas (Meliá, 1990).
Por otro lado, en la estructura del test, tienen cabida también los
ítems control. Son preguntas similares, redactadas de distinta forma,
que se distribuyen a lo largo del test para comprobar si el sujeto es
coherente en las respuestas a un mismo tema (Martínez Árias, 1996).
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
Otras recomendaciones relacionadas con la elección del formato del
cuestionario son (Navas, 2001; Trujillo y Ramos, 2005):
- No incluir preguntas con dobles negaciones.
- Evitar, siempre que sea posible, dentro de las opciones de
respuesta
“no sabe no contesta”. Puede dar lugar a que el sujeto la utilice
cuando realmente no sabe qué responder y también cuando, por
comodidad, no desee reflexionar sobre el ítem, sesgando así los
resultados.
- Evitar preguntas excesivamente largas o en un elevado número.
4.1. La longitud del test
En esta decisión habrá que tener en cuenta tanto los factores internos al
propio instrumento -si el test contiene, por ejemplo, ítems de elección
múltiple suele requerir más ítems que si las preguntas son abiertas-, como
factores externos -como, por ejemplo, la edad de los destinatarios-.
Hay que tener en cuenta que la construcción de ítems no es una tarea fácil,
requiere un conocimiento profundo de la materia objeto de estudio, facilidad
de expresión e imaginación. Es muy posible que tras el análisis estadístico y
la validación del cuestionario sea preciso descartar algunas de las preguntas o
pruebas formuladas. Por este motivo debemos elaborar una batería con un
número mayor de las que calculemos que vamos a requerir finalmente.
En una situación ideal lo mejor sería que la prueba fuera larga, pues aportaría
más información al investigador, otorgándole mayor fiabilidad al test (Muñiz,
1996; Martínez Árias, 1996; Navas, 2001; Suárez, 2001). Pero, a mayor
número de ítems, mayor fatiga del sujeto y menor motivación en su
realización. Además, la extensión del test puede originar mayor error de
medida. Por lo tanto, es muy importante lograr un equilibrio entre longitud y
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
calidad de la información, pues una prueba larga no es un sinónimo de un
buen test.
4.2. Dificultad de los ítems
Una vez determinado el formato de la prueba habrá que determinar qué grado
de dificultad han de presentar los ítems. Si lo que queremos es evaluar cierto
grado de especialización en los sujetos será preciso profundizar en los ítems,
impregnándolos de cierto grado de dificultad, sino no podremos
diferenciarlos de otros sujetos con menor especialización. Si pretendemos
medir conocimientos generales la prueba deberá incluir ítems de dificultad
media. En último lugar, si se trata de conocer el fracaso de los sujetos en
cualquier actividad o situación los ítems serán de dificultad baja.
5. EL REGISTRO
Básicamente son dos los tipos de registro. En uno el sujeto puede responder
directamente en el cuadernillo. Esto presenta un inconveniente: no podemos
reutilizar los cuadernillos, con el consiguiente coste económico que conlleva,
sobre todo si éste lleva material impreso a color. En la otra modalidad de
registro el sujeto recoge sus respuestas en una hoja reservada expresamente
para tal fin. Esto supone la posibilidad de reutilización de la prueba en el
futuro y, por tanto, un ahorro en tiempo y esfuerzo. Sin embargo, esta opción
no queda libre de inconvenientes, ya que esta tarea puede convertirse en un
elemento distractor para el sujeto. De hecho cuando se trata de niños o
personas que no están familiarizadas con los ítems de elección múltiple es
mejor recoger las respuestas en el mismo cuestionario.
6. LOS ÍTEMS
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
En la construcción de cualquier prueba existen una serie de reglas que
facilitan la redacción de los ítems (Navas, 2001; Suárez, 2001):
- Escribir de forma clara, precisa, simple y concisa.
- Emplear preferentemente ítems breves.
- Cuidar el lenguaje usado.
- Expresar una única idea por ítem.
- No repetir palabras.
- Las opciones de respuesta deberán estar al final del enunciado.
- Evitar expresiones del tipo: “ninguna es válida” o “todas son
válidas”.
- No dar pistas acerca de la opción correcta.
- No usar expresiones coloquiales.
- No utilizar palabras técnicas en la medida de lo posible.
Siguiendo a Arnau (1995) y Suárez (2001), el formato de los ítems va a
depender del tipo de variable que queramos medir, si pertenecen al ámbito
cognitivo o no. En el primer supuesto se distinguen tres grandes categorías de
ítems: los de elección, los de emparejamiento y los de construcción. Los
primeros son aquéllos que requieren que el sujeto elija una o varias opciones
de entre las propuestas. Pueden, a su vez, ser de elección múltiple o binaria.
Son múltiples si el sujeto elije la respuesta que considera correcta de entre
tres o más alternativas y binaria si tiene sólo dos opciones. Los ítems son de
emparejamiento cuando el sujeto tiene que relacionar lo que aparece en una
columna con lo que aparece en otra. Los ítems de construcción requieren que
el sujeto construya la respuesta. Pueden ser de dos tipos: de respuesta corta (o
de completar) y de repuesta extensa.
Puede observarse cómo dentro del ámbito cognitivo cada una de las formas
de los ítems presenta características peculiares, seleccionando una u otra en
función del constructo o variable que vayamos a medir.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
En el ámbito no cognitivo o afectivo se pueden usar dos tipos de ítems
(Martínez Árias, 1996). El primero son los ítems de respuesta abierta. En
ellos el sujeto es quien escribe la respuesta. Puede hacerlo con sus propias
palabras sin verse limitado a elegir entre categorías de respuesta
predeterminadas. Esta forma de recoger información provoca contestaciones
explicativas al tiempo que da una información más intensa y profunda. El
inconveniente que presentan es que no pueden analizarse estadísticamente sin
realizar antes un trabajo previo de categorización que es lento y costoso. El
segundo tipo de ítem no cognitivo son los de respuesta cerrada. Aquí el sujeto
elije una de entre las posibles respuestas dadas por el evaluador. Nos
permiten recabar información puntual y objetiva a nivel de análisis
estadístico. Se pueden dividir en dicotómicas o tricotómicas según el número
de posibilidades para contestar sean dos o tres. A las primeras también se las
denomina como preguntas de todo o nada. Las tricotómicas son más fáciles
de construir pero más difíciles de analizar en relación con las dicotómicas.
Para Prieto y Delgado (1996) una prueba no cognitiva formada
exclusivamente por ítems de respuesta cerrada se denomina Escala de
Valoración, y pueden ser: Escalas de Categorías o Listados. Las primeras
están integradas por ítems formados por un enunciado y un conjunto de
categorías (de frecuencia, de acuerdo o Escalas Likert, de cantidad, o de
valoración) que pueden estar ordenadas o no. En las segundas la tarea del
sujeto consiste en marcar la respuesta que considere adecuada a la pregunta
que se le formula de entre una relación de frases, afirmaciones, lista de
términos, etc.
Concluyendo, las escalas de valoración se caracterizan por ser de fácil
construcción, aplicación y puntuación. Son muy adecuadas para las
autoevaluaciones y los autoinformes (Navas, 2001).
6.1. Puntuar los ítems
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
El objetivo que buscamos a la hora de puntuar un test, como evaluadores de
una característica o rasgo, es determinar el valor escalar del sujeto. Es decir,
determinar el nivel real en que éste posee dicha característica o rasgo.
Determinar la puntuación total del test precisa de dos pasos (Suárez, 2001;
Prieto y Delgado, 1996): el primero es asignar puntuaciones a los ítems del
test, el segundo es combinar las puntuaciones de los ítems.
- Asignar puntuación a los ítems. Las puntuaciones que se
otorguen a los ítems dependerán de los tipos de ítems
utilizados y, por tanto, del tipo de prueba que tengamos:
cognitiva o no cognitiva.
§ En el caso de ítems de elección o de respuesta
cerrada la regla para la asignación de puntuaciones
será la siguiente: si la prueba es cognitiva bastará
con aplicar una plantilla de corrección asignando un
uno cuando la respuesta coincida con la correcta y
un cero en caso contrario. Si la prueba no es
cognitiva se le asignará a cada ítem el número
asociado a la respuesta. Antes de asignar las
puntuaciones habrá que determinar cuáles son los
ítems cuyas respuestas son favorables a la medición
de la característica que queremos medir. En aquellos
ítems cuyo enunciado es negativo se cambiará el
orden escalar (Prieto y Delgado, 1996).
§ Cuando los ítems del test son de construcción o
respuesta abierta el sistema de puntuación es
diferente. La asignación de puntuaciones en los
ítems de respuestas cortas (pruebas cognitivas)
consistirá en realizar un listado de respuestas
aceptables y otorgar un 1 cuando la respuesta del
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
sujeto esté en dicha lista y un 0 en caso contrario. En
el caso de que las respuestas a los ítems sean abiertas
el proceso es más complejo. Antes de asignar
puntuaciones es preciso categorizar. Para ello, y a
partir de una muestra del conjunto de respuesta se
buscarán categorías asignando a cada una un código
numérico que corresponderá a la puntuación del ítem
siempre que contenga su respuesta. El trabajo se
complica cuando el test trabaja con ítems de
respuesta abierta y extensa. En la asignación de
puntuación de estos ítems influye en gran medida la
subjetividad del calificador. Por ello, se suelen
utilizar dos métodos distintos: el método de
puntuación analítica y el método de puntuación
holística.
El método de puntuación analítica consiste
en definir previamente los criterios que
definan cómo se debe corregir y asignar las
puntuaciones del test. Sin que para tal tarea
se precisen grandes conocimientos sobre el
tema. Es decir, se definirán cuáles son las
dimensiones más relevantes para que la
tarea se considere correcta así como el
número de respuestas correctas necesarias
para concluir que la tarea ha sido
satisfactoriamente realizada.
En el procedimiento holístico se entrena a
un grupo de personas que sean grandes
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
conocedores de la materia para que
determinen una única puntuación que valore
la calidad global de la respuesta dada por el
evaluado. Este procedimiento a diferencia
del anterior proporciona mayor fiabilidad y
eficiencia a la hora de asignar puntuaciones.
- Combinar las puntuaciones de los ítems: Una vez concluida
la asignación de puntuaciones a los ítems pasaremos a
combinarlas para determinar cuál es la puntuación total del
test. Para ello bastará con utilizar la siguiente fórmula:
X= wi Xi
Donde:
- X es la puntuación total del test resultado de
la suma ponderada de las puntuaciones
obtenidas por el sujeto en los ítems.
- wi es el peso que asignamos al ítem i dentro
de una prueba formada por n ítems.
- Xi es la puntuación asignada al ítem i dentro
de esa prueba.
Como hemos mencionado con anterioridad, la asignación de
puntuaciones varía según sean pruebas cognitivas o no
cognitivas. Sin embargo en la combinación de puntuaciones
el método para ambas pruebas es el mismo. Por lo general,
la ponderación que se realiza es idéntica reservando la
diferencial para casos muy concretos que así lo requieran.
Lo más frecuente es que todos los ítems reciban el mismo
peso, es decir,
wi = 1, con lo que la fórmula anterior quedaría: X = Xi,
donde Xi se corresponde con el número de aciertos del
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
sujeto. Esta fórmula se conoce como la fórmula de
puntuación por número de aciertos (Suárez, 2001).
Sin embargo, en pruebas con ítems de elección múltiple o
binaria surge un problema: el sujeto puede responder al
azar. Se hace preciso aplicar fórmulas de corrección que
eliminen este efecto (Navas, 2001). Existen dos
posibilidades para ello. La primera es penalizar cada
respuesta incorrecta asumiendo que cuando el sujeto
responde de manera incorrecta no conoce la respuesta
acertada y está contestando al azar. La segunda es bonificar
cada omisión o ítem no respondido ya que se considera que
al no contestar de manera incorrecta el sujeto no deja al azar
sus respuestas. Otra manera controvertida, por la diversidad
de resultados que ofrece, de intentar que los sujetos
evaluados no contesten al azar en un test es a través de las
instrucciones. Éstas deben ir al principio y dejar claro todas
las posibles dudas que pueden plantearse. Sin embargo,
según Navas, las investigaciones llevadas a cabo a este
respecto son contradictorias. En ocasiones tienen un claro
efecto sobre las respuestas del sujeto y otras veces su
influjo es mínimo cuando no nulo.
6.2. Análisis de los ítems
El grado en que cada ítem es un buen medidor del rasgo de interés es algo
que se puede comprobar estadísticamente de manera sencilla si obtenemos
indicadores para cada ítem. Suárez (2001) propone los tres siguientes:
- El índice de dificultad. Este primer indicador sirve para
cuantificar el grado de dificultad de cada cuestión, por lo que
sólo tiene sentido su cálculo para ítems de tests de
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
rendimiento óptimo (Martínez Árias, 1996). El índice de
dificultad de un ítem j se define como el cociente entre el
número de sujetos que lo han acertado y el número total de
sujetos que lo han intentado resolver. Los sujetos que han
omitido el ítem no se contabilizan.
- El índice de homogeneidad. El índice de homogeneidad,
llamado a veces índice de discriminación (Martínez Árias,
1996), de un ítem (Hj) se define como la correlación de
Pearson (rjX) entre las puntuaciones de los n sujetos en el ítem
j y las puntuaciones X en el total del test: Hj= rjX. El índice de
homogeneidad de un ítem nos va a informar del grado en que
dicho ítem está midiendo lo mismo que la prueba globalmente
(Navas, 2001). Es decir, del grado en que contribuye a la
homogeneidad o consistencia interna del test (Trujillo y
Ramos, 2005). Cuando un Hj es negativo y alto, debemos
cuestionar el sistema de cuantificación de las respuestas que
se ha seguido en ese ítem. Si un ítem obtiene una correlación
negativa y alta con el total de la prueba, seguramente es
debido a que se ha cuantificado erróneamente el ítem. Cuando
un test tiene un número pequeño de ítems, resulta más
apropiado obtener el índice de homogeneidad corregido.
Consiste en correlacionar las puntuaciones en un ítem con las
puntuaciones en el total del test después de restar de este total
las puntuaciones del ítem cuyo índice queremos obtener.
Como resulta lógico suponer, el Hj corregido de un ítem suele
ser inferior al obtenido sin corregir (Prieto y Delgado, 1996).
- El índice de validez. Será expuesto detalladamente en un
capítulo posterior.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
7. APLICACIÓN DE LOS TEST
Una vez concluida la fase de construcción del test es imprescindible decidir
cuál va a ser la forma de aplicación. La forma en que mostremos un test a un
sujeto puede ser muy variada. Las más usuales son: colectiva o individual;
papel y lápiz o informatizada; personal, por teléfono o correo postal.
8. LA INTERPRETACIÓN DE LOS RESULTADOS
Una vez concluida la asignación y combinación de las puntuaciones de los
ítems es necesario dotar de significado dichas puntuaciones, pues la
puntuación directa de una persona en un test no es directamente interpretable.
Para hacerlo se puede optar por dos vías: la normativa y la criterial.
8.1. Normativa
La interpretación normativa consiste en comparar la actuación del sujeto en el
test con la de un grupo de referencia en la misma prueba (Echevarría, 1989;
Muñiz, 1996). Este grupo de referencia recibe el nombre de grupo normativo.
Baremar consiste en asignar a cada posible puntuación directa un valor
numérico (en una determinada escala) que informa sobre la posición que
ocupa la puntuación directa (y por tanto la persona que la obtiene) en relación
con los que obtienen las personas que integran el grupo normativo donde se
bareman las pruebas. Existen tres tipos fundamentalmente de puntuaciones
normativas (Arnau, 1995; Navas, 2001) y son: las cronológicas, las centiles y
las típicas.
- Puntuaciones cronológicas. Se emplea en rasgos
psicológicos que evolucionan con la edad. Desde este
supuesto tiene pleno sentido comparar la puntuación de un
sujeto con las que obtienen los de su misma edad y los de
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
edades diferentes. Básicamente, y durante mucho tiempo, se
han utilizado dos tipos de puntuaciones cronológicas que se
consideraron prototípicas: la Edad Mental y el Cociente
Intelectual. Sólo pueden utilizarse cuando el constructo al que
se aplica no adquiere rápidamente su madurez, como por
ejemplo la inteligencia o la madurez motora.
- Puntuaciones centiles. Las puntuaciones centiles indican el
porcentaje de sujetos del grupo normativo que puntúa por
debajo de la puntuación obtenida por un sujeto determinado.
Se denomina Centil o Percentil (Cx) a aquella puntuación del
sujeto que deja por debajo de sí al C por ciento de sujetos del
grupo normativo.
- Puntuaciones típicas. Estas puntuaciones indican la distancia
que separa a un sujeto de la media del grupo normativo. Es
decir, indica la distancia que separa a un sujeto con una
determinada puntuación de la media de su grupo, utilizando
unidades de desviación típica. La escala típica lineal es la más
simple e indica a cuántas desviaciones típicas se encuentra
una puntuación de la media del test pudiendo ser positiva o
negativa.
§ Puntuaciones típicas normalizadas. Cuando se
puede asumir (o se comprueba) que las puntuaciones
de un grupo normativo en un test siguen una
distribución normal, un centil concreto dividido
entre cien indica el área de la curva normal que
queda por debajo de la puntuación correspondiente.
Conociendo la proporción que queda por debajo de
un punto dado de la distribución podemos utilizar la
tabla de la curva normal para obtener sin cálculos la
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
puntuación típica asociada (Zn), que se denomina
puntuación típica normalizada. Indicará el número
de desviaciones típicas que una puntuación se
encuentra por encima (si es positiva) o por debajo (si
es negativa) de la media en una distribución normal.
Las puntuaciones típicas (lineales y normalizadas) tienen dos dificultades
formales para su interpretación: la posibilidad de asumir valores no enteros y
negativos (Navas, 2001). Con objeto de superar estas pequeñas dificultades,
se han propuesto otros baremos que no son más que una transformación lineal
de las puntuaciones típicas, con lo que no se alteran las propiedades de la
escala típica en sí. Estas puntuaciones son denominadas escalas típicas
derivadas si el objeto de la transformación lineal es una puntuación típica
estándar; o escalas típicas derivadas y normalizadas si suponen la
transformación de una puntuación típica normalizada. Las principales son las
denominadas escalas T y escalas D, que tienen versiones matemáticas para
ambas escalas típicas.
- Las escalas típicas derivadas. Las escalas T presentan la
siguiente forma:
T = 50 + 10Z, mientras que las escalas S la siguiente: S = 50
+ 20Z. En definitiva, las puntuaciones T representan una
escala con media 50 y desviación típica 10. Asimismo, las
puntuaciones S representan una escala con media 50 y
desviación típica 20. Los estaninos (Eni= 5 + 2 Zni)
representan otra escala, con media 5 y desviación típica 2. La
interpretación de cada una de las escalas típicas derivadas
normalizadas sigue la misma lógica que su correspondiente
escala típica derivada sin normalizar, haciendo siempre la
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
salvedad de que la interpretación hay que referirla a una
distribución normal.
8.2. Criterial
En el caso de la interpretación criterial, y a diferencia de la normativa, la
comparación entre sujetos carece de importancia y lo que se busca es
comparar la actuación del sujeto en el test con un criterio definido con
antelación para áreas o dominios conductuales o de contenidos bien
especificados (Fernández-Ballesteros, 1995). Para ello, es necesario definir
cuál va a ser el criterio que va a servir de punto de corte, es decir, el que nos
va a permitir diferenciar entre dos categorías. Éstas nos indican distintos
niveles de consecución de objetivos, habilidades o competencias medidas por
el test. Categorías que podemos traducir en “cualificado” o “competente” o
por el contrario “no cualificado” o “no competente”. De este modo, si la
puntuación de un sujeto es igual o superior a la puntuación definida como
punto de corte, se considera a un sujeto perteneciente al grupo cualificado,
pero si la puntuación es inferior, se considera que el sujeto pertenece al grupo
no cualificado.
Siempre que apliquemos el método criterial es preciso determinar cómo se
asignará el punto de corte. Hambleton y Eignor (1978) y Hambleton (1985)
recogen una clasificación habitual de los métodos más adecuados para
determinar el valor de corte. Estos métodos los clasifican en tres grandes
bloques:
- Métodos valorativos. Se le solicita a un grupo de jueces
expertos que evalúen cómo sería la actuación de un sujeto en
el test con un mínimo de competencia.
- Métodos empíricos. Se aplican pruebas y se recogen datos
del test para establecer la correspondiente puntuación de
corte.
Métodos'y'diseños'de'Investigación'en'Psicología.'Volumen'II'
- Métodos mixtos. Utilizan datos tanto valorativos como
empíricos a la hora de establecer cuál será la puntuación de
corte.
En resumen, se trata de evaluar la actuación del sujeto con respecto a un
criterio, con objeto de definir dicha actuación en términos de lo que sabe o no
sabe hacer en el campo o área de conocimiento evaluado.
!
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.