Content uploaded by Corinne J. Montes-Rodríguez
Author content
All content in this area was uploaded by Corinne J. Montes-Rodríguez
Content may be subject to copyright.
1
El paraíso y el infi erno en el cerebro:
el sistema de la recompensa
por Corinne J. Montes Rodríguez y
Oscar Prospéro García*
¿Por qué hacemos las cosas?
La palabra motivación se refi ere a los procesos neurobiológicos que nos llevan
a realizar un trabajo con el fi n de obtener un reforzador. En otras disciplinas
médicas, como en la Psiquiatría, se le llama pulsión. En un lenguaje cotidiano,
signifi ca “ganas de hacer las cosas”. La causa o razón para que se presente la
motivación es la potencial recompensa que el sujeto anticipa que va a obtener.
La toma de decisiones que nos lleva a seleccionar una conducta está matiza-
da por el valor recompensante que la meta o el objetivo establecido ofrece al
individuo y, a su vez, este valor recompensante depende de las necesidades
internas del organismo. Al despliegue de una conducta para cubrir una necesi-
dad se le llama conducta motivada y podemos inferir cuánta motivación tiene
un individuo a partir de la cantidad de trabajo que realiza para alcanzar su
objetivo. Con frecuencia estamos realizando conductas motivadas, orientadas
a obtener reforzadores que restituyen la constancia de nuestro medio inter-
no; comer, beber y otros reforzadores. Saciar el instinto de aprender es una
conducta con una poderosa dosis de motivación; todo mundo aprendemos
algo todos los días, como una ruta más corta para llegar al trabajo o mejores
maneras para obtener dinero. Adquirir conocimiento, alimento y dinero son
ejemplos de las consecuencias obtenidas por las conductas ejecutadas, y a
éstas se les llama reforzadores. Un reforzador será todo aquello que modifi -
que la ocurrencia de una conducta. Así, el que aumenta la probabilidad de que
ocurra una conducta es un reforzador positivo; mientras que el que disminuye
la ocurrencia de una conducta es un reforzador negativo (1-3).
Ley del Efecto
A principios del siglo XX un psicólogo llamado E. L. Thorndike evaluaba la ca-
pacidad de resolución de problemas en animales. Para esto, colocaba a gatos
2
privados de alimento dentro de una jaula desde donde podían visualizar el ali-
mento que se encontraba fuera de ésta; los gatos tenían que salir de la jaula
para obtener el alimento (reforzador). El gato desplegaba una conducta de
escape con movimientos aleatorios, hasta que presionaba una palanca que le
permitía escapar de la jaula y obtener el reforzador. Conforme avanzaban los
ensayos el gato desarrollaba una estrategia para escapar y obtener el alimen-
to. La obtención del reforzador era más efi ciente aumentado el número de re-
forzadores obtenidos en menos tiempo. Con base en esta observación, Thorn-
dike formuló la Ley del Efecto, la cual establece que la probabilidad de que una
conducta ocurra depende de sus consecuencias. Una consecuencia satisfacto-
ria (reforzador positivo) aumenta la ocurrencia de una conducta. Mientras que
una consecuencia no satisfactoria o incluso aversiva disminuye la ocurrencia
de una conducta. Así, desplegamos conductas con base en las consecuencias
obtenidas. El efecto hedónico que provee el reforzador una vez obtenido es lo
que se conoce como recompensa. Evidentemente, la magnitud de este efecto
hedónico depende del estado homeostático en que se encuentre el sujeto. Por
ejemplo, si un sujeto tiene hambre, entonces el valor recompensante del ali-
mento es mucho más alto que el que tendrá en un sujeto saciado (1-3).
Las conductas motivadas
Las conductas motivadas se realizan para la obtención de recompensas.
Para que se despliegue una conducta motivada el organismo debe presen-
tar un estado inicial de desbalance homeostático, por ejemplo hambre;
esta necesidad lleva al organismo a trabajar, v. gr. ir al supermercado para
conseguir alimento (reforzador positivo) y saciar su apetito (restituir el
balance homeostático: recompensa). Como se observa en el ejemplo, las
conductas motivadas están compuestas por dos fases: la fase apetitiva,
que se refi ere a la conducta de aproximación que el organismo emite antes
de alcanzar la meta, y la fase de consumo, que se refi ere a secuencias de
movimientos estereotipados que llevan a la meta (3,4).
Adicionalmente, como hemos señalado, las conductas motivadas son
reguladas por tres sistemas; el homeostático y el hedónico y el de estrés
o castigo.
El sistema homeostático se refi ere a las señales periféricas del organismo,
como cambios en la concentración de hormonas, péptidos u otras sustancias
químicas que llegan al hipotálamo y que señalizan un desbalance del medio
interno. El termino homeostasis se refi ere a la constancia del medio interno.
Por ejemplo, la sensación subjetiva de hambre es consecuencia del desbalance
energético por el que cursa nuestro organismo por momentos. Éste es detec-
tado por el hipotálamo, un conglomerado de núcleos cerebrales que recibe de
la periferia señales nerviosas o moleculares que nos dan la sensación subjetiva
de sed, hambre, deseo sexual y sueño, entre otras.
El sistema hedónico regula la sensación subjetiva de placer que genera la
obtención y/ o consumo del reforzador; es decir, la recompensa. Este sistema
esta integrado por varios núcleos cerebrales, que revisaremos adelante.
3
Al sistema de estrés o castigo lo modula preferentemente la amígdala, un
conglomerado de núcleos alojados en el interior del lóbulo temporal que está
encargado de modular la sensación subjetiva de miedo. Este sistema nos per-
mite evitar condiciones que pueden ser dañinas para nuestro organismo, des-
de comer un alimento descompuesto hasta evitar sitios potencialmente per-
misivos de asaltos o abusos que pongan en riesgo nuestra integridad física o
nuestra vida.
La ejecución de una conducta motivada está matizada por el desbalance
del medio interno que presenta el organismo y por el componente hedónico.
Así, una conducta muy motivada será aquella provocada por un desbalance
profundo del medio interno, v. gr. varias horas sin comer y un reforzador de
gran calidad, un platillo apetitoso, dietéticamente balanceado, y por lo que
el sujeto anticipa una recompensa de gran magnitud. También el reforzador
puede ser alejarse de un sitio d peligro, v. gr. alejarnos a toda velocidad de
un incendio, una explosión o un sujeto armado que nos amenaza.
El sistema de la recompensa
En 1954 James Olds y Peter Milner colocaron un electrodo de estimulación
eléctrica en el cerebro de una rata. El animal se encontraba dentro de una caja
donde tenia la opción de presionar una palanca y autoadministrarse pulsos
eléctricos. Olds y Milner observaron que la rata no dejaba de autoestimularse,
incluso en condiciones en las que llegaba a lastimarse las patas por la alta
cantidad de veces que presionaba la palanca. La rata podía apretar la palanca
desde 500 hasta 5000 veces en una hora, y, prefería la autoestimulación eléc-
trica que comer, beber o aparearse. Incluso, el animal era capaz de soportar
reforzadores negativos, como atravesar una malla electrifi cada, para llegar a
la palanca y autoestimularse. Con este experimento, los autores interpretaron
que habían localizado el centro del placer (5,6).
El sistema del placer
Ahora sabemos que Olds y Milner colocaron los electrodos de estimulación
en un grupo de fi bras que se originan en un núcleo del tallo cerebral llama-
do área ventral tegmental (VTA), estas fi bras llegan a otro núcleo localizado
en la parte basal y anterior del cerebro llamado núcleo accumbens (NAc).
El VTA contiene cuerpos neuronales que producen un neurotransmisor lla-
mado dopamina y lo envían hacia el NAc, donde hay dos tipos de receptores
a dopamina, el D1 y el D2. El primero es excitador y el segundo es inhibi-
dor. Cuando el VTA se activa libera dopamina, la cual activa los receptores
D1 facilitando la actividad del NAc. Tras un periodo el D2, que es inhibidor,
regresa al NAc al estado anterior a la excitación.
La activación del NAc por la liberación de dopamina del VTA ocurre ante la
presencia de reforzadores naturales (comida, agua y sexo) y artifi ciales (dro-
gas de abuso), ante la presencia de un estímulo que anticipa la ocurrencia de
un reforzador y, por tanto, está generando o al menos regulando la expresión
de la fase apetitiva y de consumación de una conducta motivada (7-11).
4
Si alteramos el funcionamiento del sistema dopaminérgico en el NAc, por
el bloqueo de los receptores dopaminérgicos o por la destrucción de las fi bras
provenientes del VTA, los animales no son capaces de obtener reforzadores de-
bido a que no se presentan las conductas motivadas. Pareciera que al animal
no le importa comer o beber, a pesar de la disponibilidad de los reforzadores.
Es como si perdiera la capacidad de anticipar la recompensa que el reforzador
le proporcionará. Es por esto que se ha propuesto el NAc y la dopamina como
los elementos centrales del sistema de recompensa y de la generación de la
sensación subjetiva de placer ante la obtención de reforzadores (7-11).
El NAc recibe proyecciones del hipotálamo lateral (HL), la corteza prefrontal
(CPF), el tálamo dorsomedial (TDM), el hipocampo (HC) y por su puesto del VTA. El
accumbens a su vez envía proyecciones al VTA y al HL. Mientras que el VTA envía
y recibe proyecciones de la CPF y del HL. Estas estructuras forman el sistema de
la recompensa llamado también circuito límbico-motor. Obviamente un circui-
to de gran infl uencia sobre éste que hemos descrito como el del placer, está
modulado por la amígdala. Si la amígdala señala que ese estímulo es dañino
para el organismo, será entonces categorizado como un reforzador negativo
y se generará una estrategia de evitación del mismo. Lo que también es alta-
mente recompensante.
Dentro del sistema de la recompensa la información visceral y endocri-
na es recibida por el HL, la activación del VTA ocurre ante la presencia de
reforzadores naturales, es decir, lo que están siendo consumidos para res-
tituir la constancia del medio interno, o artifi ciales, los que se consumen
para obtener la sensación subjetiva de placer, sin que necesariamente es-
tén restituyendo la constancia del medio interno (v. gr. drogas de abuso).
Es interesante que estudios de imagenología realizados en humanos, han
mostrado que incluso un chiste que sea exitoso (provoca la risa del escu-
cha) hace que se active el sistema del placer. La información del contexto
es proporcionada por el HC, la planeación y la ejecución de la conducta de
consumo estará a cargo de la CPF y de los núcleos de la base involucrados
en la coordinación de movimientos. El NAc parece ser un integrador del
estado inicial de necesidad (desbalance homeostático), la ejecución de una
conducta motivada y la sensación subjetiva de placer ante la obtención y/o
consumo del reforzador.
Se ha propuesto al NAc como un detector de coincidencias entre el es-
tado motivacional (necesidad) de un organismo y el despliegue de una con-
ducta motivada (ejecución), de ahí que se le llame también interfase límbico-
motora (7-11).
El sistema de la recompensa y la conducta adictiva
La administración de varias drogas de abuso aumenta los niveles de dopa-
mina en el NAc tal como ocurre con los reforzadores naturales (agua, co-
mida, sexo). Se ha propuesto que las drogas de abuso ejercen sus efectos
reforzantes porque estimulan el sistema de recompensa, soslayando en
gran medida al sistema homeostático (8-13).
5
Los efectos reforzantes los podemos observar con diversas pruebas con-
ductuales como la preferencia de lugar condicionada y/o la autoadministra-
ción de drogas.
La prueba de preferencia de lugar condicionada consiste en colocar a
un animal en un aparato con dos compartimentos de características físi-
cas diferentes, por ejemplo, uno negro y otro blanco; uno liso y el otro
rugoso. Se administra una droga (v. gr. cocaína, anfetaminas, heroína)
al animal y se coloca en uno de los compartimentos, el sujeto asocia los
efectos de la droga con el compartimiento donde fue colocado. Obser-
vamos que cuando el sujeto puede elegir libremente en qué comparti-
miento permanecer, el sujeto pasa más tiempo en el lugar donde fue
administrada la droga. A esto se le denomina preferencia del lugar, con
lo que interpretamos que el sujeto asocia el lugar con los efectos refor-
zantes de la droga y, por tanto, permanece más tiempo ahí.
La autoadministración de drogas es otro paradigma para evaluar que tan
reforzante es una droga. Este paradigma, similar al de Olds y Milner, consiste
en entrenar a un animal a presionar una palanca para recibir una cantidad de
droga. Los animales aprenden rápidamente la tarea y pueden autorregular la
dosis que reciben, con el número de veces que presionen la palanca. Cuando
una droga es altamente reforzante, como la cocaína, el animal prefi ere au-
toadministrársela a obtener otro tipo de reforzador, como alimento.
Es posible revertir los efectos reforzantes de las drogas con la admi-
nistración de fármacos que bloqueen los receptores dopaminérgicos o
lesionando las neuronas dopaminérgicas del sistema de la recompensa.
Además, se ha mostrado que el consumo crónico de morfi na, cocaína o
alcohol disminuye la actividad normal del sistema de la recompensa. A
largo plazo se necesitan mayores cantidades de droga para estimular
este sistema y obtener la misma sensación de placer. Esta condición se
asocia con un efecto de tolerancia a los efectos de la droga y a la depen-
dencia a la misma (4,12,13).
Con base en estos datos, se ha sugerido que los efectos reforzantes de las
drogas ocurren gracias a la dopamina del sistema de la recompensa. Sin em-
bargo, la participación de otros neurotransmisores como las endorfi nas y las
marihuanas endógenas juegan un papel crucial en la conducta adictiva.
Consideraciones fi nales
Queremos concluir que la motivación es lo que nos lleva a ejecutar conductas,
desde las más básicas como la obtención de alimento o agua, hasta las más
complejas como disfrutar de un chiste, un buen libro o una obra de arte.
La motivación determina las decisiones que tomamos en la vida, como
la elección de una comida u otra, de un trabajo u otro, de ir a la escuela o
no hacerlo, de ser sexualmente fi el a la pareja o no. Todas nuestras deci-
siones están matizadas por las necesidades internas de nuestro organismo
y la calidad intrínseca de los posibles reforzadores que obtengamos y el
valor recompensante que les adjudiquemos. Sin este sistema moriríamos,
6
si lo alteramos tendremos una calidad de vida deplorable. Las drogas son
vehículos que conducen al placer cambiando la concepción adaptativa del
trabajo. En esta condición, el sentido de la motivación como la energía
para llevar a cabo un trabajo que en sí mismo pueda ser recompensante,
se pierde y a pesar de que no negaremos que un sujeto adicto, en el pe-
riodo de carencia, llevará a cabo un intenso trabajo para obtener la droga,
su trabajo no será adaptativo porque no lo llevará al fl orecimiento de sus
genes y de su territorio. El sistema de la recompensa es indispensable para
responder exitosamente a las demandas del medio y, por ende, para la so-
brevivencia de cualquier organismo.
Notas
* Grupo de Neurociencias, Departamento de Fisiología, Facultad de Medici-
na, Universidad Nacional Autónoma de México (UNAM).
Correspondencia:
Doctor Óscar Prospéro García
Departamento de Fisiología, Facultad de Medicina UNAM
Apartado postal 70-250
CP 04510 México, D. F.
México
Teléfono: 525 623 2509, Fax: 525 623 2395
Correo electrónico: opg@servidor.unam.mx
Bibliografía
1. Domjan, M. (1999). Principios de aprendizaje y conducta. International
Thomson Editores. México.
2. Reeve, J. (1999). Motivación y emoción. Mc Graw Hill. Madrid.
3. Berridge, K. C. (2004). Motivation concepts in behavioral neuroscience.
Physiology & Behavior 81: 179-209.
4. Cardinal, R. N., Everitt, B. J. (2004). Neural and psychological mecha-
nisms underlying appetitive learning: links to drug addiction. Current
Opinion in Neurobiology 14: 156-162.
5. Olds, J. (1956). Pleasure centers in the brain. Scientifi c American 195:
105-116.
6. Olds, J. (1958). Self-Stimulation of the Brain. Science 127: 315-324.
Fernández-Espejo, E. (2000). ¿Cómo funciona el nucleus accumbens? Re-
vista de Neurología 30: 845-849.
7. Berridge, K. C., Robinson, T. E. (1998). What is the role of dopamine: hedo-
nic impact, reward learning, or incentive salience? Brain Research Reviews
28: 309-369.
8. Dayan, P., Balleine, B. W. (2002). Reward, Motivation, and Reinforce-
ment Learning. Neuron 36: 285-298.
9. Salamote, J. D., Correa, M., Mingote, S. M., Weber, S. M. (2005). Beyond
the reward hipótesis: alternative functions of nucleus accumbens dopa-
mine. Current Opinion in Pharmacology 5: 34-41.
7
10. Cohen, J. D., Blum, J. I. (2002). Reward and Decision. Neuron 36: 193-
198.
11. Vetulani, J. (2001). Drug addiction. Part II. Neurobiology of Addiction.
Polish Journal of Pharmacology 53: 303-317.
12. Lorenzo, P., Laredo, J. M., Leza, J. C., Lizasoain, I. (2003). Drogodepen-
dencias. Médica Panamericana. Madrid.
Agradecimientos
Este trabajo fue realizado con el apoyo del donativo 42060 de Conacyt otor-
gado a Óscar Prospéro García.