ArticlePDF Available
1
El paraíso y el in erno en el cerebro:
el sistema de la recompensa
por Corinne J. Montes Rodríguez y
Oscar Prospéro García*
¿Por qué hacemos las cosas?
La palabra motivación se re ere a los procesos neurobiológicos que nos llevan
a realizar un trabajo con el n de obtener un reforzador. En otras disciplinas
médicas, como en la Psiquiatría, se le llama pulsión. En un lenguaje cotidiano,
signi ca “ganas de hacer las cosas”. La causa o razón para que se presente la
motivación es la potencial recompensa que el sujeto anticipa que va a obtener.
La toma de decisiones que nos lleva a seleccionar una conducta está matiza-
da por el valor recompensante que la meta o el objetivo establecido ofrece al
individuo y, a su vez, este valor recompensante depende de las necesidades
internas del organismo. Al despliegue de una conducta para cubrir una necesi-
dad se le llama conducta motivada y podemos inferir cuánta motivación tiene
un individuo a partir de la cantidad de trabajo que realiza para alcanzar su
objetivo. Con frecuencia estamos realizando conductas motivadas, orientadas
a obtener reforzadores que restituyen la constancia de nuestro medio inter-
no; comer, beber y otros reforzadores. Saciar el instinto de aprender es una
conducta con una poderosa dosis de motivación; todo mundo aprendemos
algo todos los días, como una ruta más corta para llegar al trabajo o mejores
maneras para obtener dinero. Adquirir conocimiento, alimento y dinero son
ejemplos de las consecuencias obtenidas por las conductas ejecutadas, y a
éstas se les llama reforzadores. Un reforzador será todo aquello que modi -
que la ocurrencia de una conducta. Así, el que aumenta la probabilidad de que
ocurra una conducta es un reforzador positivo; mientras que el que disminuye
la ocurrencia de una conducta es un reforzador negativo (1-3).
Ley del Efecto
A principios del siglo XX un psicólogo llamado E. L. Thorndike evaluaba la ca-
pacidad de resolución de problemas en animales. Para esto, colocaba a gatos
2
privados de alimento dentro de una jaula desde donde podían visualizar el ali-
mento que se encontraba fuera de ésta; los gatos tenían que salir de la jaula
para obtener el alimento (reforzador). El gato desplegaba una conducta de
escape con movimientos aleatorios, hasta que presionaba una palanca que le
permitía escapar de la jaula y obtener el reforzador. Conforme avanzaban los
ensayos el gato desarrollaba una estrategia para escapar y obtener el alimen-
to. La obtención del reforzador era más e ciente aumentado el número de re-
forzadores obtenidos en menos tiempo. Con base en esta observación, Thorn-
dike formuló la Ley del Efecto, la cual establece que la probabilidad de que una
conducta ocurra depende de sus consecuencias. Una consecuencia satisfacto-
ria (reforzador positivo) aumenta la ocurrencia de una conducta. Mientras que
una consecuencia no satisfactoria o incluso aversiva disminuye la ocurrencia
de una conducta. Así, desplegamos conductas con base en las consecuencias
obtenidas. El efecto hedónico que provee el reforzador una vez obtenido es lo
que se conoce como recompensa. Evidentemente, la magnitud de este efecto
hedónico depende del estado homeostático en que se encuentre el sujeto. Por
ejemplo, si un sujeto tiene hambre, entonces el valor recompensante del ali-
mento es mucho más alto que el que tendrá en un sujeto saciado (1-3).
Las conductas motivadas
Las conductas motivadas se realizan para la obtención de recompensas.
Para que se despliegue una conducta motivada el organismo debe presen-
tar un estado inicial de desbalance homeostático, por ejemplo hambre;
esta necesidad lleva al organismo a trabajar, v. gr. ir al supermercado para
conseguir alimento (reforzador positivo) y saciar su apetito (restituir el
balance homeostático: recompensa). Como se observa en el ejemplo, las
conductas motivadas están compuestas por dos fases: la fase apetitiva,
que se re ere a la conducta de aproximación que el organismo emite antes
de alcanzar la meta, y la fase de consumo, que se re ere a secuencias de
movimientos estereotipados que llevan a la meta (3,4).
Adicionalmente, como hemos señalado, las conductas motivadas son
reguladas por tres sistemas; el homeostático y el hedónico y el de estrés
o castigo.
El sistema homeostático se re ere a las señales periféricas del organismo,
como cambios en la concentración de hormonas, péptidos u otras sustancias
químicas que llegan al hipotálamo y que señalizan un desbalance del medio
interno. El termino homeostasis se re ere a la constancia del medio interno.
Por ejemplo, la sensación subjetiva de hambre es consecuencia del desbalance
energético por el que cursa nuestro organismo por momentos. Éste es detec-
tado por el hipotálamo, un conglomerado de núcleos cerebrales que recibe de
la periferia señales nerviosas o moleculares que nos dan la sensación subjetiva
de sed, hambre, deseo sexual y sueño, entre otras.
El sistema hedónico regula la sensación subjetiva de placer que genera la
obtención y/ o consumo del reforzador; es decir, la recompensa. Este sistema
esta integrado por varios núcleos cerebrales, que revisaremos adelante.
3
Al sistema de estrés o castigo lo modula preferentemente la amígdala, un
conglomerado de núcleos alojados en el interior del lóbulo temporal que está
encargado de modular la sensación subjetiva de miedo. Este sistema nos per-
mite evitar condiciones que pueden ser dañinas para nuestro organismo, des-
de comer un alimento descompuesto hasta evitar sitios potencialmente per-
misivos de asaltos o abusos que pongan en riesgo nuestra integridad física o
nuestra vida.
La ejecución de una conducta motivada está matizada por el desbalance
del medio interno que presenta el organismo y por el componente hedónico.
Así, una conducta muy motivada será aquella provocada por un desbalance
profundo del medio interno, v. gr. varias horas sin comer y un reforzador de
gran calidad, un platillo apetitoso, dietéticamente balanceado, y por lo que
el sujeto anticipa una recompensa de gran magnitud. También el reforzador
puede ser alejarse de un sitio d peligro, v. gr. alejarnos a toda velocidad de
un incendio, una explosión o un sujeto armado que nos amenaza.
El sistema de la recompensa
En 1954 James Olds y Peter Milner colocaron un electrodo de estimulación
eléctrica en el cerebro de una rata. El animal se encontraba dentro de una caja
donde tenia la opción de presionar una palanca y autoadministrarse pulsos
eléctricos. Olds y Milner observaron que la rata no dejaba de autoestimularse,
incluso en condiciones en las que llegaba a lastimarse las patas por la alta
cantidad de veces que presionaba la palanca. La rata podía apretar la palanca
desde 500 hasta 5000 veces en una hora, y, prefería la autoestimulación eléc-
trica que comer, beber o aparearse. Incluso, el animal era capaz de soportar
reforzadores negativos, como atravesar una malla electri cada, para llegar a
la palanca y autoestimularse. Con este experimento, los autores interpretaron
que habían localizado el centro del placer (5,6).
El sistema del placer
Ahora sabemos que Olds y Milner colocaron los electrodos de estimulación
en un grupo de bras que se originan en un núcleo del tallo cerebral llama-
do área ventral tegmental (VTA), estas bras llegan a otro núcleo localizado
en la parte basal y anterior del cerebro llamado núcleo accumbens (NAc).
El VTA contiene cuerpos neuronales que producen un neurotransmisor lla-
mado dopamina y lo envían hacia el NAc, donde hay dos tipos de receptores
a dopamina, el D1 y el D2. El primero es excitador y el segundo es inhibi-
dor. Cuando el VTA se activa libera dopamina, la cual activa los receptores
D1 facilitando la actividad del NAc. Tras un periodo el D2, que es inhibidor,
regresa al NAc al estado anterior a la excitación.
La activación del NAc por la liberación de dopamina del VTA ocurre ante la
presencia de reforzadores naturales (comida, agua y sexo) y arti ciales (dro-
gas de abuso), ante la presencia de un estímulo que anticipa la ocurrencia de
un reforzador y, por tanto, está generando o al menos regulando la expresión
de la fase apetitiva y de consumación de una conducta motivada (7-11).
4
Si alteramos el funcionamiento del sistema dopaminérgico en el NAc, por
el bloqueo de los receptores dopaminérgicos o por la destrucción de las bras
provenientes del VTA, los animales no son capaces de obtener reforzadores de-
bido a que no se presentan las conductas motivadas. Pareciera que al animal
no le importa comer o beber, a pesar de la disponibilidad de los reforzadores.
Es como si perdiera la capacidad de anticipar la recompensa que el reforzador
le proporcionará. Es por esto que se ha propuesto el NAc y la dopamina como
los elementos centrales del sistema de recompensa y de la generación de la
sensación subjetiva de placer ante la obtención de reforzadores (7-11).
El NAc recibe proyecciones del hipotálamo lateral (HL), la corteza prefrontal
(CPF), el tálamo dorsomedial (TDM), el hipocampo (HC) y por su puesto del VTA. El
accumbens a su vez envía proyecciones al VTA y al HL. Mientras que el VTA envía
y recibe proyecciones de la CPF y del HL. Estas estructuras forman el sistema de
la recompensa llamado también circuito límbico-motor. Obviamente un circui-
to de gran in uencia sobre éste que hemos descrito como el del placer, está
modulado por la amígdala. Si la amígdala señala que ese estímulo es dañino
para el organismo, será entonces categorizado como un reforzador negativo
y se generará una estrategia de evitación del mismo. Lo que también es alta-
mente recompensante.
Dentro del sistema de la recompensa la información visceral y endocri-
na es recibida por el HL, la activación del VTA ocurre ante la presencia de
reforzadores naturales, es decir, lo que están siendo consumidos para res-
tituir la constancia del medio interno, o arti ciales, los que se consumen
para obtener la sensación subjetiva de placer, sin que necesariamente es-
tén restituyendo la constancia del medio interno (v. gr. drogas de abuso).
Es interesante que estudios de imagenología realizados en humanos, han
mostrado que incluso un chiste que sea exitoso (provoca la risa del escu-
cha) hace que se active el sistema del placer. La información del contexto
es proporcionada por el HC, la planeación y la ejecución de la conducta de
consumo estará a cargo de la CPF y de los núcleos de la base involucrados
en la coordinación de movimientos. El NAc parece ser un integrador del
estado inicial de necesidad (desbalance homeostático), la ejecución de una
conducta motivada y la sensación subjetiva de placer ante la obtención y/o
consumo del reforzador.
Se ha propuesto al NAc como un detector de coincidencias entre el es-
tado motivacional (necesidad) de un organismo y el despliegue de una con-
ducta motivada (ejecución), de ahí que se le llame también interfase límbico-
motora (7-11).
El sistema de la recompensa y la conducta adictiva
La administración de varias drogas de abuso aumenta los niveles de dopa-
mina en el NAc tal como ocurre con los reforzadores naturales (agua, co-
mida, sexo). Se ha propuesto que las drogas de abuso ejercen sus efectos
reforzantes porque estimulan el sistema de recompensa, soslayando en
gran medida al sistema homeostático (8-13).
5
Los efectos reforzantes los podemos observar con diversas pruebas con-
ductuales como la preferencia de lugar condicionada y/o la autoadministra-
ción de drogas.
La prueba de preferencia de lugar condicionada consiste en colocar a
un animal en un aparato con dos compartimentos de características físi-
cas diferentes, por ejemplo, uno negro y otro blanco; uno liso y el otro
rugoso. Se administra una droga (v. gr. cocaína, anfetaminas, heroína)
al animal y se coloca en uno de los compartimentos, el sujeto asocia los
efectos de la droga con el compartimiento donde fue colocado. Obser-
vamos que cuando el sujeto puede elegir libremente en qué comparti-
miento permanecer, el sujeto pasa más tiempo en el lugar donde fue
administrada la droga. A esto se le denomina preferencia del lugar, con
lo que interpretamos que el sujeto asocia el lugar con los efectos refor-
zantes de la droga y, por tanto, permanece más tiempo ahí.
La autoadministración de drogas es otro paradigma para evaluar que tan
reforzante es una droga. Este paradigma, similar al de Olds y Milner, consiste
en entrenar a un animal a presionar una palanca para recibir una cantidad de
droga. Los animales aprenden rápidamente la tarea y pueden autorregular la
dosis que reciben, con el número de veces que presionen la palanca. Cuando
una droga es altamente reforzante, como la cocaína, el animal pre ere au-
toadministrársela a obtener otro tipo de reforzador, como alimento.
Es posible revertir los efectos reforzantes de las drogas con la admi-
nistración de fármacos que bloqueen los receptores dopaminérgicos o
lesionando las neuronas dopaminérgicas del sistema de la recompensa.
Además, se ha mostrado que el consumo crónico de mor na, cocaína o
alcohol disminuye la actividad normal del sistema de la recompensa. A
largo plazo se necesitan mayores cantidades de droga para estimular
este sistema y obtener la misma sensación de placer. Esta condición se
asocia con un efecto de tolerancia a los efectos de la droga y a la depen-
dencia a la misma (4,12,13).
Con base en estos datos, se ha sugerido que los efectos reforzantes de las
drogas ocurren gracias a la dopamina del sistema de la recompensa. Sin em-
bargo, la participación de otros neurotransmisores como las endor nas y las
marihuanas endógenas juegan un papel crucial en la conducta adictiva.
Consideraciones nales
Queremos concluir que la motivación es lo que nos lleva a ejecutar conductas,
desde las más básicas como la obtención de alimento o agua, hasta las más
complejas como disfrutar de un chiste, un buen libro o una obra de arte.
La motivación determina las decisiones que tomamos en la vida, como
la elección de una comida u otra, de un trabajo u otro, de ir a la escuela o
no hacerlo, de ser sexualmente el a la pareja o no. Todas nuestras deci-
siones están matizadas por las necesidades internas de nuestro organismo
y la calidad intrínseca de los posibles reforzadores que obtengamos y el
valor recompensante que les adjudiquemos. Sin este sistema moriríamos,
6
si lo alteramos tendremos una calidad de vida deplorable. Las drogas son
vehículos que conducen al placer cambiando la concepción adaptativa del
trabajo. En esta condición, el sentido de la motivación como la energía
para llevar a cabo un trabajo que en sí mismo pueda ser recompensante,
se pierde y a pesar de que no negaremos que un sujeto adicto, en el pe-
riodo de carencia, llevará a cabo un intenso trabajo para obtener la droga,
su trabajo no será adaptativo porque no lo llevará al orecimiento de sus
genes y de su territorio. El sistema de la recompensa es indispensable para
responder exitosamente a las demandas del medio y, por ende, para la so-
brevivencia de cualquier organismo.
Notas
* Grupo de Neurociencias, Departamento de Fisiología, Facultad de Medici-
na, Universidad Nacional Autónoma de México (UNAM).
Correspondencia:
Doctor Óscar Prospéro García
Departamento de Fisiología, Facultad de Medicina UNAM
Apartado postal 70-250
CP 04510 México, D. F.
México
Teléfono: 525 623 2509, Fax: 525 623 2395
Correo electrónico: opg@servidor.unam.mx
Bibliografía
1. Domjan, M. (1999). Principios de aprendizaje y conducta. International
Thomson Editores. México.
2. Reeve, J. (1999). Motivación y emoción. Mc Graw Hill. Madrid.
3. Berridge, K. C. (2004). Motivation concepts in behavioral neuroscience.
Physiology & Behavior 81: 179-209.
4. Cardinal, R. N., Everitt, B. J. (2004). Neural and psychological mecha-
nisms underlying appetitive learning: links to drug addiction. Current
Opinion in Neurobiology 14: 156-162.
5. Olds, J. (1956). Pleasure centers in the brain. Scienti c American 195:
105-116.
6. Olds, J. (1958). Self-Stimulation of the Brain. Science 127: 315-324.
Fernández-Espejo, E. (2000). ¿Cómo funciona el nucleus accumbens? Re-
vista de Neurología 30: 845-849.
7. Berridge, K. C., Robinson, T. E. (1998). What is the role of dopamine: hedo-
nic impact, reward learning, or incentive salience? Brain Research Reviews
28: 309-369.
8. Dayan, P., Balleine, B. W. (2002). Reward, Motivation, and Reinforce-
ment Learning. Neuron 36: 285-298.
9. Salamote, J. D., Correa, M., Mingote, S. M., Weber, S. M. (2005). Beyond
the reward hipótesis: alternative functions of nucleus accumbens dopa-
mine. Current Opinion in Pharmacology 5: 34-41.
7
10. Cohen, J. D., Blum, J. I. (2002). Reward and Decision. Neuron 36: 193-
198.
11. Vetulani, J. (2001). Drug addiction. Part II. Neurobiology of Addiction.
Polish Journal of Pharmacology 53: 303-317.
12. Lorenzo, P., Laredo, J. M., Leza, J. C., Lizasoain, I. (2003). Drogodepen-
dencias. Médica Panamericana. Madrid.
Agradecimientos
Este trabajo fue realizado con el apoyo del donativo 42060 de Conacyt otor-
gado a Óscar Prospéro García.
Article
Full-text available
Article
What roles do mesolimbic and neostriatal dopamine systems play in reward? Do they mediate the hedonic impact of rewarding stimuli? Do they mediate hedonic reward learning and associative prediction? Our review of the literature, together with results of a new study of residual reward capacity after dopamine depletion, indicates the answer to both questions is 'no'. Rather, dopamine systems may mediate the incentive salience of rewards, modulating their motivational value in a manner separable from hedonia and reward learning. In a study of the consequences of dopamine loss, rats were depleted of dopamine in the nucleus accumbens and neostriatum by up to 99% using 6-hydroxydopamine. In a series of experiments, we applied the 'taste reactivity' measure of affective reactions (gapes, etc.) to assess the capacity of dopamine-depleted rats for: 1) normal affect (hedonic and aversive reactions), 2) modulation of hedonic affect by associative learning (taste aversion conditioning), and 3) hedonic enhancement of affect by non-dopaminergic pharmacological manipulation of palatability (benzodiazepine administration). We found normal hedonic reaction patterns to sucrose vs. quinine, normal learning of new hedonic stimulus values (a change in palatability based on predictive relations), and normal pharmacological hedonic enhancement of palatability. We discuss these results in the context of hypotheses and data concerning the role of dopamine in reward. We review neurochemical, electrophysiological, and other behavioral evidence. We conclude that dopamine systems are not needed either to mediate the hedonic pleasure of reinforcers or to mediate predictive associations involved in hedonic reward learning. We conclude instead that dopamine may be more important to incentive salience attributions to the neural representations of reward-related stimuli. Incentive salience, we suggest, is a distinct component of motivation and reward. In other words, dopamine systems are necessary for 'wanting' incentives, but not for 'liking' them or for learning new 'likes' and 'dislikes'.
Article
My conclusions are these: (i) The cells which mediate primary rewarding effects are located in a midline system running from the midbrain through the hypothalamus and midline thalamus and into the subcortical and cortical groups of the rhinencephalon. (ii) The cell groups which mediate primary rewarding effects are different from those which mediate primary punishing effects. (iii) Despite this relative independence, there are, undoubtedly, relationships of mutual inhibition existing between these two systems. Rewards do, among other things, tend to reduce sensitivity to pain, and punishments do tend to reduce rewarding effects. (iv) These primary reward systems of the brain are subdivided into specific drive-reward subsystems mediating the specific drives such as hunger and sex. (v) Because there are also subsystems of this set of rewarding structures sensitive to different chemical effects, it is reasonable to hope that eventually it will be possible to control the reward systems pharmacologically in cases where behavior disorders seem to result from deficits or surfeits of positive motivation.
Article
What roles do mesolimbic and neostriatal dopamine systems play in reward? Do they mediate the hedonic impact of rewarding stimuli? Do they mediate hedonic reward learning and associative prediction? Our review of the literature, together with results of a new study of residual reward capacity after dopamine depletion, indicates the answer to both questions is `no'. Rather, dopamine systems may mediate the incentive salience of rewards, modulating their motivational value in a manner separable from hedonia and reward learning. In a study of the consequences of dopamine loss, rats were depleted of dopamine in the nucleus accumbens and neostriatum by up to 99% using 6-hydroxydopamine. In a series of experiments, we applied the `taste reactivity' measure of affective reactions (gapes, etc.) to assess the capacity of dopamine-depleted rats for: 1) normal affect (hedonic and aversive reactions), 2) modulation of hedonic affect by associative learning (taste aversion conditioning), and 3) hedonic enhancement of affect by non-dopaminergic pharmacological manipulation of palatability (benzodiazepine administration). We found normal hedonic reaction patterns to sucrose vs. quinine, normal learning of new hedonic stimulus values (a change in palatability based on predictive relations), and normal pharmacological hedonic enhancement of palatability. We discuss these results in the context of hypotheses and data concerning the role of dopamine in reward. We review neurochemical, electrophysiological, and other behavioral evidence. We conclude that dopamine systems are not needed either to mediate the hedonic pleasure of reinforcers or to mediate predictive associations involved in hedonic reward learning. We conclude instead that dopamine may be more important to incentive salience attributions to the neural representations of reward-related stimuli. Incentive salience, we suggest, is a distinct component of motivation and reward. In other words, dopamine systems are necessary for `wanting' incentives, but not for `liking' them or for learning new `likes' and `dislikes'.
Article
Traducción de: Understanding motivation and emotion
Article
The drug addiction may be regarded as the disease of the brain reward system. This system, closely related to the system of emotional arousal, is located predominantly in the limbic structures of the brain. Its existence was proved by demonstration of the "pleasure centers," that were discovered as location from which electrical self-stimulation is readily evoked. The main neurotransmitter involved in the reward is dopamine, but other monoamines and acetylcholine may also participate. The anatomical core of the reward system are dopaminergic neurons of the ventral tegmentum that project to the nucleus accumbens, amygdala, prefrontal cortex and other forebrain structures. Several of those structures may be specifically involved in the reward produced by different substances, when anticipating the reward. The recent discovery of CART peptides may importantly expand our knowledge about the neurochemistry of reward. Natural rewarding activities and artificial chemical rewarding stimuli act at the same locations, but while natural activities are controlled by feedback mechanisms that activate aversive centers, no such restrictions bind the responses to artificial stimuli. There are several groups of substances that activate the reward system and they may produce addiction, which in humans is a chronic, recurrent disease, characterized by absolute dominance of drug-seeking behavior. The craving induced by substances of addiction inhibits other behaviors. The adaptation of an organism to a chronic intake of drugs involves development of adaptive changes, sensitization or tolerance. It is thought that the gap between sensitization developing for the incentive value of the drug and tolerance to the reward induced by its consumption underlies the vicious circle of events leading to drug dependence. The vulnerability to addiction is dependent not only on the environment, but also on genetic factors.
Article
The last decade brought a considerable progress in pharmacotherapy of addiction. Basing on recently gained knowledge of mechanisms of development of addiction and the physiology of the brain reward system, several therapeutic strategies have evolved. The strategies aimed at targeting the basic mechanisms of addiction rely on the premises that addiction is caused by adaptive changes in the central nervous system and that craving, which is the main cause of relapse, depends on dopaminergic mechanisms and requires high general excitability. The pharmacological approach involves drugs that reduce neuronal adaptability by inhibiting the calcium entry to neurons both through voltage-gated channels (e.g. nimodipine) and NMDA receptors (e.g. memantine), and drugs that stimulate the inhibitory GABAergic system (gamma-vinyl-GABA, baclofen), Particular attention is paid to the compounds that may attenuate dopaminergic hyperactivity, without considerable suppression of tonic activity of dopaminergic neurons (e.g. BP 897, a partial dopamine D3 receptor antagonist). Specific strategies are aimed at interference with the action of particular drugs of addiction. An important group includes the agonistic therapies (known also as substitution or maintenance therapies) in which a long-acting agonist is used in order to reduce the action of the drugs of high addictive potential (e.g. methadone against heroin addiction or vanoxerine (GBR 12909) against psychostimulants). Other specific strategies aimed at reduction of the transport of molecules of addictive substances into the brain: the approaches involve preparation of antibodies that form complexes unable to cross blood-brain barrier or enzymes accelerating the metabolism of the compounds in the blood (e.g. variants of butyrylcholinesterase). A considerable progress has been made in combating the abuse of legal addictive substances, alcohol (naltrexone, acamprosate) and tobacco (bupropion). The prospects for developing effective pharmacotherapies against addiction are bright. Unfortunately, ideological and social implications, as well as the conflict of interest with illegal narcotic manufacturers and distributors, may considerably hamper the progress in combating addiction (e.g. difficulties in introduction of methadone).