Content uploaded by Guglielmo Tamburrini
Author content
All content in this area was uploaded by Guglielmo Tamburrini on Feb 12, 2018
Content may be subject to copyright.
1
Penultimate version of the book chapter appeared in :
Hosni H. (ed.), Menti e macchine. Alan Mathison Turing a cento anni
dalla nascita. Pisa, Edizioni della Normale, 2015, pp. 87-126.
Alan Turing e il programma di ricerca
dell’Intelligenza Artificiale
Roberto Cordeschi e Guglielmo Tamburrini
1. Dal test di Turing al programma di ricerca dell’IA
E’ riduttivo e per alcuni aspetti anche fuorviante incentrare sul cosiddetto “gioco dell’imitazione”,
noto anche come Test di Turing (TT), l’analisi dei contributi di Alan Turing alla nascita e allo
sviluppo iniziale dell’Intelligenza Artificiale (IA)
1
. Anzitutto, la funzione intesa del TT sembra
essere stata fin dall’inizio puramente divulgativa: Turing aveva l’obiettivo di raggiungere un ampio
pubblico di persone colte, alle quali trasmettere e illustrare la possibilità tecnologica di sviluppare
macchine capaci di elaborare strutture simboliche e di manifestare comportamenti intelligenti.
2
Inoltre, le regole proposte per la conduzione e il superamento del TT risultano essere molto vaghe,
senza peraltro soddisfare i requisiti di intersoggettività per la valutazione dei risultati di un test
empirico. E’ infine rilevante il dato di fatto che il TT non sia stato usato come benchmark o test
empirico per i sistemi concretamente sviluppati dall’IA. L’obiettivo di superare il TT—qualunque
cosa si intenda con ciò—è stato perseguito prevalentemente in manifestazioni socio-culturali, come
il Loebner Prize.
3
Ciononostante, è piuttosto diffusa la strategia di incentrare proprio intorno al TT
il discorso sul rapporto tra Turing e l’IA.
1
Come ormai è noto, Turing diede formulazioni del suo “test” diverse tra loro sotto molti aspetti. Stando a quella più
concisa, si tratta di riuscire a programmare una macchina (un calcolatore digitale general purpose) “che risponda alle
domande in un modo tale che sarà estremamente difficile indovinare se le risposte sono state date da un uomo o da una
macchina” (Turing 1951, trad. it. p. 24).
2
“L’articolo del 1950 non si proponeva tanto di dare un contributo profondo alla filosofia, quanto di fare della
propaganda. Turing riteneva che i tempi fossero maturi perché filosofi, matematici e scienziati prendessero sul serio
l’idea che i calcolatori non sono solo macchine per calcolare, ma entità capaci di esibire comportamenti che dobbiamo
considerare intelligenti. Cercò di diffondere questa convinzione e scrisse questo articolo – a differenza dei suoi articoli
matematici – rapidamente e prendendoci gusto. Lo ricordo mentre mi leggeva dei brani – sempre con un sorriso sulle
labbra, a volte trattenendo una risata. Alcuni commenti che ho avuto modo di leggere sovraccaricano questo articolo di
significati rispetto alle intenzioni iniziali” (Gandy 1996, p. 125).
3
Il Premio Loebner viene assegnato annualmente dal 1999 al programma per calcolatore che ottiene il punteggio
maggiore in una competizione ispirata al TT (si veda http://www.loebner.net/Prizef/loebner-prize.html).
2
In questo lavoro proponiamo una diversa strategia per analizzare le relazioni tra Turing e l’IA,
soprattutto in considerazione della sostanziale estraneità del TT allo svolgimento effettivo delle
ricerche condotte nell’ambito dell’IA. Ecco in breve che cosa ci proponiamo di fare: partendo da
una ricostruzione schematica dell’IA vista come un programma di ricerca, metteremo in evidenza i
contributi di carattere modellistico, epistemologico, metodologico e anche tecnologico che Turing
ha dato al suo sviluppo.
2. L’IA come programma di ricerca
L’analisi dell’IA come programma di ricerca che è proposta qui di seguito si colloca nel quadro di
una famiglia di analisi metodologiche e di modelli epistemologici della scienza che sono stati
sviluppati principalmente nel corso dell’ultimo cinquantennio. Una pietra miliare di questo percorso
è costituito dalla pubblicazione di The structure of scientific revolutions di Thomas S. Kuhn,
avvenuta nel 1962 (l’ultima edizione del cinquantenario è del 2012). Successivamente, Imre
Lakatos e Larry Laudan hanno elaborato altri modelli epistemologici dei programmi di ricerca
scientifica, che seguono per alcuni aspetti l’impostazione data da Kuhn, ma se ne distaccano
notevolmente per altri aspetti (Lakatos 1970; Laudan 1977). Secondo questi autori, un programma
di ricerca scientifico si sviluppa principalmente in funzione dei suoi successi e fallimenti, attraverso
l’interazione di vari processi asincroni. I principali processi asincroni che essi prendono in
considerazione sono da un lato lo sviluppo di quella che noi chiameremo la cornice del programma
di ricerca, cornice variamente analizzata e denominata dagli autori ricordati “paradigma”, “nucleo
duro” del programma o “tradizione di ricerca”, e dall’altro lato lo sviluppo del problem solving
svolto dai ricercatori all’interno della cornice, di volta in volta descritto come attività di
“risoluzione di rompicapo” o di costruzione di una “cintura protettiva” del nucleo duro, che si
concretizza principalmente nello sviluppo di modelli e teorie in base alle direttive generali incluse
nella cornice.
Ora quali sono i processi asincroni più rilevanti per analizzare l’IA come programma di ricerca?
Nel rispondere a questa domanda bisogna tenere conto preliminarmente del fatto che l’IA è un
programma di ricerca che presenta una forte dipendenza dallo sviluppo della tecnologia informatica,
nella sua duplice versione hardware e software. Questa dipendenza non si manifesta solo in quella
componente dell’IA che si occupa di sviluppare modelli teorici e prototipi di dispositivi informatici
o robotici da usare come strumenti che sostituiscono o coadiuvano gli esseri umani nello
svolgimento di funzioni percettive e cognitive, così come nello svolgimento di azioni basate sul
coordinamento senso-motorio mediato da processi cognitivi. Anche l’altra componente dell’IA,
quella più schiettamente teorica, perché indirizzata allo studio di principi che regolano il
3
comportamento intelligente nei sistemi biologici e nelle macchine o dei processi soggiacenti,
dipende in modo cruciale dallo sviluppo delle tecnologie informatiche.
In considerazione di ciò, al processo di sviluppo della tecnologia viene qui assegnato un ruolo
centrale nell’analisi dell’IA come programma di ricerca—un ruolo certamente più rilevante di
quello che lo sviluppo della tecnologia svolge in altri programmi di ricerca tradizionalmente oggetto
di studio nell’ambito della filosofia della scienza. Insieme a questo processo, prenderemo in
considerazione il processo di sviluppo della cornice e il processo di costruzione di modelli e di
prototipi funzionanti di dispositivi informatici o robotici.
La ricostruzione che qui proponiamo dell’IA come programma di ricerca tiene conto, come
vedremo più avanti, sia della componente teorica che della componente ingegneristica dell’IA.
Sotto questo aspetto, la nostra impostazione si distacca dai modelli proposti da Kuhn, Lakatos,
Laudan per i programmi di ricerca scientifici. Altre differenze emergeranno nel seguito, sia in
funzione del ruolo centrale che viene assegnato al processo di sviluppo della tecnologia sia di
caratteristiche specifiche che assumono nel contesto dell’IA gli altri due processi, di elaborazione
della cornice e di elaborazione di modelli.
Per cominciare, ecco una breve descrizione di ciascuno dei tre processi.
LA CORNICE. Questo processo riguarda l’elaborazione iniziale, i successivi rimaneggiamenti ed
eventualmente l’abbandono di un nucleo ristretto di assunzioni sulle entità e sui processi che
costituiscono il dominio di indagine, sui metodi di studio da adottare e sugli obiettivi di fondo da
conseguire. Chiamiamo cornice questo nucleo di assunzioni che viene elaborato e si evolve nel
corso della vita del programma di ricerca dell’IA: esso influenza lo sviluppo di specifici modelli,
teorie, programmi per calcolatore e macchinari, senza peraltro identificarsi con i particolari risultati
e prodotti sviluppati all’interno del programma di ricerca.
Nel caso dell’IA, come vedremo con qualche dettaglio nel paragrafo seguente, la tesi che sia
possibile ottenere comportamenti intelligenti anche in sistemi non biologici, e in particolare in
alcune tipologie di macchine, è un elemento chiave e relativamente stabile della cornice. Questa tesi
è neutrale rispetto a distinzioni più sottili tra vari modelli realizzati all’interno dell’IA, i quali
prendono, per esempio, la forma di programmi per calcolatore, di reti neurali o di artefatti robotici.
All’interno della cornice dell’IA possono dunque coesistere quelle che chiameremo linee di ricerca,
che si differenziano e magari risultano anche in opposizione tra loro, ma tuttavia conservano stretti
vincoli di parentela determinati da varie tesi e assunzioni condivise.
I vincoli di parentela tra diverse linee di ricerca sono riconducibili alla condivisione di un nucleo
di assunzioni generali che fanno parte della cornice del programma di ricerca. Consideriamo, per
esempio, la cosiddetta IA simbolica (generalmente riconducibile a simulazioni mediante programmi
per calcolatore di attività percettivo-cognitive) e il connessionismo (che simula tali attività mediante
4
reti neurali artificiali). Queste linee di ricerca si distinguono tra loro per alcune posizioni
contrastanti, spesso sottolineate in modo esasperato dagli stessi ricercatori. Ciononostante, le
assunzioni dalle quali si evince l’opposizione tra IA simbolica e connessionismo non mettono in
discussione gli obiettivi ultimi dell’IA, collocandosi perciò a un livello inferiore di generalità
rispetto ad altre assunzioni, parimenti condivise dall’IA simbolica, dal connessionismo e da altre
linee di ricerca dell’IA. Per esempio, la tesi di fondo che abbiamo appena richiamato—e cioè che
sia possibile ottenere comportamenti intelligenti anche in sistemi non biologici e in particolare in
alcune tipologie di macchine—sussume le tesi meno generali dell’IA simbolica e del
connessionismo, le quali riguardano i modi più opportuni di arrivare a questo obiettivo generale. IA
simbolica e connessionismo non confliggono in merito al che cosa ma piuttosto in merito al come,
alle metodologie e alle tecniche più appropriate per conseguire gli obiettivi generali dell’IA. Per
questo motivo, è conveniente considerare IA simbolica e connessionismo come linee di ricerca
interne al programma di ricerca dell’IA.
Vi è una relazione dinamica tra le varie linee di ricerca interne al programma di ricerca dell’IA,
le quali ereditano le assunzioni più generali della cornice, pur distinguendosi tra loro per assunzioni
meno generali che determinano eventuali divergenze e conflitti reciproci. In particolare, è accaduto
che i conflitti iniziali tra linee di ricerca abbiano infine dato luogo, attraverso processi di confluenza
e ibridazione, ad altre linee di ricerca interne all’IA. Il caso appena menzionato del conflitto tra IA
simbolica e connessionismo è esemplare in proposito: dopo un primo momento, il conflitto è stato
successivamente ricomposto dando luogo ad alcune linee di ricerca dell’IA che avevano lo scopo di
realizzare sistemi computazionali variamente ibridi simbolico-connessionisti (su questo torneremo
nel paragrafo 4).
L’ibridazione tra linee di ricerca interne all’IA è una caratteristica diffusa del processo di
rielaborazione o rimaneggiamento degli obiettivi e dei metodi dell’IA, che sembra avere avuto
maggiore incidenza in questo programma di ricerca piuttosto che in altri, come la fisica, ed è forse
paragonabile a quanto è avvenuto invece, sia pure in forme diverse e con diverso peso, nelle scienze
biologiche (v. Mayr 1982) o psicologiche (v. Mecacci 1992).
Ma quali sono le tesi di fondo che caratterizzano la cornice generale del programma di ricerca
dell’IA? La risposta che forniamo a questa domanda, come vedremo nel paragrafo seguente, si
articola attraverso la formulazione di cinque tesi, le quali colgono degli impegni di fondo o
commitment ontologici e metodologici dei ricercatori dell’IA, ispirando fin dall’inizio il lavoro
scientifico e tecnologico sulle macchine intelligenti. Ciò non significa che la cornice sia rimasta
immutata nel tempo. Proprio per il loro carattere generale, i concetti chiave che appaiono nelle
cinque tesi sono stati più volte reinterpretati e specificati all’interno di diverse linee di ricerca. In
particolare, nel corso dello sviluppo storico del programma di ricerca dell’IA e nell’ambito delle
5
varie linee di ricerca dell’IA, a ciascuna di queste tesi è stato dato un peso diverso e ciascuna è stata
oggetto di nuove articolazioni in concomitanza con le fasi di progresso e di stagnazione alle quali è
andato incontro il programma di ricerca.
4
LA MODELLISTICA. Il secondo processo si dispiega nell’attività di risoluzione di rompicapo o,
come abbiamo detto, di problem solving svolta dai ricercatori dell’IA. Questa attività ha come
obiettivo principale lo sviluppo—all’interno della cornice generale e in relazione a varie capacità
percettive, di ragionamento, di controllo dell’azione e così via—di modelli costruttivi e di prototipi
di dispositivi ingegneristici in grado di manifestare tali capacità, ma anche di modelli teorici
genuinamente esplicativi del comportamento intelligente degli organismi. Questa pluralità di
obiettivi riflette la distinzione sopra richiamata delle due componenti—teorica e ingegneristica—
dell’IA, che ne caratterizza da sempre il suo programma di ricerca fino ad oggi (si pensi alla
biorobotica attuale, nella duplice versione teorica e ingegneristica secondo la descrizione data per
esempio da Lambrinos et al. 2000).
In particolare, la valutazione epistemologica dell’attività modellistica svolta all’interno della
cornice richiede che si individuino i risultati durevoli del programma di ricerca, che si valutino
comparativamente i vari modelli prodotti dall’IA in riferimento a determinati comportamenti
intelligenti e, sul lungo periodo, che si identifichino fasi di progresso, stagnazione o regresso del
programma di ricerca.
Affrontare queste varie problematiche metodologiche è cruciale per elaborare criteri di
razionalità interna per il programma di ricerca—vale a dire, criteri che consentano di valutare
razionalmente lo stato di avanzamento del programma di ricerca e di prendere decisioni ponderate
in merito a varie questioni. I criteri di razionalità interna servono a prendere decisioni in merito a
una rinnovata adesione alla cornice in funzione di una valutazione positiva dei risultati ottenuti dai
ricercatori grazie alla loro attività di problem solving, in merito a un suo rimaneggiamento alla luce
di ricorrenti insuccessi nello sviluppo di modelli adeguati del comportamento intelligente, o anche
in merito al definitivo abbandono di certe linee di ricerca. In questo contesto risulta particolarmente
evidente l’inadeguatezza del TT come strumento per rispondere a queste fondamentali esigenze
metodologiche del programma di ricerca dell’IA.
LA TECNOLOGIA. Il terzo processo riguarda lo sviluppo, da parte dei ricercatori che lavorano al
programma di ricerca dell’IA, di tecnologie hardware e software di supporto alle loro attività di
problem solving. Molti pionieri dell’IA, come lo stesso Turing, hanno contribuito allo sviluppo di
nuove tecnologie hardware o software per l’IA. Lo sviluppo delle tecnologie informatiche ha dato
4
E’ evidente che, in generale, l’individuazione di posizioni di fondo condivise e rielaborate nel tempo da ricercatori che
perseguono approcci anche molto diversi tra loro comporta un processo di astrazione rispetto alle posizione e alle tesi
concretamente sviluppate da singoli ricercatori nell’ambito dell’IA. Ma è proprio questo distacco che consente di
attingere a un punto di osservazione più generale sulle dinamiche di lungo periodo dell’IA.
6
impulsi importanti al programma di ricerca dell’IA, consentendo talvolta di superare fasi di
stagnazione, di introdurre ex novo oppure di riprendere con nuovo slancio alcune linee di ricerca
interne all’IA. Dalla prospettiva dello sviluppo di tecnologie di supporto, un caso di studio
esemplare riguarda il succedersi di fasi di progresso e di stagnazione nelle indagini sulle reti neurali
e sul connessionismo tra gli anni cinquanta e gli anni ottanta del secolo scorso. Su questo caso di
studio torneremo più avanti (v. il paragrafo 4).
E’ opportuno tenere conto del flusso bidirezionale di nuove tecnologie informatiche o robotiche
da altri settori di ricerca verso l’IA e, nell’altro senso, dall’IA verso altri settori dell’informatica o
della robotica. I modelli dell’IA non sempre forniscono soluzioni soddisfacenti a problemi
modellistici sollevati dall’interno del programma di ricerca. Nondimeno, modelli che risultano
carenti dal punto di vista della razionalità interna al programma di ricerca, cioè di criteri valutativi
che premiano il conseguimento di obiettivi propri del programma di ricerca, possono portare allo
sviluppo di tecnologie e strumenti informatici che si rivelano utili in altri settori dell’informatica e
delle tecnologie dell’informazione. Anche questi risultati possono essere valutati positivamente, ma
in base a criteri di razionalità che non sono strettamente inerenti al programma di ricerca dell’IA.
Per esempio, varie tecniche e sistemi software per la rappresentazione e l’elaborazione della
conoscenza, sviluppati all’interno dell’IA, sono stati esportati con successo verso settori piuttosto
distanti dell’informatica e delle tecnologie dell’informazione. Esportazioni di successo forniscono
motivi rilevanti, seppure basati solo su criteri di razionalità esterna, per la sopravvivenza della
cornice e, più in generale, del programma di ricerca dell’IA.
Nel paragrafo seguente esamineremo più in dettaglio ciascuno di questi tre processi, prestando
maggiore attenzione al primo, cioè alla cornice del programma di ricerca dell’IA, ed evidenziando il
contributo che Turing ha dato alla sua rielaborazione. Ci soffermeremo più rapidamente sugli altri
due processi, essendo più noto il ruolo da Turing svolto in ambito modellistico e tecnologico.
Discuteremo poi nel paragrafo 4 il ruolo della modellistica e della tecnologia nello sviluppo dell’IA
dopo Turing, attraverso l’esame di un caso di studio che riguarda due linee di ricerca dell’IA alle
quali abbiamo accennato sopra, quella simbolica e quella subsimbolica o connessionista. Questo ci
permetterà anche di esemplificare i processi di ibridazione tra linee di ricerca all’interno della
cornice dell’IA. Vedremo infine nel paragrafo 5 come la nostra ricostruzione del programma di
ricerca dell’IA presenti punti di accordo, ma anche significativi punti di disaccordo, con altre
ricostruzioni razionali del progresso scientifico proposte dai filosofi della scienza sopra ricordati
con riferimento ad altre discipline.
3. Il contributo di Turing all’IA: la cornice, i modelli, la tecnologia
7
Le cinque tesi che contribuiscono a delineare caratteristiche centrali—diremmo le più trincerate—di
quella che abbiamo chiamato la cornice dell’IA emergono da una considerazione di processi di
lungo periodo nello sviluppo dell’IA. Sia pure brevemente, vogliamo (i) mostrare come il nucleo
portante di tale cornice si era già sviluppato ai tempi di Turing, (ii) sintetizzare quale sia stato il
contributo di Turing alla sua rielaborazione, e (iii) illustrare come questo contributo sia stato in
seguito ripreso e ulteriormente rielaborato dai ricercatori dell’IA. Seguendo questo percorso,
vedremo anche come le varie linee di ricerca all’interno dell’IA hanno condiviso le cinque tesi della
cornice, pur differenziandosi reciprocamente in funzione della diversa rilevanza conferita a ciascuna
di esse o in funzione di diverse interpretazioni dei concetti chiave usati nella loro formulazione.
Prendendo dunque in considerazione il dibattito intorno alle cinque tesi, si possono individuare
distintamente punti di contatto o di divergenza tra le varie linee di ricerca dell’IA.
Ecco dunque le cinque tesi, in una forma schematica che intende riflettere lo stato della
discussione intorno alle macchine intelligenti già al tempo di Turing:
1. Funzionalismo. I processi alla base dell’adattatività, dell’apprendimento e
dell’intelligenza possono essere studiati prescindendo dalle caratteristiche specifiche
della struttura organica dei sistemi biologici. Sono infatti le caratteristiche
dell’organizzazione funzionale dei sistemi che contano. Tali processi possono
svilupparsi in supporti materiali diversi, anche in alcune tipologie di macchine,
purché i supporti materiali prescelti siano in grado di istanziare l’organizzazione
funzionale richiesta.
2. Metodo sintetico. Le ipotesi funzionaliste sui processi alla base dell’adattatività,
dell’apprendimento e del comportamento intelligente possono essere controllate
empiricamente costruendo artefatti dotati di quella stessa organizzazione funzionale
e osservandone il comportamento in condizioni sperimentali opportune. Questa
impostazione metodologica può mirare, attraverso la costruzione di artefatti, a
fornire prove di sufficienza—cioè prove della possibilità tecnologica di sviluppare o
replicare comportamenti adattativi e intelligenti in un artefatto (chiamiamo questa la
forma “debole” del metodo sintetico). Ma nel contesto di ricerche sul
comportamento adattativo e intelligente di sistemi biologici, dalle prove di
sufficienza si può arrivare fino allo sviluppo di modelli simulativi ed esplicativi dei
processi soggiacenti al comportamento (chiamiamo questa la forma “forte” del
metodo sintetico).
3. Uniformità del metodo. L’applicazione del metodo sintetico—da adottarsi
inizialmente per studiare i processi dell’adattamento, dell’apprendimento, del
8
ragionamento, della deliberazione e della pianificazione—può essere estesa con
successo anche allo studio di processi mentali che tradizionalmente sono ritenuti
sfuggire all’analisi scientifica, come i processi che sostengono la creatività,
l’intuizione, l’intenzionalità e la coscienza.
4. Rappresentazionalismo. La capacità di elaborazione simbolica e di rappresentazione
del mondo mediante strutture simboliche è richiesta per conseguire un’ampia gamma
di comportamenti adattativi e intelligenti.
5. Agentività. Sono applicabili fruttuosamente anche a vari tipi di macchine le ipotesi di
razionalità e scopo che un osservatore adotta generalmente per spiegare e prevedere
il comportamento di esseri umani e di altri sistemi biologici.
In questa formulazione schematica, le cinque tesi sono un’astrazione rispetto al concreto
svolgimento del dibattito tra i ricercatori dell’IA sull’identificazione di un nucleo del programma di
ricerca. Le cinque tesi costituiscono quasi un minimo comune denominatore delle diverse linee di
ricerca formulate nel corso dello sviluppo dell’IA. A ben vedere, le loro origini possono essere
rintracciate in un’era precedente l’affermarsi della stessa cibernetica, dunque ben prima dell’IA
(Cordeschi 2002).
Si noti che le cinque tesi possono essere utili anche per chiarire le differenze tra quelle che
abbiamo richiamato sopra (v. paragrafo 2) come le diverse componenti dell’IA, quella
ingegneristica e quella teorica. In particolare, quest’ultima componente, nella sua variante
modellistica o simulativa (originata dalla Information Processing Psychology di Allen Newell e
Herbert Simon, poi confluita nella Scienza Cognitiva), è interessata a quella che abbiamo definito la
forma “forte” della tesi 2 del Metodo sintetico. La variante non simulativa dell’IA teorica, invece,
interessata piuttosto alla formulazione di principi generali dell’intelligenza comuni a organismi e
macchine (quella originata, tra le altre, dalle ricerche di John McCarthy sulla rappresentazione della
conoscenza), aderisce alla versione che abbiamo detto “debole” della tesi 2 del Metodo sintetico,
ovvero alla semplice prova di sufficienza. Anche la componente ingegneristica dell’IA è interessata
solo a una versione “debole” della tesi 2 ma, a differenza dell’IA teorica non simulativa, è anche
neutrale rispetto alla tesi 3 dell’Uniformità del metodo.
Venendo a Turing, il suo contributo allo sviluppo della cornice si colloca in questo contesto di
proposte allora innovative per lo studio del comportamento intelligente.
Così la tesi 1 del Funzionalismo è stata esplicitamente avanzata—rivendicando sia la centralità
dell’organizzazione funzionale dei sistemi che della sua realizzabilità multipla in macchine—
allorché è avvenuta quella che possiamo chiamare “la scoperta dell’artificiale”, e cioè nel momento
in cui si è pensato alle macchine come ad artefatti in grado di adattarsi alle condizioni mutevoli
9
dell’ambiente, di apprendere in base all’esperienza e di rielaborare in modo flessibile le strategie
per il conseguimento di determinati obiettivi (Cordeschi 2002). Solo alcune tipologie di macchine
parvero soddisfare questi requisiti, diventando così confrontabili sotto questi aspetti con i sistemi
biologici. Come si esprimeva lo psicologo Clark Hull più di un quarto di secolo prima della nascita
ufficiale dell’IA, a proposito di quello che egli chiamerà l’“approccio del robot” (ovvero lo studio
del comportamento degli organismi viventi attraverso la costruzione di artefatti, quello che vedremo
essere il “metodo sintetico”), “l’obiettivo è la costruzione di artefatti […] che svolgano le funzioni
essenziali dell’apprendimento. […] Apprendimento e pensiero non sono considerati da noi come
funzioni esclusive di un organismo più di quanto non lo sia il volo” (Hull e Baernstein 1929, p. 14).
Richiamandosi all’approccio di Hull, Thomas Ross (che William Ross Ashby e William Grey
Walter consideravano un precursore della robotica cibernetica) elaborava questa idea nei termini di
quello che possiamo chiamare il funzionalismo delle macchine, per il quale “vari meccanismi
alternativi, molto diversi nelle caratteristiche superficiali e nelle forme dell'energia utilizzata,
possono produrre lo stesso risultato finale” (Ross 1938, p . 185 ). E’ un’idea, questa, che si ritrova
più tardi nella tesi di Norbert Wiener e di altri cibernetici, per i quali i “nuovi” automi (quelli, in
breve, dotati di sistemi di controllo basati sulla retroazione negativa) “possono essere trattati in
un’unica teoria insieme con i meccanismi della fisiologia” (Wiener 1948, trad. it. p. 71).
Un ampliamento straordinario della classe di automi studiata dai cibernetici si ebbe con
l’introduzione dei primi calcolatori digitali general purpose costruiti dopo la fine della Seconda
guerra mondiale. Sono le capacità di elaborazione simbolica di questi dispositivi che estendono
radicalmente le capacità di adattarsi, apprendere e mostrare comportamenti diretti a uno scopo delle
macchine cibernetiche a retroazione negativa. Turing esplora i confini di questo nuovo orizzonte
con l’ausilio di un formidabile cannocchiale teorico, quello delle macchine universali, modelli
astratti dei calcolatori general purpose, che gli consentono di guardare ben oltre i limiti tecnologici
dei primi esemplari di calcolatore.
Come è noto, si deve a Turing la scoperta e l’analisi teorica delle macchine universali (Turing
1936-37; si veda il contributo di Gabriele Lolli in questo volume). Una macchina universale è in
grado di interpretare ed eseguire un numero potenzialmente infinito di programmi diversi. E nel
loro insieme, secondo un’ipotesi di fondo dell’informatica teorica nota come tesi di Church-Turing,
questi programmi consentono di calcolare tutte le funzioni calcolabili mediante un algoritmo. Una
macchina universale è un modello idealizzato dei calcolatori digitali general purpose concretamente
costruibili: questi ultimi sono soggetti a limitazioni di memoria e di tempo di calcolo che non si
applicano alle macchine universali, ma delle macchine universali conservano, a differenza di altri
10
automi, la capacità di interpretare ed eseguire le istruzioni scritte in un linguaggio di
programmazione universale (come, per esempio, il linguaggio C o il Java).
5
Turing sposa l’approccio funzionalista della tesi 1 in relazione ai calcolatori general purpose,
quando egli afferma che le differenze fisiche tra i processi che si svolgono in questi sistemi (per
esempio di carattere meccanico o elettrico) e quelli che si svolgono nel sistema nervoso non sono da
considerarsi rilevanti: “dovremmo piuttosto interessarci delle analogie matematiche di
funzionamento” (Turing 1950, trad. it. p. 173). Ma Turing procede a rielaborare profondamente la
formulazione cibernetica della tesi 1, sostenendo che, ai fini della costruzione di macchine capaci di
esibire comportamenti intelligenti, è opportuno concentrarsi sui calcolatori general purpose. A
partire da questi, egli conclude, “è possibile costruire meccanismi per imitare qualsiasi parte
limitata dell’uomo” (Turing 1948, trad. it. p. 102). Turing inoltre evidenzia le nuove fonti
dell’adattatività dei calcolatori general purpose, sia in quanto macchine programmabili, capaci di
interpretare ed eseguire un qualsiasi programma scritto in un linguaggio di programmazione
universale, sia, come vedremo in seguito, in quanto macchine capaci di apprendere modificando i
propri programmi in base a meccanismi di ricompensa e punizione.
Certo è l’IA simbolica la linea di ricerca che eredita la forma di funzionalismo propugnata da
Turing, mettendo a frutto la programmabilità dei calcolatori e dando impulso agli studi
sull’apprendimento automatico nei calcolatori.
6
Ma le modifiche e le specificazioni della tesi 1 nella
storia dell’IA non si fermano certo a Turing e all’IA simbolica. La tesi 1 è stata modificata e
arricchita in seguito, per esempio dalla cosiddetta “nuova IA” che, facendo propria la tesi della
comune organizzazione funzionale organismi-macchine, ne ha esteso la portata ai meccanismi che
consentono la vita e l’evoluzione degli sistemi viventi. Di nuovo, anche in questo ambito il tipo di
struttura materiale non è ritenuto direttamente rilevante alla comprensione del fenomeno indagato
(può trattarsi di componenti organici o inorganici). Per esempio, come sostiene Cristopher Langton,
“la tesi centrale [della Vita Artificiale] è che un insieme opportunamente organizzato di primitive
artificiali che svolgono lo stesso ruolo funzionale delle molecole biologiche nei sistemi viventi
naturali fornisce un supporto adeguato per un processo che risulta “vivente” nello stesso senso in
cui lo sono gli organismi naturali” (Langton 1989, p. 33).
E’ evidente che l’approccio funzionalista (tesi 1) è intrinsecamente connesso al metodo
sintetico (tesi 2), sia per ciò che abbiamo chiamato prove di sufficienza sia per lo sviluppo di
modelli del comportamento adattativo e intelligente dei sistemi biologici. Per quanto riguarda il
5
Diciamo universale un linguaggio di programmazione i cui programmi consentono di calcolare ogni funzione
calcolabile da una macchina di Turing. Per un’analisi della tesi di Church-Turing e delle sue implicazioni per l’IA e la
scienza cognitiva, si veda Tamburrini (2002). Sulle relazioni tra le nozioni di interpretazione, universalità,
programmabilità e virtualità dei calcolatori, si veda Trautteur e Tamburrini (2007).
6
Questi ultimi sfoceranno, all’inizio degli anni ottanta del secolo scorso, nella nascita di quel settore di indagine noto
come machine learning.
11
primo aspetto, come aveva precisato Thomas Ross nel presentare quello che chiamava
esplicitamente il “metodo sintetico”, “per trovare le condizioni di sufficienza dell'apprendimento
dovremmo cercare di costruire una macchina che apprende” (Ross 1938, p. 185, corsivo nostro). Per
quanto riguarda il secondo aspetto, ancora Ross sosteneva la possibilità di “controllare (to test) le
diverse ipotesi psicologiche sulla natura del pensiero costruendo macchine ispirate ai principi che
implicano tali ipotesi, e confrontando il comportamento delle macchine con quello delle creature
intelligenti.” (Ross 1935, p. 185). In effetti, in questa proposta ritroviamo il nucleo della
metodologia simulativa poi sviluppata da alcune linee di ricerca dell’IA nell’intero arco del suo
sviluppo, la quale consiste, molto schematicamente, di tre fasi. Anzitutto si costruisce un artefatto
(programma per calcolatore, sistema robotico) come istanza di un modello teorico
dell’organizzazione funzionale di un sistema biologico. Successivamente si confrontano le
prestazioni dell’artefatto con quelle dell’organismo in situazioni sperimentali ben determinate.
Infine, si valutano i risultati dell’esperimento al fine di corroborare o di evidenziare limitazioni del
modello teorico di partenza.
Questo schema metodologico ispira un percorso interno al programma di ricerca dell’IA che
porta dalla già ricordata Information Processing Psychology di Newell e Simon fino ad alcune linee
di ricerca interne alla più recente robotica behavior-based, per la quale “il metodo sintetico propone
teorie relative a un sistema [naturale] tentando di costruire un sistema artificiale che esibisca le
stesse capacità di quello naturale. […] Nel metodo sintetico il controllo (test) della teoria si basa sul
confronto tra il sistema artificiale e la realtà” (Steels 1995, p. 92).
Lo schema metodologico riproposto da Luc Steels nell’ambito della robotica behavior-based
porta ancora una volta in primo piano il complesso problema della natura dei vincoli (constraint) da
imporre al programma o al sistema robotico perché questo possa aspirare a diventare un’adeguata
piattaforma sperimentale per il controllo di un modello teorico dei processi che sottendono il
comportamento intelligente di un qualche sistema biologico. Non possiamo esaminare qui nei
dettagli tale problema che abbiamo approfondito altrove (v. Cordeschi 2002, cap. 7, Tamburrini e
Datteri 2005, Datteri e Tamburrini 2007), se non per dire che i vincoli da imporre sull’artefatto
possono essere di natura molto diversa, a seconda del genere di ipotesi e di modelli teorici che il
ricercatore decide di prendere in considerazione e mettere alla prova con il metodo sintetico (vincoli
psicologici come nel caso di Ross, vincoli derivanti da modelli strutturali o funzionali del sistema
nervoso, vincoli comportamentali o anche vincoli evolutivi come nel caso della robotica behavior-
based o di quella evoluzionista).
7
7
Per esempio, il test di sufficienza è stato considerato solo il “passo iniziale” (Paige e Simon 1966) di una metodologia
che riteneva indispensabili vincoli più esigenti al fine di assicurare la plausibilità o il grado di realismo dei modelli
simulativi a un certo livello di “grana”, per riprendere l’espressione di Pylyshyn (1984).
12
Da parte sua Turing, nel considerare lo sviluppo di vari programmi simulativi (per il gioco degli
scacchi, ad esempio), riteneva vincoli rilevanti varie forme di plasticità dei calcolatori, a cominciare
dalla capacità di apprendere e alla programmabilità, per la quale “non è necessario progettare varie
macchine differenti per compiere processi differenti di calcolo.” (Turing 1950, trad it. p. 175). Il
requisito della eseguibilità di istruzioni di un linguaggio universale mutuato dalla macchina
universale di Turing è stato considerato da Newell (1990) come il primo vincolo di un Physical
Symbol System e successivamente di architetture cognitive come SOAR, dove, accanto al vincolo
dell’universalità, se ne considerano altri, diretti a garantire la plausibilità psicologica dei modelli
simulativi.
La tesi 3 dell’Uniformità del metodo riprende e specializza all’IA il nucleo dell’approccio
naturalistico allo studio della mente nel suo complesso, secondo il quale non esistono caratteristiche
e processi mentali, come l’intuizione, la coscienza, l’intenzionalità e la creatività, che in linea di
principio non possano essere spiegati ricorrendo alle ordinarie procedure della ricerca scientifica.
Nel contesto della cornice dell’IA, la richiesta di uniformità comporta la possibilità di estendere il
metodo funzionalistico e sintetico dallo studio dei processi cognitivi del problem solving, della
pianificazione o della percezione fino allo studio dei processi sui quali si basano l’intenzionalità, la
creatività e la coscienza.
Al tempo delle dispute sollevate da biologi e psicologi vitalisti (che oggi ci appaiono
inevitabilmente datate), Hull doveva preoccuparsi di dimostrare come il suo “approccio del robot”
riuscisse a catturare, almeno in prospettiva, caratteristiche complesse della cognizione (degli
animali sia umani che non umani) come l’insight, quando premetteva che il suo obiettivo era quello
di “riuscire a dare una deduzione dell’insight in modo tale che un bravo ingegnere potrebbe
realizzarlo in un meccanismo non vivente o inorganico” (Hull, 1935, p. 231). Si tratta in generale di
un obiettivo che era condiviso, in modo non dogmatico, e cioè fino a prova contraria, dai fondatori
della cibernetica. Essi infatti osservavano: “Se paragoniamo ancora organismi viventi e macchine
arriviamo a queste conclusioni: i metodi di studio per i due gruppi sono oggi simili. Se saranno
sempre gli stessi oppure no dipenderà dalla presenza o no di una o più caratteristiche
qualitativamente distintive e tipiche di un gruppo e non di un altro” (Rosenblueth, Wiener e
Bigelow 1943, trad. it. p. 83).
Certe ipotetiche “caratteristiche qualitativamente distintive” dei sistemi biologici erano state
indicate a proposito delle nuove macchine sotto forma di quelle “incapacità varie”, come la
creatività e la coscienza, di cui parlava Turing quando discuteva e cercava di confutare le “opinioni
contrarie a proposito dell’argomento principale [circa l’intelligenza dei calcolatori]” nel suo articolo
13
del 1950.
8
Turing sostiene la tesi 3, in relazione alla creatività e alla coscienza, adottando una
strategia di difesa piuttosto che di elaborazione di proposte costruttive per affrontare i problemi
della creatività e della coscienza. Rifacendoci alla terminologia di Lakatos, potremmo collocare la
strategia di Turing nell’ambito dell’euristica negativa piuttosto che dell’euristica positiva di un
programma di ricerca scientifico. Infatti, senza portare argomenti a favore della tesi 3, egli cerca di
minare le posizioni contrarie e gli argomenti offerti a loro sostegno. La conclusione di Turing
faceva emergere il paradosso “delle sfoglie della cipolla”:
Considerando le funzioni mentali o cerebrali troviamo certe operazioni che possiamo spiegare in termini
puramente meccanici. Questo, diciamo, non corrisponde alla mente come essa è in realtà: è una specie di sfoglia che
dobbiamo togliere se vogliamo trovare la mente reale. Ma poi in ciò che rimane troviamo un’altra sfoglia da togliere, e
così via. Procedendo in questo modo arriviamo alla mente ‘reale’ o solo a un’altra sfoglia? (Turing 1950, trad. it. p.
188).
Si consideri la questione della creatività delle macchine: potremmo magari concludere che
l’ordinaria attività di problem solving è una caratteristica sondabile con gli strumenti dell’IA, e
dunque spiegabile “in termini puramente meccanici” (ovvero automatizzabile), ma che dire
dell’“altra sfoglia”, e cioè dell’insight e del problem solving creativo? E’ in questo, nella creatività,
che consiste la vera intelligenza, la “mente ‘reale’”, che come tale sfugge a quegli strumenti, o è pur
sempre la creatività una forma, per quanto complessa, di problem solving riproducibile mediante
opportuni programmi simulativi, come sosteneva Simon (1973) contro Popper, e dunque
automatizzabile a sua volta? E in questo caso, qual è la successiva “sfoglia”?
Nella paradossale conclusione di Turing si potrebbe riassumere quella che Vittorio Somenzi
ricordava come l’obiezione “sleale”, menzionata ai tempi della prima IA da Paul Armer, la quale di
volta in volta sposta la definizione di intelligenza “in modo che non rientrino più in essa i fenomeni
dei quali abbiamo ottenuto una spiegazione soddisfacente o addirittura la ripetizione da parte di
meccanismi da noi costruiti” (Somenzi 1968, p. 231). In questo senso, paradossalmente, “l’IA è
tutto ciò che non è ancora stato fatto” (Hofstadter 1979, trad. it. p. 649). Turing aveva sviluppato
una riflessione simile nel paragrafo finale del suo articolo del 1948, significativamente intitolato
“L’intelligenza come concetto emotivo”. Egli osservava che la classificazione pre-teorica di un
comportamento come intelligente viene rivista una volta che i meccanismi soggiacenti siano stati
svelati, e che il comportamento stesso divenga prevedibile e spiegabile su questa base:
Quanto siamo disposti a considerare intelligente il comportamento di una qualche entità, dipende tanto dal nostro
stato mentale e dalla nostra preparazione quanto dalle proprietà dell’oggetto in esame. Se siamo capaci di spiegare e
predire il suo comportamento, o se ci sembra che esso sia poco pianificato, non siamo molto tentati di immaginare
8
Si tratta di “incapacità” che sono oggetto di ricerche oggi in primo piano: si pensi al tema della cosiddetta machine
consciouness, sollevato solo in tempi più recenti all’interno del programma di ricerca dell’IA (Trautteur 1995), tema al
quale è dedicata ora anche una rivista, lo International Journal of Machine Consciousness.
14
un’intelligenza in azione. Perciò è possibile che una persona consideri un oggetto intelligente e un’altra, che ha scoperto
le regole del suo comportamento, no. (Turing 1948, trad. it. p. 119).
9
L’adesione alla tesi 3 da parte di generazioni successive di ricercatori che hanno operato
nell’ambito del programma di ricerca dell’IA si è rivelata più problematica, scontrandosi nel tempo
con difficoltà che hanno provocato in tanti delusioni di non poco conto, e che sono anche all’origine
di un intricato e non lineare sviluppo dell’IA.
Passiamo ora alla tesi 4 del Rappresentazionalismo. La sua più popolare versione “ristretta”,
dopo la nascita dell’IA, identifica le rappresentazioni con strutture simboliche discrete, del tipo di
quelle che un calcolatore digitale è in grado di manipolare. Qui il ruolo di Turing nella storia
dell’IA è stato riconosciuto da sempre come centrale, fin dal suo articolo del 1936 (si veda ad
esempio Pylyshyn 1984, pp. 49 sgg.). Quando, a partire dalla metà degli anni ottanta del secolo
scorso, questa versione che abbiamo detto ristretta delle rappresentazioni è stata criticata all’insegna
dello slogan “intelligenza senza rappresentazione” (Brooks 1991), Turing è stato considerato
l’alfiere e il campione negativo del rappresentazionalismo, e alla macchina di Turing come
prototipo dei modelli computazionali del comportamento intelligente è stato addirittura
contrapposto un meccanismo analogico per eccellenza, come il regolatore di Watt, quale prototipo
di sistemi dinamici adatti a fornire modelli del comportamento intelligente (van Gelder 1995).
Senza entrare qui nel merito di questa disputa (v. Cordeschi e Frixione 2007), che segna il formarsi
di nuove linee di ricerca all’interno della IA, le quali si proponevano di superare, con un
cambiamento di rotta, fasi di stagnazione tanto dell’IA simbolica quanto del connessionismo,
vogliamo ricordare qui come la tesi del rappresentazionalismo si sia di fatto sviluppata anche in
relazione agli stati interni di un sistema fisico diverso da una macchina a stati discreti, e in
particolare a dispositivi analogici come il regolatore di Watt e altri sistemi a retroazione negativa.
Essa è stata sostenuta in questa forma, prima di Turing, anche dai pionieri della cibernetica.
Per Kenneth Craik, ad esempio, le rappresentazioni sono “tracce” o “repliche” fisiche degli stati
del mondo esterno nel sistema nervoso dell’organismo, e come tali possono essere realizzate in
opportuni artefatti. Erano questi le macchine con retroazione negativa e i dispositivi di calcolo
analogici dei suoi tempi. Si trattava dunque di “una teoria simbolica del pensiero, in cui il sistema
nervoso è visto come una macchina calcolatrice in grado di farsi un parallelo o un modello degli
eventi esterni, e […] che questo processo è la caratteristica fondamentale del pensiero e della
spiegazione” (Craik 1943 p. 121). Con l’avvento della cibernetica, rappresentazioni simboliche di
9
Un modo per uscire dalla conclusione paradossale di Turing potrebbe essere quello di vedere esemplificata nella tesi 3
la strategia generale della costruzione dei modelli nella scienza, come la descrivevano ad esempio Rosenblueth e
Wiener: una gerarchia di costrutti che va “dalle strutture teoriche estremamente astratte e relativamente semplici sino a
quelle più concrete e complesse”, più prossime cioè alla complessità reale del fenomeno originale (Rosenblueth e
Wiener 1945, trad. it. p. 90).
15
questo tipo hanno avuto un ruolo centrale nella teoria di Donald MacKay, per il quale è tramite un
“meccanismo imitativo” simbolico che un agente, sia esso un organismo o un opportuno artefatto
(sempre un dispositivo analogico), riesce ad interagire con il mondo in modo adattativo. Così l’atto
della percezione è considerato come un atto di risposta interna dell’organismo a determinati schemi
o pattern provenienti dall’esterno, o ancora, così si esprimeva MacKay, “come una risposta
autodiretta di conformità (matching response) […] che minimizza certi parametri di non equilibrio
o discrepanza (mismatch) tra tali pattern e la rappresentazione interna.” Questa procedura di
confronto tra lo stato interno attuale e quello del mondo esterno è realizzabile anche in un
opportuno artefatto, in cui essa funziona come “il rappresentante interno o il correlato simbolico del
pattern percepito corrispondente” (MacKay 1952 p. 73). Nel caso del termostato (un esempio
ricorrente nella cibernetica), la temperatura misurata a un dato momento è confrontata con quella
richiesta al fine di minimizzare la discrepanza. MacKay riteneva che un siffatto “meccanismo
imitativo” fosse alla base anche di attività più complesse descrivibili negli organismi e nelle
macchine, dalla classificazione di stimoli alla formazione di concetti fino a diverse forme di
coscienza (in coerenza con quella che abbiamo chiamato la tesi 3 dell’Uniformità del metodo).
Per finire, consideriamo brevemente la tesi 5 della Agentività. Ci si potrebbe chiedere perché
usare nell’interazione con le “nuove” macchine quel linguaggio degli scopi, dei desideri, delle
convinzioni o credenze, delle intenzioni, e così via (in breve il linguaggio della psicologia ingenua o
folk psychology) che usiamo comunemente, e senza porci troppi problemi, nell’interazione con i
nostri simili e anche con gli animali non umani. Già in quest’ultimo caso, quello degli animali non
umani, si potrebbero sollevare dubbi e problemi rispetto all’uso del linguaggio della folk
psychology. Per esempio, all’inizio del secolo scorso il grande zoologo Herbert Jennings poneva
questo interrogativo a proposito della descrizione del comportamento di animali inferiori: perché,
per prevederne e controllarne il comportamento, attribuiamo comunemente stati mentali a un cane e
non, quando la osserviamo al microscopio, a un’ameba, che pure è capace di un numero
indubbiamente limitato ma comunque significativo di interazioni plastiche e adattative con
l’ambiente esterno? Solo per una questione di dimensioni, rispondeva Jennings, denunciando così
con molto anticipo quello che Daniel Dennett chiamava il pregiudizio della scala spaziale (“se
dovessimo guardare nel microscopio per osservare le giocose evoluzioni delle lontre, non saremmo
più tanto sicuri del fatto che esse amano divertirsi”, Dennett 1996, p. 73).
Per quanto riguarda il caso delle macchine, è noto come siano stati Rosenblueth, Wiener e
Bigelow (1943) a sollevare esplicitamente il problema posto dalla tesi 5 nel loro articolo, in cui
proponevano una rivalutazione della dignità scientifica del linguaggio teleologico per descrivere il
comportamento di certe macchine (quelle con diversi tipi di retroazione negativa), ritenendo tale
linguaggio, spogliato di ogni interpretazione vitalistica, utile e talvolta anche necessario in quel
16
contesto. Anche in questo caso, come per le altre tesi che abbiamo esaminato, il problema era stato
già sollevato non appena si era manifestata la concreta possibilità di macchine che interagissero in
modo adattativo o plastico con l’ambiente esterno. Era infatti la relativa complessità delle
prestazioni dei nuovi artefatti a suggerire e a far ritenere giustificata l’attribuzione di scopi e
intenzioni per la previsione e il controllo del loro comportamento. Così, sempre sullo sfondo del già
ricordato approccio del robot, il biofisico Nicolas Rashevsky osservava come una descrizione in
“termini psicologici” di una macchina che apprende, quale una semplice macchina da lui progettata,
fosse inevitabile per controllare e prevedere il suo comportamento, anche perché “i processi
dell’apprendimento si verificano a un livello diverso da quello di una comune reazione muscolare.
[…] E’ difficile negare che un osservatore non prevenuto definirebbe il comportamento di tale
sistema ‘diretto a uno scopo’” (Rashevsky 1931, pp. 393 e 403).
In realtà questa tesi, per la quale una macchina che interagisca in modo plastico e adattativo con
l’ambiente, e dunque con eventuali suoi interlocutori, non può che essere descritta con predicati
psicologici, è implicita anche nel Test di Turing (TT). Si pensi al caso di un TT in una formulazione
“ristretta”, cioè limitato a un’unica prestazione, quello descritto da Turing (1948) nella forma di una
macchina che gioca a scacchi con un giocatore umano. Sia quest’ultimo che l’esaminatore devono
necessariamente ricorrere al linguaggio teleologico per controllarne e prevederne il comportamento;
in breve essi devono trattare la macchina che gioca a scacchi come un agente razionale, non meno
di come essi reciprocamente si trattano durante la partita. In particolare, il successo del test è dato
proprio dalla impossibilità, per l’esaminatore, di distinguere il comportamento della macchina da
quello del suo opponente umano: entrambi devono essere considerati come agenti razionali, il cui
comportamento ha ad ogni passo finalità e scopi ben precisi, al di là della possibilità, sempre
presente, che entrambi commettano errori. Errori teoricamente ineludibili che mettono in luce la
“razionalità limitata” sia della macchina che del giocatore umano (Simon 1969). A sua volta la
razionalità limitata, già particolarmente influente nella prima IA (si ricordi l’idea del calcolatore
come macchina “euristica”), ha fornito una motivazione per introdurre il “livello della conoscenza”
di Newell (1982), e cioè un livello di descrizione dell’agente razionale in quanto fornito di un
repertorio limitato di conoscenze, convinzioni o credenze, strategie di risoluzione di problemi,
obiettivi intermedi e finali e di altre caratteristiche ancora.
Indipendentemente dai significativi collegamenti concettuali con la razionalità limitata e il
livello della conoscenza, va detto che il TT è stato respinto dalla componente modellistica o
simulativa dell’IA, dalle sue origini all’interno della Information Processing Psychology fino alla
Scienza Cognitiva. Il TT è stato ereditato e discusso da altri settori della prima IA nella
formulazione “ristretta” sopra ricordata. E’ in quella forma che è stato inizialmente sperimentato nel
premio Loebner (v. Cordeschi 1998). Dalla metà degli anni novanta il TT è stato sperimentato
17
anche in forme meno ristrette o più “generali” (cioè più prossime all’idea del “gioco
dell’imitazione” di Turing 1950), fino alle straordinarie ma controverse prestazioni del calcolatore
IBM Watson, che ha riaperto recentemente la discussione sul TT nella comunità dell’IA (v. Shah
2011).
Abbiamo ricordato come le ricerche di Turing contribuissero ad aprire la strada a un
ampliamento epocale della tipologia degli automi considerati agli esordi della cibernetica, portando
in primo piano i calcolatori digitali general purpose. Il contributo specifico di Turing allo sviluppo
di modelli realizzati sotto forma di programmi per calcolatore è ormai noto, come pure lo è il ruolo
da lui svolto nell’avanzamento della tecnologia dei grandi calcolatori nel periodo pre e post bellico,
anche attraverso le diverse esperienze che egli fece a contatto con i principali pionieri dell’epoca,
primo tra tutti John von Neumann (v. Hodges 1983; Copeland 2004; Numerico 2005). Possiamo
quindi limitarci a sottolineare qui brevemente il contributo di Turing alla modellistica collocandolo
nel quadro della nostra ricostruzione del programma di ricerca dell’IA, per ricordare poi come
Turing abbia anche considerato la possibilità di sviluppare altre macchine come modelli
dell’intelligenza, macchine molto diverse dai calcolatori digitali.
Per quanto riguarda la natura dei modelli proposti da Turing, realizzati sotto forma di
programmi per calcolatore, egli, nel paragrafo conclusivo e giustamente celebre dell’articolo del
1950, suggeriva come fosse possibile perseguire contemporaneamente due approcci diversi.
In primo luogo, egli riteneva che la ricerca sulla cosiddetta “intelligenza meccanica” avrebbe
potuto concentrarsi sperimentalmente sul gioco degli scacchi e sulle capacità “astratte”
dell’intelligenza necessarie in casi come questo, secondo quanto aveva già suggerito nel suo articolo
del 1948, dove egli menzionava altri giochi, e anche la traduzione automatica, la crittografia e la
matematica, come ambiti di una ricerca che poteva richiedere “poco contatto con il mondo esterno“
(Turing 1948, trad. it. p. 104). In un lavoro successivo pubblicato nel 1953, Digital computers
applied to games, egli esplorò proprio questa linea di ricerca. Qui Turing distingueva tra diverse
capacità che dovevano essere implementate sui calcolatori programmati per giocare a scacchi, come
la verifica delle mosse consentite, la decisione di tentare una sequenza vincente in un dato numero
di mosse, o di giocare un gioco sufficientemente buono, magari apprendendo dall’esperienza.
Donald Michie (cit. da Copeland 2004, p. 563) ricorda come Turing, che si era occupato della
possibilità di programmare il gioco degli scacchi già dal 1941, avesse intuito l’importanza di quelle
che poi si sono definite procedure euristiche per la scelta delle mosse. Come avremo modo di
accennare nel paragrafo successivo, la programmazione euristica dedicata ai giochi e a diversi
rompicapo costituirà una delle prime linea di ricerca dell’IA, se non la prima, tuttavia già
effettivamente inaugurata dalla pionieristica programmazione del gioco della dama sui primi grandi
18
calcolatori IBM ad opera di Arthur Samuel antecedente la nascita ufficiale dell’IA a Dartmouth nel
1956 (v. Cordeschi 2002).
In secondo luogo, Turing, sempre nel paragrafo conclusivo dell’articolo del 1950, osservava
come un calcolatore avrebbe potuto utilmente interagire con il mondo esterno attraverso organi di
senso, e per esempio apprendere così una lingua. Dal punto di vista della nostra ricostruzione del
programma di ricerca dell’IA, queste iniziali formulazioni di Turing relativamente a diversi
possibili modi di sperimentare la nascente tecnologia dei calcolatori costituiscono altrettanti
incentivi a sviluppare diverse catene di modelli all’interno della cornice come l’abbiamo sopra
descritta. Una prima possibilità, già praticabile in quel momento, era quella di puntare a modelli
sempre più efficaci di attività cognitive come il ragionamento o la pianificazione o l’applicazione di
euristiche, cosa esemplificata dal gioco degli scacchi; un’altra possibilità poteva essere quella di
puntare in futuro a modelli sempre più efficaci dell’apprendimento del linguaggio naturale o della
traduzione tra lingue, lasciando però che tali modelli interagissero con il mondo esterno, e magari
“apprendessero” con un meccanismo simile a quello dell’evoluzione naturale (Turing 1950, trad. it.
p. 189 sgg). Ciascuna di queste possibilità ha dato luogo a linee di ricerca diverse all’interno del
programma di ricerca della nascente IA. Infine, sappiamo ormai come Turing pensasse anche a
macchine molto diverse dai calcolatori digitali come modelli dell’intelligenza, quelle che egli
definiva “macchine non organizzate”, ovvero reti addestrabili di unità connesse in modo casuale
(Turing 1948). A queste macchine si è dato recentemente un grande rilievo, perché nelle intuizioni
di Turing in proposito alcuni hanno riconosciuto i prodromi di altre linee di ricerca poi sviluppatesi
all’interno dell’IA, quelle, alle quali abbiamo anche accennato, promosse dai sostenitori del
connessionismo e dei sistemi dinamici (Copeland 2002, p. 403 sgg.).
In conclusione, Turing ha svolto un ruolo di primo piano tra i pionieri che lavorarono allo
sviluppo di ciascuno dei tre processi da noi descritti come cruciali per il nascente programma di
ricerca dell’IA, quelli della cornice, della modellistica e della tecnologia hardware e software.
Anche altri tra pionieri dell’IA lo hanno fatto in varia misura, come abbiamo già ricordato per
quanto riguarda lo sviluppo della cornice e dei modelli. Quanto alla tecnologia software, non
possiamo non menzionare almeno lo sviluppo, a partire dai primi anni cinquanta del secolo scorso,
delle reti neurali Snarc di Marvin Minsky e di quelle di Nathaniel Rochester e collaboratori, e di
linguaggi di programmazione come lo IPL ad opera di Newell e Simon, in collaborazione con
Clifford Shaw, o come il LISP ad opera di McCarthy (v. per dettagli Cordeschi 2002, cap. 6).
4. Ibridazioni e sviluppo tecnologico tra IA simbolica e subsimbolica
A Turing possono dunque farsi risalire importanti intuizioni sull’intelligenza delle macchine che
poi sono state sviluppate da linee di ricerca diverse all’interno dell’IA. Un esempio sul quale
19
vogliamo fermarci brevemente è quello dell’IA simbolica e del connessionismo. Si tratta di un caso
in cui emergono in modo evidente due aspetti ai quali abbiamo accennato, e che riteniamo essere
stati molto influenti nello sviluppo del programma di ricerca dell’IA. Il primo è quello delle
ibridazioni, l’altro quello dell’influenza della tecnologia dei calcolatori.
La linea di ricerca dell’IA simbolica si sviluppa in particolare da una specializzazione della tesi
4 alle strutture simboliche discrete manipolabili mediante regole algoritmiche e programmi per
calcolatore. Per cominciare, va detto che all’interno dell’IA simbolica i ricercatori hanno spesso
radicalizzato le differenze tra i diversi modelli da loro stessi proposti relativi alla percezione, al
ragionamento, alla pianificazione, finendo per parlare di “paradigmi” contrapposti. Si pensi, per fare
un esempio, al caso della risoluzione automatica di problemi, il settore nel quale si è cimentata l’IA
fin dalle sue origini. Spesso la sua evoluzione è stata descritta in termini di coppie di “paradigmi”
contrapposti. L’elenco di tali asseriti paradigmi include la ricerca euristica (basata sulla semplice
esplorazione dell’albero di ricerca) vista in contrapposizione alla rappresentazione della
conoscenza; i metodi deboli (o generali) come contrapposti ai metodi forti (o relativi a un dominio
specifico); i toy problem o problemi semplificati come contrapposti ai problemi della vita reale. Vi
sono state altre contrapposizioni ancora, come quelle, piuttosto note, tra logicisti e antilogicisti e tra
dichiarativisti e proceduralisti.
Non possiamo entrare qui nei dettagli di queste singole dispute, che hanno a lungo diviso la
comunità dell’IA, e che spesso si sono più dissolte che risolte (si veda Cordeschi 2002, cap. 6). E’
tuttavia da sottolineare che il temine “paradigma” come veniva usato nei casi sopra ricordati non
può essere inteso in senso tecnico (ovvero, come vedremo nel paragrafo seguente, à la Kuhn). Più
che di paradigmi, si tratta di linee di ricerca interne all’IA, anzi in questo caso interne alla stessa IA
simbolica. Nel programma di ricerca dell’IA si assiste infatti allo sviluppo di linee di ricerca di
diversa generalità, che possono dar luogo a ibridazioni che cercano di unire i punti di forza delle
linee di ricerca interessate superandone i rispettivi limiti. Nel caso che esaminiamo, queste
ibridazioni si sono realizzate non solo, lo vedremo nel seguito, tra IA simbolica e IA connessionista,
ma anche tra linee di ricerca diverse interne all’IA simbolica, dunque a un livello di generalità
minore delle prime.
Un esempio di quest’ultimo tipo è l’esito della contrapposizione appena ricordata tra l’asserito
paradigma della ricerca euristica attraverso metodi generali, cosiddetti “deboli”, applicabili
soprattutto a toy-problem, e quello della ricerca basata sulla conoscenza, ricerca che in questo caso
si ritiene possibile grazie al ricorso a metodi specializzati relativamente a un certo dominio,
cosiddetti “forti”, in grado di affrontare problemi della vita reale. Per esemplificare: nel primo caso
abbiamo problemi come la logica o i diversi giochi e rompicapo (la torre di Hanoi e così via),
affrontabili con procedure per scegliere le mosse che sono basate su indizi diversi. Si tratta di
20
procedure dette euristiche, solitamente di tipo molto generale e dunque deboli (per esempio, la
scomposizione di un problema in sottoproblemi più semplici). Nel secondo caso abbiamo problemi
complessi, come fare una diagnosi medica, dove nella presa di decisione entrano in gioco, oltre alle
aspettative disattese e agli imprevisti in cui ci si imbatte nella vita reale, soprattutto conoscenze
specializzate anche se sempre incomplete, e metodi di ricerca euristica ad esse relativi, solitamente
detti forti. Intorno alla fine degli anni sessanta si ebbe il passaggio dalla risoluzione automatica di
problemi attraverso l’albero di ricerca alla risoluzione automatica di problemi basata sulla
conoscenza (che caratterizza i cosiddetti sistemi esperti). Ma l’una e l’altra linea di ricerca, dopo
un’iniziale contrapposizione, hanno finito per “ibridarsi” (il termine è di Simon), arrivando a
suggerire nuovi e più soddisfacenti modelli e anche nuove intuizioni teoriche.
C’è da sottolineare in questo contesto un fattore decisivo, relativo allo stato di avanzamento
della tecnologia dei calcolatori. Come abbiamo detto, si tratta in realtà di un fattore che ha
influenzato in modo decisivo la storia dell’intera IA, certe sue svolte, certi suoi successi e
insuccessi, e anche certe sue illusioni. Nell’IA simbolica, un esempio è il caso che stiamo
esaminando dello spostamento dell’enfasi dai modelli basati sulla semplice ricerca euristica ai
modelli basati sulla conoscenza, e dunque dallo studio di toy problem a quello di problemi della vita
reale. Era Simon a ricordare come la scelta iniziale di concentrarsi sullo studio dei primi piuttosto
che sui secondi si doveva anche allo stato della tecnologia: “Non è che non fossimo consapevoli
dell’importanza giocata dalla conoscenza [nella risoluzione di problemi]. Piuttosto, non venivano
considerati compiti nei quali la conoscenza era un fattore essenziale perché non si era in grado di
costruire grandi basi di dati con i calcolatori dell’epoca” (si veda in Crevier, 1973, p. 147).
L’iniziale enfasi su compiti che richiedevano poca o pochissima conoscenza da parte del solutore,
come i ricordati toy problem, sembra dunque essere stata una scelta pressoché obbligata per i
pionieri della IA.
Ma la storia non finisce qui. Inizialmente, Edward Feigenbaum, considerato il padre dei sistemi
basati sulla conoscenza o sistemi esperti, concluse che i metodi deboli erano inefficienti e
insufficienti per costruire modelli efficaci della soluzione “esperta” di problemi del tipo della vita
reale, metodi che dovevano essere dunque potenziati ricorrendo all’uso, da parte del programma, di
conoscenza specifica (si pensi ancora al caso della diagnosi medica). La successiva ricerca mostrò
tuttavia che le iniziali buone prestazioni dei sistemi basati su conoscenze specializzate, quali erano i
sistemi esperti, non portavano ai risultati che ci si poteva aspettare. Negli anni ottanta, lo stesso
Feigenbaum riassumeva le difficoltà incontrate nel costruire sistemi esperti con prestazioni
efficienti in un articolo scritto con Douglas Lenat: “Un limite dei sistemi esperti passati e presenti
sta nella loro fragilità (brittleness). Essi funzionano efficientemente in base alla loro piattaforma
elevata di conoscenze e competenze finché non raggiungono i limiti delle loro conoscenze,
21
dopodiché essi precipitano rovinosamente a livelli di totale incompetenza. Certo, anche la gente
incontra difficoltà del genere, ma la loro piattaforma è molto più estesa, e il loro declino meno
rapido. La caduta è in parte attenuata dal possesso di metodi più deboli e generali che sottostanno
alla conoscenza specializzata” (Lenat e Feigenbaum 1991, p. 196, corsivo nostro).
Le esperienze di Feigenbaum sui sistemi esperti e quelle di Lenat sui programmi per
l’apprendimento e la scoperta di concetti scientifici in ambiti più o meno specialistici sembravano
dunque portare a diverse successioni o catene di modelli (per riprendere la terminologia di Lakatos)
che soffrivano di una stessa limitazione: entrambe non erano in grado di sfruttare quella che gli
stessi autori chiamavano “la conoscenza basata su una realtà condivisa” (consensus reality
knowledge), che negli esseri umani realizza la conoscenza basata sul senso comune, spesso di
carattere analogico e impreciso, basata com’è proprio su metodi di ricerca di tipo generale o deboli,
e che soccorre la presa di decisione in casi di incertezza.
Insomma, la ricerca sui sistemi basati sulla conoscenza, dopo aver conseguito alcuni successi
nell’ambito della risoluzione automatica di problemi, era entrata a sua volta, negli anni ottanta, in
una fase di stagnazione, che non sembrava portare a nuovi progressi. La conoscenza basata sul
senso comune costituì la vera bestia nera, o se si vuole la fonte di anomalie difficilmente eliminabili
all’interno di quel PRS. Il successivo tentativo di Lenat dell’ambizioso programma CYC può essere
qui considerato come il tentativo di uscirne, progettando una catena di modelli (specifiare o
cambiare???) che porta a un sistema con il quale si tenta di gestire efficientemente la conoscenza
del senso comune in domini sempre più vasti. Non completato nella sua formulazione originale,
CYC ha finito per incrociarsi con la ricerca attuale sulle ontologie per il web (si veda Cordeschi
2006).
L’IA simbolica è una linea di ricerca che a un certo punto è entrata in competizione con un una
linea di ricerca alternativa, ma ugualmente ispirata dalle cinque tesi della cornice: quella delle reti
neurali, subsimbolica o connessionista, per il quale ogni tipo di comportamento intelligente può
emergere dall’attività di elaborazione parallela dell’informazione da parte di unità di calcolo
originariamente concepite come modelli semplificati del funzionamento dei neuroni biologici. Per
distinguerli dalle rappresentazioni simboliche dell’IA simbolica, questi pattern di attivazione che
evolvono nel tempo vengono talvolta chiamati rappresentazioni subsimboliche. Dal punto di vista
che qui proponiamo, l’IA simbolica e quella subsimbolica costituiscono due linee di ricerca
concorrenti, all’interno della cornice più generale formata dalle cinque tesi. Questo ha consentito
lo sviluppo di modelli molto diversi tra loro, che hanno poi dato luogo anche a ibridazioni in forma
neuro-simbolica. Proviamo a vedere come sono andate le cose con qualche dettaglio.
Un convegno importante nella storia della IA dopo Dartmouth è stato quello svoltosi a
Teddington nel 1958. Forse è in questa occasione che si materializzò per la prima volta il contrasto
22
tra le linee di ricerca dell’IA simbolica, sostenuta da Minsky, e quella subsimbolica, sostenuta da
Frank Rosenblatt. Ciascuno di essi portò argomenti che tendevano a mostrare i vantaggi del proprio
approccio e i limiti di quello concorrente. Secondo Minsky, i sostenitori delle reti neurali non erano
in grado di proporre modelli di attività dell’intelligenza per così dire alta, come il ragionamento
basato su concetti astratti. Rosenblatt, dal canto suo, presentando in quell’occasione il suo
Perceptron, sostenne che i modelli basati su programmi per calcolatore non permettevano di
costruire modelli biologicamente plausibili, in particolare per quanto riguardava le capacità
associative e l’apprendimento (si veda Cordeschi 2002, cap. 6).
A partire dagli anni sessanta, la ricerca sulle reti neurali entrò in una fase che possiamo dire di
stagnazione, almeno nel confronto con i primi successi dell’IA simbolica (quelli ai quali abbiamo
accennato nell’ambito della risoluzione automatica di problemi). Il celebre libro pubblicato nel
1969 da Minsky con Seymour Papert sui limiti dei Perceptron costituì un altro argomento per il
ridimensionamento della linea di ricerca sulle reti neurali. Una fase di ripresa di quest’ultima risale
ai primi anni ottanta, e si deve ad almeno due lavori: quello di John Hopfield sulle memorie
associative e quello sull’algoritmo di retropropagazione (backpropagation) di David Rumelhart e
collaboratori, che consentiva di superare alcuni limiti dei Perceptron denunciati da Minsky e Papert
nel loro libro.
Retrospettivamente, si può dire che si è trattato di un’euforia durata un periodo molto breve. Tra
gli anni ottanta e novanta, i sistemi connessionisti mostrarono ben presto limiti difficilmente
superabili, sostanzialmente confermando la diagnosi che Minsky aveva fatto a Teddington. I sistemi
connessionisti, come ai vecchi tempi del Perceptron di Rosenblatt, davano il meglio di sé in compiti
di riconoscimento di forme, di associazione e in certe forme di apprendimento, ma generalmente si
mostravano inadeguati in compiti che richiedevano capacità di ragionamento e di pianificazione.
Ancora una volta, sistemi “ibridi” sono stati proposti per rispondere a queste problematiche,
superando i limiti complementari di IA simbolica e subsimbolica, combinando i punti di forza di
entrambi e reinterpretando in modo opportuno le cinque tesi della cornice (si veda Cordeschi 2002,
cap. 6).
Per concludere, va sottolineato che anche nel caso delle reti neurali vale quanto abbiamo detto
sopra a proposito della ricerca euristica nel dominio dei toy problem, e cioè come lo stato della
tecnologia dei calcolatori abbia influito nell’orientare la ricerca effettiva (le reti neurali si simulano
tramite software per calcolatore). Su questo problema ha insistito proprio un connessionista, James
McClelland, osservando che “la potenza di calcolo di cui si disponeva negli anni sessanta era
completamente insufficiente [per lo sviluppo di reti neurali]”. Anche qui le limitazioni della
tecnologia dei calcolatori hanno influito nell’orientare inizialmente i ricercatori verso una linea di
ricerca (quella simbolica) piuttosto che verso un’altra (quella subsimbolica o connessionista), al
23
punto che sempre McClelland smentiva esplicitamente uno dei luoghi comuni della polemica
connessionista, quello che gettava sul libro di Minsky e Papert la responsabilità della stagnazione e
della regressione della ricerca sulle reti neurali negli anni sessanta (si veda Crevier 1993, p. 309).
5. Il programma di ricerca scientifico dell’IA e la filosofia della scienza
L’impostazione data all’analisi dei contributi di Turing nel contesto del programma di ricerca
dell’IA presenta, come abbiamo sottolineato più sopra (v. paragrafo 2), evidenti punti di
convergenza con il modello della scienza normale di Kuhn, il modello dei programmi di ricerca
scientifici di Lakatos e il modello delle tradizioni di ricerca di Laudan. Si possono tuttavia cogliere
significative differenze con ciascuno di questi modelli. Vediamo perché, iniziando dalla scienza
normale di Kuhn.
Nei periodi di scienza normale, secondo Kuhn i ricercatori svolgono la propria attività di
problem solving o di risoluzione di rompicapo in base a un paradigma. Come ha osservato Laudan,
tuttavia, un paradigma kuhniano ha una struttura eccessivamente rigida, che ne impedisce
l’evoluzione nel tempo in funzione delle anomalie che esso genera. Inoltre, un paradigma riceve una
formulazione solo implicita, nella misura in cui esso viene identificato per mezzo di casi
“esemplari,” e cioè mediante l’individuazione di qualche applicazione di concetti e teorie
matematiche nell’ambito della fisica o di altre scienze empiriche, che deve fungere da modello di
riferimento per la soluzione di ulteriori rompicapo.
La ricostruzione dell’IA come programma di ricerca che abbiamo qui abbozzato si discosta dai
paradigmi kuhniani per entrambe le caratteristiche. Infatti, la formulazione della cornice all’interno
della quale i ricercatori svolgono le loro attività scientifiche e tecnologiche non avviene solo in
modo implicito mediante il riferimento a casi esemplari. La cornice è formata da tesi che, seppure
contemplino varianti non sempre equivalenti tra loro, costituiscono un nucleo di assunzioni esplicite
sugli enti e sui processi da indagare e sui modi più opportuni per sviluppare le indagini scientifiche
e tecnologiche. E abbiamo anche visto che la cornice, al contrario di un paradigma, può essere
modificata. Di fatto essa è stata modificata incisivamente da Turing, subendo in seguito ulteriori
modifiche alle quali abbiamo potuto solo accennare per grandi tratti. In questi passaggi, tuttavia,
non si ravvisa quel cambiamento gestaltico che Kuhn identifica con un mutamento di paradigma. Si
tratta piuttosto di un processo graduale di rimaneggiamento della cornice, ottenuto dando a ciascuna
delle cinque tesi un peso diverso o specificando diverse accezioni dei concetti che occorrono in
esse, come quelli di macchina, di rappresentazione, di uso simulativo delle macchine, e così via.
Inoltre, come abbiamo visto nel paragrafo precedente, ricostruire lo sviluppo dell’IA attraverso la
lente dei cambiamento gestaltici, ovvero dei mutamenti di paradigmi contrapposti, rende
24
difficilmente spiegabili i non pochi processi di ibridazione che si verificano in IA, sia tra linee di
ricerca diverse di IA sia all’interno di una stessa sua linea di ricerca.
Consideriamo ora i programmi di ricerca scientifici di Lakatos. La cornice del programma di
ricerca dell’IA ha elementi significativi in comune con quello che Lakatos chiama il nucleo di un
programma di ricerca scientifico (PRS). Infatti, il nucleo di un PRS è una collezione di principi
euristici per la costruzione di teorie e modelli scientifici. Il nucleo, che è costituito da enunciati che
riguardano la natura e il comportamento di varie entità e processi, può includere (o fare riferimento
a) un corpo di leggi scientifiche, insieme a varie tesi ontologiche ed epistemologiche sul dominio di
indagine. Per esempio, il nucleo del PRS noto come fisica cartesiana può essere riassunto con
l’asserzione che “l’universo è un enorme meccanismo (e sistema di vortici) nel quale l’urto è
l’unica causa del movimento” (Lakatos 1970, p. 57). Si tratta di un enunciato metafisico, secondo i
criteri di classificazione tra tipi di enunciati proposti da Popper e ripresi da Lakatos. Una tale
asserzione, infatti, non può essere contraddetta da nessuna asserzione singolare, e dunque non
risulta falsificabile mediante esperimento (Lakatos 1970, trad. it. p. 47 e p. 33). Da questa
prospettiva, devono essere classificate come metafisiche anche la tesi 1 del Funzionalismo o la tesi
3 dell’Uniformità del metodo, non essendovi esperimenti in grado di falsificarle direttamente.
Secondo Lakatos, il nucleo si conserva sostanzialmente invariato nel corso dello sviluppo di un
PRS, fino al suo eventuale abbandono a vantaggio di un altro PRS. Il nucleo del PRS della fisica
cartesiana è stato abbandonato per il nucleo di un PRS rivale di maggiore successo, quello
newtoniano, che ammette l’azione a distanza e include sia la legge di gravitazione di Newton sia le
tre leggi della dinamica (Lakatos 1970, trad. it. p. 58). Come abbiamo già rilevato a proposito dei
paradigmi kuhniani, l’invarianza del nucleo nel corso dello svolgimento di un PRS non trova
riscontro nell’impostazione che abbiamo dato all’analisi dell’IA come programma di ricerca. Infatti
non solo singole linee di ricerca dell’IA ma, come il nucleo di un PRS, perfino la cornice del
programma di ricerca dell’IA può essere abbandonata in situazioni di persistente stagnazione delle
ricerche e in presenza di programmi di ricerca alternativi di maggiore successo.
Le differenze tra i PRS di Lakatos e l’impalcatura introdotta nei paragrafi precedenti si
estendono alle relazioni tra i modelli prodotti nel quadro del programma di ricerca dell’IA. Lakatos
si limita a consentire la costruzione, all’interno di un PRS, di catene di modelli, all’interno di
ciascuna delle quali ogni nuovo modello ha un contenuto empirico maggiore di modelli
precedentemente introdotti.
10
Nel programma di ricerca dell’IA, non è stato quasi mai possibile
confrontare il contenuto empirico dei singoli modelli, cosicché le relazioni tra modelli non
10
In questo contesto Lakatos riprende l’idea popperiana del confronto tra diverse teorie basato sul rispettivo contenuto
empirico, mettendo in luce la complessità delle decisioni metodologiche richieste per istituire il confronto nel quadro
della sua metodologia dei programmi di ricerca scientifici. Si veda per esempio la nota 82 a p. 111 della trad. it. di
(Lakatos 1970).
25
ricadono, in generale, nel caso previsto da Lakatos. In realtà, salvo alcune eccezioni (esemplari il
caso di Newell e Simon nello studio di funzioni cognitive “alte” come il problem solving o quello di
David Marr nella visione artificiale), la comunità dell’IA, negli anni che seguirono la morte di
Turing, non è stata sempre sensibile alla questione metodologica di elaborare criteri, magari diversi
dai criteri particolarmente restrittivi proposti da Lakatos, che permettessero di confrontare i risultati
della ricerca nel settore, consentendo di riconoscere i progressi compiuti con lo sviluppo di nuovi
modelli, programmi per calcolatore o sistemi robotici.
Vi sono relazioni più strette tra la nostra ricostruzione del programma di ricerca dell’IA e le
tradizioni di ricerca di Laudan. Gli elementi costitutivi della cornice, così come le tradizioni di
ricerca di Laudan, sono assunzioni relative al dominio di indagine e ai metodi da adottare per
studiare le entità e i processi nel dominio di indagine.
11
E la cornice dell’IA evolve nel tempo, come
si vede dalle varie interpretazioni e precisazioni delle cinque tesi, proprio come una tradizione di
ricerca, ma al contrario dei paradigmi di Kuhn o dei nuclei dei PRS di Lakatos. Vi sono tuttavia
altre differenze rilevanti tra la cornice e le tradizioni di ricerca di Laudan. Ci limitiamo qui a
metterne in evidenza tre per quanto riguarda l’IA: l’importanza dello sviluppo tecnologico per
l’avanzamento del suo programma di ricerca, il ruolo centrale del processo di ibridazione tra linee
di ricerca interne alla sua cornice, il ruolo centrale di ciò che chiamiamo razionalità esterna nella
valutazione dei suoi risultati.
12
Sulle prime due ci siamo già soffermati in precedenza. Lo sviluppo della tecnologia è poco
considerato nello schema di Laudan,
13
mentre da noi è stato individuato come particolarmente
influente sul programma di ricerca dell’IA, sia per avviare una linea di ricerca all’interno all’IA sia
per ridarle slancio. Analogamente, i limiti contingenti di una tecnologia hanno talvolta determinato
la stagnazione o l’abbandono di alcune linee di ricerca interne all’IA. Abbiamo fatto l’esempio delle
reti neurali degli anni cinquanta; un altro esempio è la robotica cibernetica, alla quale si ispirano i
successivi sviluppi della robotica behavior-based degli anni ottanta del secolo scorso: essa arrivò a
una situazione di stallo sia per la mancanza di una miniaturizzazione efficace dei componenti sia
per l’assenza di modelli architetturali adeguati (Brooks 1995, p. 38).
Per quanto riguarda i processi di ibridazione, è opportuno evidenziare che le dinamiche del
progresso scientifico considerate da Laudan comprendono processi di amalgamazione tra tradizioni
11
Secondo Laudan, una tradizione di ricerca è formata da un insieme di assunzioni sulle entità e i processi all’interno di
un dominio di indagine, e suoi metodi più appropriate per costruire teorie affrontare i problemi di quel dominio. Si
veda, in particolare, il paragrafo intitolato “La natura delle tradizioni di ricerca” nel capitolo 3 di Laudan (1977).
12
Vi sono altre differenze, che segnaliamo ma non affrontiamo perché meno rilevanti per i problemi metodologici
esaminati in questo paragrafo. Per esempio, Laudan classifica la cibernetica (ma implicitamente anche l’IA per motivi
analoghi) come una tradizione di ricerca “non-standard” per assenza di impegni o commitment ontologici.
13
Nell’ambito della storia della fisica, settore privilegiato di analisi per Laudan, è stato Peter Galison a sottolineare la
relativa autonomia e l’influenza dei processi di sviluppo degli strumenti scientifici sulla ricerca teorica e sperimentale
(Galison 1997).
26
di ricerca.
14
Ma Laudan non si sofferma su processi di amalgamazione interni a una tradizione di
ricerca. Qui abbiamo invece sottolineato l’ampia portata dei processi di ibridazione tra linee di
ricerca interne all’IA, anche per il loro impatto sull’interpretazione e il rimaneggiamento della
cornice, come abbiamo visto sopra nell’esempio dell’IA simbolica e subsimbolica.
15
Veniamo ora alla questione della razionalità esterna. Galison sottolinea elementi di disunità
all’interno della fisica, evidenziando i confini tra differenti “sottoculture” e comunità, come quelle
che si occupano dello sviluppo della strumentazione, quelle che si concentrano sull’impostazione e
sulla conduzione degli esperimenti, e quelle che si concentrano sull’elaborazione di teorie e
modelli. Queste varie sottoculture condividono alcune attività, pur divergendo tra loro per altre
attività, interessi e obiettivi di ricerca. Le varie sottoculture godono perciò di una parziale
indipendenza reciproca. Tra di esse, tuttavia, lo scambio è stato intenso e reciprocamente fruttuoso.
Per descrivere siffatte interazioni, Galison ricorre all’analogia con le “trading zone”, zone franche
dedicate al commercio tra comunità geograficamente limitrofe. Anche l’IA è stata molto attiva nello
scambio tecnologico con altre comunitàche ad essa risultano limitrofe sia scientificamente che
tecnologicamente. Come è stato già messo in evidenza in relazione alla distinzione tra razionalità
interna ed esterna al programma di ricerca, le tecnologie software sviluppate all’interno dell’IA non
hanno sempre portato ai risultati attesi nella costruzione di modelli soddisfacenti di aspetti del
comportamento intelligente. E tuttavia le stesse tecnologie, insoddisfacenti dal punto di vista della
razionalità interna, si sono rivelate essere utili per altri settori dell’informatica e delle tecnologie
dell’informazione. Alcune tecnologie software sviluppate nell’ambito dell’IA vengono utilizzate
come componenti di smart phone, di motori di ricerca, di giochi informatici, di sistemi
multimediali, di sistemi per il commercio in rete o per il monitoraggio e controllo del consumo
energetico. In generale, le tecnologie dell’IA consentono di dotare sistemi informatici complessi di
capacità come la percezione, il ragionamento, l’apprendimento e la pianificazione.
In tutti questi casi, i risultati conseguiti soddisfano criteri deboli di razionalità esterna per la
sopravvivenza della cornice: i risultati sono infatti giustificati in relazione agli obiettivi di ricerca e
sviluppo di comunità limitrofe, piuttosto che in relazione al conseguimento di obiettivi che sono
caratteristici del programma di ricerca dell’IA.
La distinzione tra razionalità esterna ed interna nella giustificazione dei risultati ottenuti dal
programma di ricerca dell’IA non coincide con la distinzione proposta da Laudan tra le motivazioni
razionali e non razionali che inducono a perseguire un programma di ricerca o a privilegiare
selettivamente alcuni problemi e attività di problem solving tra quelli che una tradizione di ricerca
14
Si veda il paragrafo intitolato “L’integrazione delle tradizioni di ricerca” nel capitolo 3 di Laudan (1977).
15
Ricordiamo anche che lo sviluppo della cornice ha elementi in comune con l’individuazione di temi di fondo per la
ricerca scientifica che Gerald Holton ha chiamato themata, identificandoli con concezioni stabili e pervasive nelle
comunità scientifiche, che non possono ridursi alle pratiche sperimentali e teoriche del lavoro scientifico (Holton 1988).
27
deve affrontare. Come motivazioni non razionali Laudan elenca le pressioni economiche, politiche,
morali o sociali. Le applicazioni fruttuose dell’IA in settori limitrofi non dipendono
necessariamente da motivazioni o pressioni economiche, politiche, morali o sociali. E tuttavia
l’impatto di quelle che Laudan chiama motivazioni non razionali è stato molto forte anche sul
programma di ricerca dell’IA. Basta ricordare a tale riguardo l’impulso economico che l’apparato
militare-industriale ha dato allo sviluppo delle ricerche della cibernetica e dell’IA (Cordeschi e
Tamburrini 2006, Datteri e Tamburrini 2012).
6. Conclusioni
La ricostruzione del programma di ricerca dell’IA che abbiamo proposto, nella sua duplice versione
ingegneristica e teorica (quest’ultima, a sua volta, nella duplice tendenza simulativa e non
simulativa), si è articolata attraverso la descrizione di una cornice, di una modellistica e di una
specifica tecnologia, quella dei calcolatori. Abbiamo individuato cinque tesi, relativamente stabili,
che caratterizzano la cornice, e abbiamo descritto brevemente come all’interno di tale cornice si
siano avvicendate diverse linee di ricerca, i cui risultati si sono realizzati in altrettante catene di
modelli, per la costruzione dei quali si è sempre rivelato cruciale il livello di sviluppo della
tecnologia dei calcolatori. Tali catene di modelli si sono spesso sviluppate con esiti diversi, dando
luogo a fasi di progresso o a fasi di stagnazione, quando non di regressione, delle rispettive linee di
ricerca. Abbiamo visto come vari tentativi di superamento delle fasi di stagnazione o regressione
sono stati attuati attraverso processi di ibridazione tra linee di ricerca. Ma abbiamo visto anche
come le ibridazioni possono aver luogo all’interno di una stessa linea di ricerca, quando questa si
evolve o si articola a sua volta in linee di ricerca ancora più specifiche. Abbiamo fatto nel primo
caso l’esempio dell’IA simbolica e di quella connessionista; nel secondo caso, abbiamo ricordato
alcune confluenze interne alla linea di ricerca dell’IA simbolica, che si sono sviluppate a partire da
contrapposizioni iniziali (toy problems vs. real life problems, dichiarativismo vs. proceduralismo, e
così via).
In base alla nostra ricostruzione, risulta inappropriato applicare rigidamente allo sviluppo
dell’IA modelli interpretativi della razionalità scientifica come quelli di volta in volta proposti per
altre discipline da diversi filosofi della scienza, a partire almeno da Kuhn. Nella nostra
ricostruzione, la cornice dell’IA si sviluppa sulla base di assunzioni metodologiche e ontologiche
già avanzate dalla cibernetica, e condivise dalle sporadiche e tuttavia vitali esperienze
precibernetiche, sviluppatesi all’insegna di quella che Hull definiva ai suoi tempi la “tendenza
meccanicistica della psicologia”. Questa ha contribuito non poco, come abbiamo visto,
all’elaborazione delle cinque tesi che caratterizzano la cornice, ma anche, e scontando i limiti della
tecnologia assai primitiva delle macchine dell’epoca, alla prima modellistica del metodo sintetico.
28
La nostra ricostruzione aveva come obiettivo principale quello di rendere esplicito il ruolo
svolto da Turing nella nascita e nell’evoluzione dell’IA. Abbiamo visto che non si potrebbe pensare
alla cornice come oggi la conosciamo, con i relativi sviluppi della modellistica (nella versione
debole come in quella forte del metodo sintetico), senza il contributo di Turing, che pure si colloca
agli esordi degli sviluppi rapidi e tumultuosi della tecnologia hardware e software dei calcolatori. In
particolare, il suo contributo ha portato a una svolta decisiva nell’elaborazione delle cinque tesi,
caratterizzando una linea di ricerca che sarebbe poi diventata a lungo prevalente in IA, quella
dell’IA simbolica. E tuttavia, al di là di quest’ultima, che solitamente vale a Turing il
riconoscimento di precursore dell’IA, egli ha prospettato possibilità diverse, che hanno
caratterizzato diverse linee di ricerca successive, incluse quelle cosiddette situata e embodied.
Turing ha individuato anche alcuni problemi di fondo, sotto forma di obiezioni alla sua tesi
dell’intelligenza meccanica, che riguardano la creatività, la coscienza e altre caratteristiche del
mentale che risultano elusive per ogni linea di ricerca dell’IA, embodied o meno.
Abbiamo inoltre sottolineato il contributo di Turing all’identificazione di alcune difficoltà
epistemologiche di fondo per l’IA, che nascono da concezioni pre-teoriche del comportamento
intelligente, e in particolare dalle sue presunte caratteristiche di imprevedibilità e di non conformità
a regole. Turing osserva che siffatte concezioni dell’intelligenza si ripercuotono sul problema di
valutare il progresso del programma: ogni volta che l’IA consegue un qualche risultato esplicativo o
previsionale, in quel preciso momento il comportamento spiegato o previsto viene derubricato, in
quanto comportamento soggetto a regole e pertanto non più intelligente secondo l’appena
richiamata concezione pre-teorica. Se da un lato l’IA, come ogni programma di ricerca scientifica, è
alla ricerca di criteri di razionalità interna per valutare i propri risultati e il destino della sua cornice
generale, da un altro lato la sua stessa strategia esplicativa e previsionale trasforma ogni successo in
qualcosa che può soddisfare solo i criteri della razionalità esterna.
E’ chiaro che il problema di fornire criteri di razionalità interna adeguati per valutare
comparativamente i risultati ottenuti dai ricercatori e i loro progressi nell’attività di problem
solving, individuando elementi di continuità e cumulatività tra vari modelli o dispositivi informatici
e robotici, non si scontra solo con le concezioni pre-teoriche dell’intelligenza richiamate da Turing.
Il programma di ricerca dell’IA è stato afflitto da persistenti difficoltà di identificare misure di
progresso e stagnazione. Si tratta di difficoltà note nella ricerca scientifica e di difficile
superamento, come testimonia anche il caso della psicologia (Mecacci 1992). Sul problema dei
criteri di valutazione progresso, e cioè della razionalità interna al programma di ricerca dell’IA, si è
sviluppato ed è tuttora in corso un ampio dibattito, che fin dall’inizio ha coinvolto soprattutto alcuni
29
ricercatori di quella che abbiamo chiamato la componente teorica dell’IA, come Allen Newell,
Herbert Simon e David Marr.
16
Infine ricordiamo il collegamento cruciale tra il lavoro che Turing ha svolto nell’ambito della
logica e dell’informatica teorica da un lato e i suoi contributi allo sviluppo del programma di ricerca
dell’IA dall’altro lato. Le proposte di Turing in merito alla cornice del programma di ricerca dell’IA
si basano essenzialmente sulla sua scoperta delle macchine universali. Nel confronto con la
precedente tradizione cibernetica, la reinterpretazione che Turing dà delle cinque tesi mette al
centro l’elaborazione simbolica e il comportamento plastico derivante dalla capacità che una
macchina universale ha di interpretare ed eseguire un’infinità potenziale di programmi. Ancora
dopo la morte di Turing nel 1954, queste novità non erano state pienamente recepite nella
riflessione filosofica sulle macchine e sull’interazione uomo-macchina. Nel 1956 Günther Anders,
nel suo L’uomo è antiquato, continuava a sostenere che "caratteristica essenziale della macchina è
che essa esegue un unico lavoro specializzato, si esaurisce in questa sua prestazione e trova in essa e
soltanto in essa la giustificazione della sua esistenza" (Anders 1956, trad. it. p. 74). Turing ha
identificato in questa concezione superata uno dei motivi di resistenza psicologica all’idea di una
intelligenza meccanica: “le macchine usate fino a tempi recenti (possiamo dire fino al 1940)”
avevano caratteristiche molto limitate; “questo fatto ha incoraggiato la convinzione che le macchine
fossero necessariamente limitate a compiti estremamente diretti, forse perfino a quelli solo
ripetitivi” (Turing 1948, trad. it. p. 89). La scoperta delle macchine universali impone l’abbandono
di questa concezione antiquata delle macchine, ne svela le profonde carenze e schiude le porte alla
nuova epoca delle macchine intelligenti.
RIFERIMENTI BIBLIOGRAFICI
Anders, G. (1956), Die Antiquiertheit des Menschen. Band I: Über die Seele im Zeitalter der
zweiten industriellen Revolution. C. H. Beck, München 1956. Trad.it. L’uomo è antiquato, vol.
I., Bollati Boringhieri, Torino, 2003.
Brooks, R.A. (1991), Intelligence without representation, Artificial Intelligence, 47: 139-159.
Copeland B.J. (a cura di) (2004), The essential Turing, Clarendon Press, Oxford
Cordeschi R. (1998), “Pensiero meccanico” e giochi dell’imitazione, Sistemi Intelligenti, 10, pp. 44-
52.
Cordeschi R. (2002), The discovery of the artificial: Behavior, mind and machines before and
beyond cybernetics, Dordrecht, Kluwer.
Cordeschi R. (2006), Searching in a Maze, in Search of Knowledge, Lecture Notes in Computer
Science, 4155: 1–23.
Cordeschi R. e Frixione M. (2007), Computationalism under attak, in M. Marraffa, M. De Caro e F.
Ferretti (a cura di), Cartographies of the Mind: Philosophy and Psychology in Intersection,
Springer, Berlin-Heidelberg, pp. 37-49.
16
Per una discussione introduttiva sui criteri di razionalità interna discussi in IA rimandiamo il lettore interessato a
Cordeschi e Tamburrini (2001), Tamburrini (1997).
30
Cordeschi R. e Tamburrini G. (2001), L'intelligenza artificiale: la storia e le idee, in Burattini E. e
Cordeschi R. (a cura di), Intelligenza Artificiale. Manuale per le discipline della
comunicazione, Carocci Roma, pp. 15-44.
Cordeschi R. e Tamburrini G. (2006), Intelligent Machines and Warfare: Historical Debates and
Epistemologically Motivated Concerns, in Magnani L. e Dossena R. (a cura di), Computing,
Philosophy and Cognition, College Pubblications, Londra, pp. 1-20.
Craik, K.J.W. (1943), The Nature of Psychology, ed. by S.L. Sherwood, Cambridge University
Press, Cambridge.
Crevier, D. (1993), AI. The Tumultuous History of the Search for Artificial Intelligence, Basic
Books, New York.
Datteri E. e Tamburrini G. (2007), Biorobotic experiments for the discovery of biological
mechanisms, Philosophy of Science 74, pp. 409-430.
Datteri E. e Tamburrini G. (2012), Robotic weapons and democratic decision-making, in Hilgendorf
E. e Günther J-Ph (a cura di), Robotik und Gesetzgebung, Nomos Verlagsgesellschaft, Baden
Baden, in corso di stampa.
Dennett, D.C. (1996), Kinds of Minds, Basic Books, New York.
Galison, P. (1997), Image and logic. A material culture of microphysics, University of Chicago
Press, Chicago, ill.
Gandy, R. O. (1996), Human versus mechanical intelligence, in Millican P. e Clark A. (a cura di),
Machines and Thought, Clarendon Press, Oxford, pp. 125-136.
Hodges, A. (1983), Alan Turing: the Enigma, Simon and Schuster, New York.
Hofstadter D.R. (1979), Gödel, Escher, Bach: An Eternal Golden Braid, Basic Books. Trad. it. a
cura di G. Trautteur, Gödel, Escher, Bach: un’Eterna Ghirlanda Brillante, Adephi, Milano,
1984)Holton G. (1973), Thematic origins of scientific thought: Kepler to Einstein, Harvard
University Press, Cambridge, MA.
Hull, C.L. (1935), The mechanism of the assembly of behavior segments in novel combinations
suitable for problem solution, Psychological Review, 42: 219-245.
Hull, C.L. e Baernstein, H.D. (1929), A mechanical parallel to the conditioned reflex, Science, 70:
14-15.
Kuhn, Th. S. (2012), The structure of scientific revolutions, 50th Anniversary Edition, The
University of Chicago Press, Chicago, Ill. Prima edizione 1962, trad. it. La struttura delle
rivoluzioni scientifiche, Einaudi, Torino 1969.
Lakatos, I. (1970), Falsification and the methodology of scientific research programmes, in Worrall
J. e Currie G. (a cura di), Philosophical Papers, vol. I, Cambridge UP, 1978. Trad. it. in I.
Lakatos, La metodologia dei programmi di ricerca scientifici, a cura di M. Motterlini, Il
Saggiatore, Milano 1996.
Laudan, L. (1977), Progress and its problems. Toward a theory of scientific growth, University of
California Press, Berkeley. Trad. it. Il progresso scientifico, Armando, Roma, 1979.
Lambrinos, D., Möller, R., Labhart, T., Pfeifer, R., Wehner, R. (2000). A mobile robot employing
insect strategies for navigation. Robotics and Autonomous Systems, 30: 39-64.
Langton, C.G. (a cura di) (1989), Artificial Life, Addison-Wesley, Reading, Mass.
Lenat, D.B. e Feigenbaum, E.A. (1991), On the thresholds of knowledge, Artificial Intelligence, 47:
185-250.
MacKay, D.M. (1952), Mentality in machines, Proceedings of the Aristotelian Society,
Supplements, 26: 61-86.
Mayr E. (1982). The growth of biological thought: diversity, evolution, and inheritance. Belknap
Press, Cambridge, MA. Trad. it. Storia del pensiero biologico: diversità, evoluzione, eredità,
Bollati Boringhieri, Torino, 1990.
Mecacci, L. (1992), Storia della psicologia del Novecento, Laterza, Roma.
Newell, A. (1982), The knowledge level, Artificial Intelligence, 18: 87-127.
Newell, A. (1990), Unified Theories of Cognition, Harvard University Press, Cambridge, Mass.
Numerico T. (2005), Alan Turing e l’intelligenza delle macchine, Milano, Franco Angeli.
31
Paige J.M. and Simon H.A. (1966). Cognitive processes in solving algebra word problems. In B.
Kleinmuntz (Ed.), Problem Solving. New York: Wiley.
Pylyshyn Z.W. (1984), Computation and cognition. Toward a foundation for cognitive science,
Cambridge, Mass., The MIT Press.
Pylyshyn, Z.W. (1984), Computation and Cognition. Toward a Foundation for Cognitive Science,
MIT Press, Cambridge, Mass.
Rashevsky, N. (1931), Possible brain mechanisms and their physical models, Journal of General
Psychology, 5: 368-406.
Rosenblueth, A., e Wiener, N. (1945), The role of models in science, in «Philosophy of Science»,
12, pp. 316-321 [trad. it. Il ruolo dei modelli nella scienza, in V. Somenzi e R. Cordeschi
(1994)].
Rosenblueth, A., Wiener, N., e Bigelow, J. (1943), Behavior, purpose and teleology, in «Philosophy
of Science», 10, pp. 18-24 [trad. it. Comportamento, scopo e teleologia, in V. Somenzi e R.
Cordeschi (1994)].
Ross, T. (1935), Machines that think. A further statement, Psychological Review, 42: 387-393.
Ross, T. (1938), The synthesis of intelligence. Its implications, Psychological Review, 45: 185-189.
Shah U. (2011), Turing's misunderstood imitationgame and IBM Watson's success, AISB 2011
Convention, York (UK).
Simon H.A. (1973), Does scientific discovery have a logic? Philosophy of Science 40:471-480
Simon, H.A. (1969), The sciences of the artificial, MIT Press Cambridge, Mass. [trad. it. della II ed.
1981, Le scienze dell'artificiale, Il Mulino, Bologna 1988].
Somenzi V. (1968), Aspetti filosofici del problema della intelligenza artificiale Atti del Convegno
sul tema: L'automazione elettronica e le sue implicazioni scientifiche, tecniche e sociali, Roma,
Accademia nazionale dei Lincei, Quaderno n. 110, 227-232
Somenzi, V. e Cordeschi, R. (a cura di) (1994), La filosofia degli automi. Origini dell'Intelligenza
Artificiale, Bollati Boringhieri, Torino.
Steels, L. (1995), Building agents out of autonomous systems, in L. Steels and R. Brooks (eds.),
The Artificial Life Route to Artificial Intelligence: Building Embodied, Situated Agents,
Erlbaum, Hillsdale, N.J.: 83-121.
Tamburrini, G. (1997), Mechanistic Theories in Cognitive Science: the import of Turing's Thesis, in
Dalla Chiara M. L. et al. (a cura di), Logic and Scientific Methods, Kluwer, Dordrecht, pp. 239-
257.
Tamburrini, G. (2002), I matematici e le machine intelligenti, Bruno Mondadori, Milano.
Tamburrini G. e Datteri E. (2005), Machine experiments and theoretical modelling: from cybernetic
methodology to neuro-robotics, Minds and machines 15, 335-358.
Trautteur, G. (a cura di) (1995), Consciousness: distinction and reflection, Bibliopolis, Napoli.
Trautteur, G. e Tamburrini G. (2007), A note on discreteness and virtuality in analog computing,
Theoretical Computer Science 371, pp.106-114.
Turing, A.M. (1936-37), On computable numbers, with an application to the
Entscheidungsproblem, Proceeding of the London Mathematical Society (2nd series), 42: 230-
265; 43: 544.
Turing, A. M. (1948), Intelligent machinery, in D.C. Ince (a cura di) Mechanical Intelligence, vol.
III of the Collected Works of A. M. Turing, North-Holland, Amsterdam, 1992, pp. 107-131.
Trad. it. in Turing A. M., Intelligenza meccanica, a cura di G. Lolli, Bollati Boringhieri,
Torino, 1994.
Turing, A.M. (1950), Computing machinery and intelligence, in «Mind», 59, pp. 433-460, trad. it.
Macchine calcolatrici e intelligenza, in V. Somenzi e R. Cordeschi (a cura di), La filosofia
degli automi. Origini dell'Intelligenza Artificiale, Bollati Boringhieri, Torino, 1994, pp. 166-
193.
Turing, A.M. (1951), Can digital computers think?, in Copeland B.J. (2004), trad. it. I calcolatori
digitali possono pensare?, in Sistemi Intelligenti, 10, 1998, pp. 21-26.
32
Turing, A. M. (1953), Digital computers applied to games, in D.C. Ince (a cura di) Mechanical
Intelligence, vol. III of the Collected Works of A. M. Turing, North-Holland, Amsterdam, 1992,
pp. 161-185.
van Gelder, T. (1995), What might cognition be, if not computation, Journal of Philosophy, 91:
345-381.
Wiener, N. (1948), Cybernetics, or control and communication in the animal and the machine, MIT
Press, Cambridge, Mass. Trad. it. della II ed. 1961, Cibernetica: il controllo e la
comunicazione nell'animale e nella macchina, Il Saggiatore, Milano 1968.