Els Límits de la Intel·ligència Artificial segons Hubert L. Dreyfus 1972



El 1972, quan els ordinadors encara omplien sales senceres i la intel·ligència artificial estava en la seva infància més optimista, Hubert L. Dreyfus va publicar una crítica devastadora que va sacsejar els fonaments de la disciplina nascent. «What Computers Can’t Do: A Critique of Artificial Reason» no era simplement una crítica tècnica, sinó una reflexió filosòfica profunda sobre la naturalesa mateixa de la intel·ligència.

Ara, més de 50 anys després, en plena era dels models de llenguatge com ChatGPT, la visió computacional avançada i els sistemes d’aprenentatge automàtic, moltes de les intuïcions de Dreyfus continuen sent sorprenentment rellevants. Aquest article analitza les idees centrals d’aquell llibre visionari i examina com les seves prediccions i advertències es relacionen amb la intel·ligència artificial contemporània.

T’has preguntat alguna vegada per què les màquines, malgrat els seus impressionants avenços actuals, encara no poden replicar completament la intel·ligència humana? La resposta podria trobar-se en les pàgines d’aquest llibre de fa mig segle, on Dreyfus va oferir una explicació que continua desafiant els investigadors d’avui dia.

PD: L’anàlisi del llibre s’ha fet amb l’ajuda de https://notebooklm.google.com/, que ha servit per entendre i extreure el contingut.

Qui era Hubert L. Dreyfus i la seva Crítica a la IA

Hubert Dreyfus va ser un filòsof americà que va desafiar els fonaments mateixos de la intel·ligència artificial quan aquesta disciplina estava en els seus primers passos. La seva crítica no era simplement tècnica, sinó fonamentalment filosòfica, qüestionant si els ordinadors digitals podrien arribar a simular genuïnament la intel·ligència humana.

El Context Històric del Llibre «What Computers Can’t Do»

Publicat inicialment el 1972, aquest llibre va sorgir després d’una dècada d’observació crítica dels progressos i fracassos de la IA. Dreyfus va ser testimoni de com les promeses grandiloqüents dels primers investigadors de la IA no es materialitzaven, i va decidir analitzar sistemàticament per què això passava.

El llibre va generar una considerable controvèrsia en la comunitat científica. Alguns el van considerar un atac destructiu, mentre que altres el van veure com una crítica necessària que podia ajudar la disciplina a madurar i trobar direccions més realistes.

Deu Anys de Fracassos en la Recerca d’Intel·ligència Artificial (1957-1967)

Durant aquesta dècada crucial, la recerca en IA va seguir un patró descoratjador: èxits inicials prometedors seguits d’estancaments inexplicables quan s’intentava escalar les solucions a problemes més complexos.

La Fal·làcia del Primer Pas Exitós

Dreyfus va identificar aquest fenomen recurrent: els investigadors aconseguien èxits impressionants en problemes simples i assumien que només era qüestió de temps i potència computacional abans de resoldre problemes molt més complexos. Era com si algú, després d’aprendre a caminar, assumís que córrer una marató seria només qüestió de fer el mateix moviment més ràpid.

Herbert Simon i Allen Newell, pioners de la IA, van fer prediccions optimistes el 1957. Van pronosticar que en deu anys un ordinador seria campió mundial d’escacs i descobriria teoremes matemàtics importants. Aquestes prediccions es van revelar prematures i inexactes.

Els Fracassos en la Traducció Automàtica

La traducció automàtica va ser un dels primers camps on l’optimisme inicial es va topar amb la realitat complexa del llenguatge humà. Els primers sistemes, basats en diccionaris mecànics, van mostrar resultats prometedors amb frases simples.

Per què la Traducció Mecànica va Fallar

El problema fonamental era que el llenguatge no és només una qüestió de substituir paraules d’un idioma per paraules d’un altre. La traducció requereix comprensió del context, coneixement del món i sensibilitat cultural. Quan una màquina havia de triar entre diferents significats d’una paraula polisèmica, no tenia manera de determinar quin era el correcte sense comprendre tot el context de la situació.

Resolució de Problemes: Límits del General Problem Solver

El General Problem Solver (GPS) de Newell i Simon era ambiciós en el seu objectiu: crear un programa capaç de resoldre qualsevol problema que pogués ser formulat de manera clara. Va tenir èxit amb problemes senzills com el famoso «problema dels caníbals i missioners», però va col·lapsar quan es va enfrontar a problemes més realistes.

Logic Theory Machine vs. Realitat Complexa

La Logic Theory Machine va poder demostrar teoremes lògics simples, però quan es tractava de problemes que requerien intuïció o comprensió del significat real, les limitacions es van fer evidents. Era com tenir una calculadora perfecta per a operacions aritmètiques però esperar que resolgués problemes de física teòrica.

Reconeixement de Patrons: El Problem dels Trets Rellevants

Els sistemes de reconeixement de patrons van aconseguir èxits impressionants en dominis molt específics, com el reconeixement de caràcters impresos amb tipus de lletra estàndard. Però quan s’intentava generalitzar aquests sistemes, apareixien limitacions fonamentals.

El problema essencial era que aquests programes no podien generar els seus propis trets rellevants. Un ésser humà pot reconèixer la lletra «A» independentment de la font, mida, inclinació o fins i tot si està parcialment oculta. Els ordinadors necessitaven que els programadors definissin prèviament quins trets havien de buscar.

Les Quatre Limitacions Humanes que els Ordinadors no Poden Simular

Dreyfus va identificar quatre formes fonamentals de processament d’informació humà que els ordinadors digitals no poden replicar mitjançant regles explícites.

Consciència Marginal vs. Cerca Heurística

Quan un jugador d’escacs expert examina un tauler, no calcula exhaustivament totes les possibles jugades. En lloc d’això, la seva atenció es «dirigeix» automàticament cap a les àrees més prometedores o problemàtiques del tauler. Una torre desprotegida «atrau» l’atenció sense necessitat de càlcul explícit.

Els ordinadors, en canvi, han d’examinar sistemàticament milers o milions de possibilitats. MacHack, el programa d’escacs de Greenblatt, havia d’analitzar 26.000 alternatives per prendre una decisió que un expert humà podia fer gairebé instantàniament.

Tolerància a l’Ambigüitat vs. Regles Tècniques

El llenguatge natural està ple d’ambigüitats que els humans resolen sense esforç conscient. Quan algú diu «estigues a prop meu», no especifica exactament què significa «a prop» – podrien ser centímetres o metres segons el context. Els humans gestionen aquesta ambigüitat naturalment, mentre que els ordinadors necessiten regles explícites per a cada situació possible.

Discriminació Essencial vs. Assaig i Error

Els humans tenen la capacitat de l'»insight» – poden veure l’estructura essencial d’un problema i centrar-se en els aspectes més importants. Aquest tipus de comprensió permet saltar directament a solucions prometedores sense haver d’explorar exhaustivament totes les alternatives.

Els programes de Newell i Simon van intentar replicar aquesta capacitat, però es van trobar amb el fet que la discriminació entre allò essencial i allò inesencial havia de ser programada prèviament pels investigadors. El programa no podia desenvolupar el seu propi sentit del que era important.

Agrupació Perspicua: La Síntesi de les Capacitats Humanes

Aquesta quarta capacitat combina les tres anteriors i és essencial per al reconeixement de patrons complexos i la comprensió del llenguatge natural. És la capacitat d’organitzar la informació de manera que reveli estructures significatives.

Els Quatre Pressupòsits Erronis de la Intel·ligència Artificial

Dreyfus va identificar quatre assumpcions filosòfiques que sustentaven l’optimisme persistent dels investigadors de IA malgrat els fracassos empírics.

El Pressupòsit Biològic: El Cervell com a Ordinador Digital

Molts investigadors assumien que, com que el cervell és un sistema físic, ha de processar informació de manera discreta, com ho fan els ordinadors digitals. Però l’evidència neurofisiològica suggereix que el cervell podria funcionar més com un ordinador analògic, on les variables físiques contínues representen la informació.

Cervell Analògic vs. Cervell Digital

En un ordinador digital, la informació es representa en bits discrets (0s i 1s). En un sistema analògic, la informació es representa mitjançant variables contínues com ara voltatges o freqüències. El cervell humà podria utilitzar la velocitat dels impulsos neuronals, la intensitat de les connexions sinàptiques i altres variables contínues per processar informació.

El Pressupòsit Psicològic: La Ment com a Programa Heurístic

Aquest pressupòsit assumeix que la ment humana opera seguint regles formals sobre bits d’informació, igual que un programa d’ordinador. Però aquest assumit es basa en una confusió sobre què significa «informació» – confon el sentit tècnic (bits sense significat) amb el significat ordinari (coneixement significatiu).

El Pressupòsit Epistemològic: Tot Coneixement és Formalitzable

Aquesta creença sosté que tot comportament intel·ligent pot ser expressat en termes de relacions lògiques o funcions booleanes. Dreyfus argumenta que el fet que la física hagi tingut èxit formalitzant els processos físics no implica que la conducta humana pugui ser completament formalitzada.

La Regressió Infinita de Regles

Un problema fonamental amb la formalització completa és que per aplicar qualsevol regla, necessitem altres regles que ens diguin com aplicar la primera regla. Això porta a una regressió infinita: regles per aplicar regles per aplicar regles, sense un punt final natural.

El Pressupòsit Ontològic: El Món com a Conjunt de Fets Atòmics

Aquesta és potser l’assumpció més profunda i problemàtica: que tot allò essencial per a la conducta intel·ligent pot ser analitzat com un conjunt d’elements determinats, independents del context i lògicament independents entre si.

Però el món humà no es compon de fets aïllats. El significat i la rellevància depenen del context i dels propòsits humans. Això genera el «problema de la gran base de dades»: com emmagatzemar i accedir a una quantitat potencialment infinita de fets rellevants?

L’Alternativa Fenomenològica de Dreyfus

Basant-se en la tradició fenomenològica (Heidegger, Merleau-Ponty), Dreyfus proposa una visió alternativa on la intel·ligència sorgeix de l’existència corporal i situada.

El Paper del Cos en la Intel·ligència

Contràriament a la tradició cartesiana que veia el cos com un obstacle, Dreyfus argumenta que el cos és indispensable per a la intel·ligència genuïna. El cos permet funcions que no es poden simular digitalment.

El cos ens permet percebre el món de manera holística, on cada objecte es percep com un tot amb parts no visibles (horitzó interior) i un context més ampli (horitzó exterior). Aquesta percepció holística evita la necessitat d’analitzar exhaustivament cada detall discret.

La Situació com a Camp de Preocupació

El món humà no és una col·lecció neutra de fets, sinó un camp estructurat pels nostres propòsits i preocupacions. Els fets que trobem ja estan organitzats i dotats de significat pel context vital en què existim.

Les Quatre Àrees de la Conducta Intel·ligent

Dreyfus classifica la conducta intel·ligent en quatre àrees segons la seva susceptibilitat a la formalització.

Àrea I: Associacionisme Elemental

Aquesta àrea inclou conductes simples on el significat i el context són irrellevants, com l’aprenentatge de síl·labes sense sentit. Aquest tipus de tasques es poden programar fàcilment.

Àrea II: Sistemes Formal-Simples

Aquí trobem problemes completament formalitzats i calculables, com la lògica algorítmica o jocs simples com el tres en ratlla. És l’àrea d’èxit inqüestionable de la IA.

Àrea III: Sistemes Formal-Complexos

Aquests problemes són formalment reproduïbles però pràcticament irresolubles a causa de la seva complexitat. Els escacs són l’exemple paradigmàtic. Requereixen programes heurístics que sovint importen conceptes problemàtics de l’Àrea IV, com el judici i la intuïció.

Àrea IV: Conducta No Formal

Aquesta àrea inclou les activitats quotidianes com l’ús del llenguatge natural, l’insight i el reconeixement de patrons complexos. Són regulars però no basades en regles explícites, i per això són impossibles de reproduir digitalment.

Implicacions per al Futur de la Intel·ligència Artificial

La crítica de Dreyfus no era destructiva sinó constructiva, apuntant cap a direccions més realistes per al desenvolupament de la IA.

Cooperació Home-Màquina: El Camí Endavant

En lloc de perseguir la substitució completa de la intel·ligència humana, Dreyfus advocava per la simbiosi entre humans i màquines. Les màquines excel·leixen en el càlcul ràpid i precís, mentre que els humans aporten la discriminació, l’insight i la capacitat de focus contextual.

Aquesta visió simbòtica s’ha demostrat profètica. Molts dels avenços més impressionants en IA avui en dia (com els sistemes d’assistència mèdica o els programes d’escacs professionals) combinen la potència computacional de les màquines amb el judici i l’experiència humans.

La recerca futura podria explorar màquines no digitals (analògiques) capaços d’operar en termes de «patrons, conceptes i similituds vagues» en lloc de regles explícites sobre elements discrets.

Preguntes Freqüents sobre la Crítica de Dreyfus

1. Els models de llenguatge com ChatGPT i Claude refuten la crítica de Dreyfus sobre la comprensió del llenguatge natural? Tot i que els LLMs actuals generen text sorprenentment coherent, segueixen operant mitjançant patrons estadístics sense comprensió genuïna del significat. Dreyfus argumentava que la comprensió requereix experiència corporal i contextual que aquests sistemes no posseeixen. Els LLMs poden «simular» comprensió però no poden experimentar l’ambigüitat de manera humana – quan diuen «estigues a prop meu», no comprenen realment què significa «a prop» en diferents contexts vivencials.

2. Com es relaciona la crítica de Dreyfus amb l’actual problema de les «al·lucinacions» en sistemes d’IA com GPT-4 o Gemini? Les al·lucinacions dels LLMs moderns validen la crítica de Dreyfus sobre la «consciència marginal». Mentre que els humans poden distingir intuïtivament entre informació fiable i dubtosa gràcies al seu «sentit perifèric» del context, els sistemes actuals generen contingut sense aquesta capacitat discriminatòria. Dreyfus hauria vist aquestes al·lucinacions com a evidència que els sistemes formals no poden replicar la capacitat humana d’avaluar la plausibilitat contextual.

3. Els sistemes de visió computacional actuals (com els de Tesla o els reconeixedors facials) superen les limitacions del «reconeixement de patrons» que Dreyfus va identificar? Els sistemes actuals han avançat significativament, però encara depenen que els engineers defineixin les característiques rellevants durant l’entrenament. Tesla Autopilot, per exemple, pot fallar en situacions inèdites perquè no pot generar nous trets rellevants com ho faria un conductor humà. Dreyfus hauria assenyalat que aquests sistemes continuen sense la «agrupació perspicua» humana que permet adaptar-se flexiblement a contextos completament nous.

4. La capacitat dels sistemes moderns com AlphaGo o Stockfish d’excel·lir en escacs i Go contradiu l’anàlisi de Dreyfus sobre els jocs estratègics? Paradoxalment, aquests èxits confirmen la taxonomia de Dreyfus. AlphaGo i Stockfish dominen l’Àrea III (sistemes formal-complexos) mitjançant força bruta computacional i aprenentatge per reforç, però segueixen sent sistemes formals. El que Dreyfus considerava impossible era l’Àrea IV – la capacitat humana d’aplicar intuïció estratègica a situacions de la vida real. Aquests sistemes no poden transferir la seva «intel·ligència» dels escacs a la resolució de conflictes interpersonals o la presa de decisions ètiques.

5. Com veuria Dreyfus els assistents d’IA actuals (Siri, Alexa, Google Assistant) en comparació amb les seves prediccions sobre cooperació home-màquina? Dreyfus hauria vist els assistents actuals com a implementacions primitives però prometedores de la seva visió simbòtica. Aquests sistemes excel·leixen en tasques computacionals específiques (càlculs, cerca d’informació, control domòtic) mentre que els humans proporcionen el context, els objectius i el judici. Tanmateix, hauria criticat la tendència a antropomorfitzar aquests assistents, recordant-nos que la seva «intel·ligència» és fonamentalment diferent de la humana i no hauria d’induir-nos a pensar que comprenen realment les nostres necessitats i emocions.

PD: L’anàlisi del llibre ha estat generat amb https://notebooklm.google.com/. Cal comprovar sempre aquests anàlisis, ja que estic fent proves amb la IA.