| 17-12-2025 (4 ) | Categoria: IA |
En la intel·ligència artificial (IA), el raonament de sentit comú és una capacitat similar a la humana per fer suposicions sobre el tipus i l'essència de situacions ordinà ries que els humans troben cada dia. Aquestes suposicions inclouen judicis sobre la naturalesa dels objectes fÃsics, les propietats taxonòmiques i les intencions de les persones. Un dispositiu que mostri raonament de sentit comú podria ser capaç de treure conclusions similars a la psicologia popular humana (la capacitat innata dels humans per raonar sobre el comportament i les intencions de les persones) i la fÃsica ingènua (la comprensió natural del món fÃsic que tenen els humans). [1]
Algunes definicions i caracteritzacions del sentit comú de diferents autors inclouen:
El professor de NYU Ernest Davis caracteritza el coneixement de sentit comú com "el que un nen tÃpic de set anys sap sobre el món", incloent-hi objectes fÃsics, substà ncies, plantes, animals i la societat humana. Normalment exclou l'aprenentatge de llibres, el coneixement especialitzat i el coneixement de convencions; Però de vegades inclou coneixements sobre aquests temes. Per exemple, saber jugar a cartes és un coneixement especialitzat, no un "coneixement de sentit comú"; Però saber que la gent juga a cartes per diversió compta com a "coneixement de sentit comú". [7]
Un sistema de cotxe autònom pot utilitzar una xarxa neuronal per determinar quines parts de la imatge semblen coincidir amb imatges d'entrenament anteriors dels vianants, i després modelar aquestes à rees com a prismes rectangulars lents però una mica imprevisibles que cal evitar.
En comparació amb els humans, la IA existent manca de diverses caracterÃstiques del raonament de sentit comú humà ; Sobretot, els humans tenim mecanismes poderosos per raonar sobre la "fÃsica ingènua" com l'espai, el temps i les interaccions fÃsiques. Això permet fins i tot als nens petits fer fà cilment inferències com ara "Si faig rodar aquest bolÃgraf d'una taula, caurà a terra". Els humans també disposen d'un mecanisme poderós de "psicologia popular" que els ajuda a interpretar frases en llenguatge natural com ara "Els regidors van negar un permÃs als manifestants perquè advocaven per la violència". (Una IA genèrica té dificultats per discernir si els que suposadament advocen per la violència són els regidors o els manifestants.)[1][8][9] Aquesta manca de "coneixement comú" fa que la IA sovint cometi errors diferents dels humans, de maneres que poden semblar incomprensibles. Per exemple, els cotxes autònoms existents no poden raonar sobre la ubicació ni les intencions dels vianants de la mateixa manera que ho fan els humans, i en canvi han d'utilitzar modes de raonament no humans per evitar accidents. [10][11][12]
Els subtemes superposats del raonament de sentit comú inclouen quantitats i mesures, temps i espai, fÃsica, ments, societat, plans i objectius, i accions i canvis. [13]
El problema del coneixement de sentit comú és un projecte actual en l'à mbit de la intel·ligència artificial per crear una base de dades que contingui el coneixement general que s'espera que la majoria de persones tingui, representat de manera accessible als programes d'intel·ligència artificial[14] que utilitzen llenguatge natural. A causa de l'ampli abast del coneixement de sentit comú, aquesta qüestió es considera un dels més difÃcils en la recerca en IA. [15] Perquè qualsevol tasca es faci com la ment humana la faria, la mà quina ha de semblar tan intel·ligent com un ésser humà . Aquestes tasques inclouen el reconeixement d'objectes, la traducció automà tica i la mineria de text. Per dur-los a terme, la mà quina ha de ser conscient dels mateixos conceptes que una persona, que posseeix coneixements de sentit comú, reconeix.
El 1961, Bar Hillel va parlar per primera vegada de la necessitat i la importà ncia del coneixement prà ctic per al processament del llenguatge natural en el context de la traducció automà tica. [16] Algunes ambigüitats es resolen utilitzant regles simples i fà cils d'obtenir. Altres requereixen un reconeixement ampli del món que l'envolta, per tant requereixen més coneixement de sentit comú. Per exemple, quan s'utilitza una mà quina per traduir un text, sorgeixen problemes d'ambigüitat que es podrien resoldre fà cilment assolint una comprensió concreta i veritable del context. Els traductors en lÃnia sovint resolen ambigüitats utilitzant paraules anà logues o similars. Per exemple, en traduir les frases "L'electricista està treballant" i "El telèfon està treballant" a l'alemany, la mà quina tradueix correctament "treballant" en el sentit de "treballant" en la primera i com a "funcionant correctament" en la segona. La mà quina ha vist i llegit en el cos de textos que les paraules alemanyes per a "treballador" i "electricista" s'utilitzen sovint en combinació i es troben molt a prop. El mateix s'aplica a "telèfon" i "funcionar correctament". Tanmateix, el proxy estadÃstic que funciona en casos simples sovint falla en casos complexos. Els programes informà tics existents realitzen tasques lingüÃstiques senzilles manipulant frases curtes o paraules separades, però no intenten una comprensió més profunda ni se centren en resultats a curt termini.
Problemes d'aquest tipus sorgeixen en la visió per computador. [1][17] Per exemple, quan es mira una fotografia d'un bany, alguns objectes petits i només parcialment visibles, com tovalloletes i ampolles, són reconeixibles pels objectes que l'envolten (và ter, pica, banyera), que suggereixen la funció de l'habitació. En una imatge aïllada serien difÃcils d'identificar.
Les pel·lÃcules resulten ser tasques encara més difÃcils. Algunes pel·lÃcules contenen escenes i moments que no es poden entendre simplement relacionant plantilles memoritzades amb imatges. Per exemple, per entendre el context de la pel·lÃcula, l'espectador ha de fer inferències sobre les intencions dels personatges i fer suposicions segons el seu comportament. En l'estat de l'art contemporani, és impossible construir i gestionar un programa que realitzi tasques com el raonament, és a dir, predir les accions dels personatges. El mà xim que es pot fer és identificar accions bà siques i seguir els personatges.
La necessitat i importà ncia del raonament de sentit comú en robots autònoms que funcionen en un entorn real i no controlat és evident. Per exemple, si un robot està programat per fer les tasques d'un cambrer en una festa de còctels, i veu que el got que havia agafat està trencat, el cambrer-robot no hauria d'abocar el lÃquid al got, sinó agafar-ne un altre. Aquestes tasques semblen òbvies quan una persona té un raonament senzill i de sentit comú, però assegurar-se que un robot eviti aquests errors és tot un repte. [1]
S'han fet progressos significatius en el camp del raonament automatitzat de sentit comú en les à rees del raonament taxonòmic, les accions i el raonament del canvi, raonant sobre el temps. Cada una d'aquestes esferes té una teoria ben reconeguda per a una à mplia gamma d'inferències de sentit comú. [18]
La taxonomia és el conjunt d'individus i categories i les seves relacions. Tres relacions bà siques són:
La transitivitat és un tipus d'inferència en la taxonomia. Com que PiolÃn és una instà ncia de pit-roig i el pit-roig és un subconjunt d'ocell, se'n dedueix que PiolÃn és una instà ncia d'ocell. L'herència és un altre tipus d'inferència. Com que PiolÃn és una instà ncia de pit-roig, que és un subconjunt d'ocell i ocell està marcat amb property canfly, se'n dedueix que PiolÃn i pit-roig tenen property canfly.
Quan un individu taxonomitza categories més abstractes, delimitar i delimitar categories especÃfiques esdevé més problemà tic. Les estructures taxonòmiques simples s'utilitzen sovint en programes d'IA. Per exemple, WordNet és un recurs que inclou una taxonomia, els elements del qual són significats de paraules angleses. Els sistemes de mineria web utilitzats per recollir coneixements de sentit comú a partir de documents web se centren en les relacions taxonòmiques i, especÃficament, en la recopilació de relacions taxonòmiques. [1]
La teoria de l'acció, els esdeveniments i el canvi és una altra gamma del raonament de sentit comú. [19] Hi ha mètodes de raonament establerts per a dominis que compleixen les restriccions que es detallen a continuació:
El raonament temporal és la capacitat de fer suposicions sobre el coneixement que tenen els humans dels temps, durades i intervals de temps. Per exemple, si una persona sap que Mozart va néixer després d'Haydn i va morir abans que ell, pot utilitzar el seu coneixement de raonament temporal per deduir que Mozart va morir abans que Haydn. Les inferències implicades es redueixen a la resolució de sistemes d'desigualtats lineals. [20]
Integrar aquest tipus de raonament amb finalitats concretes, com la interpretació del llenguatge natural, és més difÃcil, perquè les expressions del llenguatge natural tenen una interpretació dependent del context. [21] Tasques senzilles com assignar marques de temps als procediments no es poden fer amb total precisió.
El raonament qualitatiu[22] és la forma de raonament de sentit comú analitzat amb un èxit segur. S'ocupa de la direcció del canvi en quantitats interrelacionades. Per exemple, si el preu d'una acció puja, la quantitat d'accions que es vendran baixarà . Si algun ecosistema conté llops i anyells i el nombre de llops disminueix, la taxa de mortalitat dels anyells també disminuirà . Aquesta teoria va ser formulada per primera vegada per Johan de Kleer, que va analitzar un objecte que es mou en una muntanya russa.
La teoria del raonament qualitatiu s'aplica en molts à mbits com la fÃsica, la biologia, l'enginyeria, l'ecologia, etc. Serveix com a base per a molts programes prà ctics, mapatge analògic i comprensió de textos.
A partir de 2014, hi ha alguns sistemes comercials que intenten fer que l'ús del raonament de sentit comú sigui significatiu. Tanmateix, utilitzen la informació estadÃstica com a substitut del coneixement de sentit comú, on el raonament no hi és. Els programes actuals manipulen paraules individuals, però no intenten ni ofereixen una comprensió més profunda. Segons Ernest Davis i Gary Marcus, cinc grans obstacles interfereixen en la producció d'un "raonador de sentit comú" satisfactori. [1]
En comparació amb els humans, a partir de 2018 els programes informà tics existents tenen un rendiment extremadament baix en proves modernes de "raonament de sentit comú" com el Winograd Schema Challenge. [23] El problema d'assolir competència a nivell humà en tasques de "coneixement de sentit comú" es considera probablement "IA completa" (és a dir, resoldre-ho requeriria la capacitat de sintetitzar una intel·ligència a nivell humà ). [24][25] Alguns investigadors creuen que les dades d'aprenentatge supervisat són insuficients per produir una intel·ligència artificial general capaç de raonament de sentit comú, i per això han optat per tècniques d'aprenentatge menys supervisades. [26]
L'estudi de raonament de Commonsense es divideix en enfocaments basats en el coneixement i enfocaments basats en l'aprenentatge automà tic sobre i utilitzant grans corpus de dades amb interaccions limitades entre aquests dos tipus d'enfocaments. [cal citació] També hi ha enfocaments de crowdsourcing, que intenten construir una base de coneixement vinculant el coneixement col·lectiu amb l'aportació de persones no expertes. Els enfocaments basats en el coneixement es poden dividir en enfocaments basats en la lògica matemà tica. [cal citació]
En els enfocaments basats en el coneixement, els experts analitzen les caracterÃstiques de les inferències necessà ries per fer raonament en una à rea especÃfica o per a una tasca determinada. Els enfocaments basats en el coneixement consisteixen en enfocaments fonamentats en matemà tics, aproximacions informals basades en el coneixement i enfocaments a gran escala. Els enfocaments fonamentats matemà ticament són purament teòrics i el resultat és un paper imprès en lloc d'un programa. L'obra es limita a l'abast dels dominis i a les tècniques de raonament sobre les quals es reflexiona. En enfocaments informals basats en el coneixement, les teories del raonament es basen en dades anecdòtiques i intuïció que resulten de la psicologia empÃrica del comportament. Els enfocaments informals són comuns en la programació informà tica. Dues altres tècniques populars per extreure coneixement de sentit comú de documents web impliquen la mineria web i el crowd sourcing.
COMET (2019), que utilitza tant l'arquitectura del model de llenguatge OpenAI GPT com bases de coneixement de sentit comú existents com ConceptNet, afirma generar inferències de sentit comú a un nivell proper als referents humans. Com molts altres esforços actuals, COMET es basa en excés en patrons de llenguatge superficial i es considera que manca d'una comprensió profunda a nivell humà de molts conceptes de sentit comú. Altres enfocaments basats en models de llenguatge inclouen l'entrenament en escenes visuals en lloc de només text, i l'entrenament en descripcions textuals d'escenaris que impliquen fÃsica de sentit comú. [6][27]
{{cite journal}}: Cite journal requereix |journal= (ajuda)
Afegeix-hi un comentari: