L'intelligence artificielle (IA) actuelle est dans une époque merveilleuse, et des connaissances tacites étonnantes apparaissent souvent (La vengeance de Polanyi et la nouvelle romance et la connaissance tacite de l'intelligence artificielle, https://bit.ly/3qYrAOY), mais il est certain que les ordinateurs ne pourront pas accomplir cette tâche avant longtemps. Des recherches intéressantes récemment apparues portent sur les systèmes d'apprentissage à grande échelle basés sur l'architecture Transformer, basés sur de grands corpus multimodaux à l'échelle du réseau et des milliards de paramètres pour la formation. Des exemples typiques sont les grands modèles de langage, GPT3 et PALM qui répondent à des invites de texte arbitraires, les modèles de langage/image DALL-E et Imagen qui convertissent le texte en images (même les modèles avec un comportement général comme GATO).
L'émergence de modèles d'apprentissage à grande échelle a fondamentalement changé la nature de la recherche sur l'intelligence artificielle. Lorsque les chercheurs ont récemment utilisé DALL-E, ils pensaient que celui-ci semblait avoir développé son propre langage unique. Si les humains parvenaient à le maîtriser, ils pourraient peut-être mieux interagir avec DALL-E. Certains chercheurs ont également découvert que les performances de GPT3 sur les problèmes de raisonnement peuvent être améliorées en ajoutant certains sorts magiques (tels que « Pensons étape par étape ») dans l'invite. Aujourd’hui, les grands modèles d’apprentissage comme GPT3 et DALL-E sont comme des « espèces exotiques » et nous devons essayer de décoder leur comportement.
C’est certainement un étrange tournant pour l’intelligence artificielle. Depuis son émergence, l’intelligence artificielle constitue un « no man’s land » entre l’ingénierie (systèmes dotés de fonctions spécifiques) et la science (découverte des lois des phénomènes naturels). La partie scientifique de l’IA découle de ses affirmations initiales, qui étaient des connaissances sur la nature de l’intelligence humaine ; tandis que la partie ingénierie découle d’une focalisation sur les capacités intelligentes (permettant aux ordinateurs d’afficher un comportement intelligent) plutôt que sur des connaissances sur l’intelligence humaine.
Et la situation actuelle évolue rapidement, notamment l'intelligence artificielle est devenue synonyme de modèles d'apprentissage à grande échelle. Le statu quo actuel est que personne ne sait rien de la façon dont les modèles formés ont une fonction spécifique, ni même d'autres fonctions qu'ils peuvent avoir (comme la soi-disant capacité de PALM à « expliquer les blagues »). Même leurs créateurs n’ont souvent aucune idée de ce que ces systèmes peuvent faire. Explorer ces systèmes pour comprendre leur portée « fonctionnelle » est devenu une tendance récente dans la recherche en intelligence artificielle.
Il est de plus en plus clair que certaines parties de l’intelligence artificielle s’éloignent de leurs racines techniques. Aujourd’hui, il est difficile de considérer les grands systèmes d’apprentissage comme des conceptions techniques ayant des objectifs spécifiques au sens traditionnel du terme. Après tout, on ne peut pas dire que nos enfants sont « conçus ». Le domaine de l’ingénierie ne célèbre généralement pas les nouvelles propriétés inattendues des systèmes qu’il conçoit (tout comme les ingénieurs civils ne célèbrent pas avec enthousiasme lorsqu’un pont qu’ils ont conçu pour résister à un ouragan de catégorie 5 lévite).
Il est de plus en plus évident que l'étude de ces grands systèmes formés (mais non conçus) est destinée à devenir une science naturelle : observer le fonctionnement du système ; réaliser des études d'ablation ; mener une analyse qualitative des meilleures pratiques.
Considérant le fait que les apparences sont actuellement étudiées plutôt que ce qu’il y a à l’intérieur, cela s’apparente au grand objectif de « le découvrir » sans preuves réelles en biologie. L’apprentissage automatique est un effort de recherche qui se concentre davantage sur les raisons pour lesquelles un système fait ce qu’il fait (pensez-y comme si vous faisiez une étude « IRM » de grands systèmes d’apprentissage) plutôt que sur la preuve que le système a été conçu pour cela. Les connaissances acquises grâce à ces études peuvent améliorer la capacité à affiner les systèmes (tout comme en médecine). Bien entendu, l’étude des décors de surface permet une intervention plus ciblée que dans les décors internes.
L'intelligence artificielle devient une science naturelle et aura également un impact sur l'ensemble de l'informatique, sachant que l'intelligence artificielle aura un impact énorme sur presque tous les domaines informatiques. Le mot « science » en informatique a également été remis en question et ridiculisé. Mais cela a changé aujourd’hui, puisque l’intelligence artificielle est devenue une science naturelle qui étudie les systèmes d’apprentissage artificiel à grande échelle. Bien sûr, il peut y avoir beaucoup de résistances et d'opinions à cette transition, car l'informatique a longtemps été le Saint Graal du « correct par construction ». Depuis le début, l'informatique équivaut à vivre dans un système plein d'incitations. C'est aussi correct qu'un chien bien dressé, tout comme un être humain.
En 2003, Leslie Lamport, lauréate du prix Turing, a tiré la sonnette d'alarme sur la possibilité que l'avenir de l'informatique soit la biologie plutôt que la logique, affirmant que l'informatique nous permettrait de vivre dans un monde d'homéopathie et de guérison par la foi. À cette époque, son inquiétude concernait principalement les systèmes logiciels complexes programmés par des humains, plutôt que les modèles d'apprentissage à grande échelle, plus mystérieux, d'aujourd'hui.
Lorsque l’on passe d’un domaine principalement concerné par la conception intentionnelle et « la réussite par la construction » à l’exploration ou à la compréhension d’artefacts existants (non conçus), le changement méthodologique que cela entraînera mérite d’être réfléchi. Contrairement à l'étude biologique des créatures sauvages, l'intelligence artificielle étudie les artefacts artificiels créés par des humains qui manquent de « sens du design ». Des problèmes éthiques surgiront certainement lorsqu'il s'agira de créer et de déployer des artefacts artificiels qui ne sont pas compris. Il est peu probable que les grands modèles d’apprentissage soient capables de prendre en charge des capacités prouvables, que ce soit en termes d’exactitude, de transparence ou d’équité, mais il s’agit pourtant de questions cruciales lors du déploiement et de la mise en pratique de ces systèmes. Bien que les humains soient également incapables de fournir la preuve de la justesse de leurs propres décisions et actions, des systèmes juridiques existent pour les soumettre à des sanctions telles que des amendes, la censure et même l'emprisonnement. Pour les systèmes d’apprentissage à grande échelle, quels sont les systèmes équivalents ?
L'esthétique de la recherche informatique va également changer. Les chercheurs actuels peuvent évaluer les articles en fonction de la proportion d'entre eux contenant des théorèmes et des définitions. Mais à mesure que les objectifs de l’informatique ressemblent de plus en plus à ceux des sciences naturelles telles que la biologie, il devient nécessaire de développer de nouvelles méthodologies esthétiques informatiques (car le théorème zéro ne sera pas très différent du rapport de définition zéro). Certains signes indiquent que l’analyse de la complexité informatique est passée au second plan dans la recherche sur l’IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!