Ces derniers jours, cela peut être décrit comme une « période mouvementée » pour OpenAI.
En raison des problèmes de sécurité que ChatGPT et GPT-4 peuvent causer, OpenAI a reçu des critiques et des obstructions de la part du monde extérieur :
Ces événements montrent que même si l'IA s'est avérée avoir la capacité d'apporter de nombreux avantages à la société humaine ; , la technologie est toujours une arme à double tranchant , entraînera également de réels risques pour la société humaine, et l'IA ne fait pas exception.
Le 6 avril, OpenAI a officiellement publié un article de blog intitulé « Notre approche de la sécurité de l'IA », qui explique comment « construire, déployer et utiliser en toute sécurité des systèmes d'intelligence artificielle ».
OpenAI s'engage à maintenir une intelligence artificielle forte sûre et largement bénéfique (pour la société humaine). Nos outils d’IA offrent de nombreux avantages aux gens d’aujourd’hui.
Des utilisateurs du monde entier nous disent que ChatGPT les aide à augmenter leur productivité, à améliorer leur créativité et à offrir une expérience d'apprentissage sur mesure.
Nous reconnaissons également que, comme toute technologie, ces outils comportent des risques réels. Nous travaillons donc dur pour garantir que la sécurité est intégrée à nos systèmes à tous les niveaux.
1. Construire des systèmes d'intelligence artificielle de plus en plus sécurisés
Avant de publier un nouveau système, nous effectuerons des tests rigoureux, impliquerons des experts externes dans les commentaires, nous efforcerons d'améliorer le comportement du modèle en utilisant des techniques telles que l'apprentissage par renforcement avec retour humain et établirons des systèmes de sécurité et de surveillance étendus.
Par exemple, après la formation de notre dernier modèle, GPT-4, tout notre personnel a passé plus de 6 mois à le rendre plus sécurisé et plus cohérent avant sa sortie publique.
Nous pensons que les systèmes d'intelligence artificielle puissants doivent faire l'objet d'évaluations de sécurité rigoureuses. Une réglementation est nécessaire pour garantir l’adoption de cette pratique, et nous travaillons activement avec le gouvernement pour explorer la meilleure forme que pourrait prendre cette réglementation.
2. Apprendre de l'utilisation réelle pour améliorer les garanties
Nous nous efforçons de prévenir les risques prévisibles avant le déploiement, cependant, il y a des limites à ce que nous pouvons apprendre en laboratoire. Malgré des recherches et des tests approfondis, nous ne pouvons pas prédire toutes les manières bénéfiques dont les gens utiliseront notre technologie, ni toutes les manières dont ils en feront un mauvais usage. C’est pourquoi nous pensons que l’apprentissage tiré d’une utilisation concrète est un élément clé pour créer et publier des systèmes d’IA de plus en plus sécurisés au fil du temps.
Avec de nombreuses garanties en place, nous publions soigneusement et progressivement de nouveaux systèmes d'IA, en les diffusant auprès d'une population en constante expansion et en les améliorant continuellement en fonction de ce que nous apprenons.
Nous proposons nos modèles les plus performants via nos propres services et API afin que les développeurs puissent utiliser cette technologie directement dans leurs applications. Cela nous permet de surveiller et de prendre des mesures contre les abus et d'élaborer continuellement des mesures d'atténuation pour les manières réelles dont les gens abusent de nos systèmes, et pas seulement des théories sur ce à quoi pourraient ressembler les abus.
L'utilisation dans le monde réel nous a également conduit à développer des politiques de plus en plus nuancées pour prévenir les comportements qui présentent de réels risques pour les personnes, tout en permettant de nombreuses utilisations bénéfiques de notre technologie.
Fondamentalement, nous pensons que la société doit avoir le temps de se mettre à jour et de s'adapter à une IA de plus en plus performante, et que toutes les personnes concernées par cette technologie devraient avoir un intérêt dans le développement ultérieur de la voix importante de l'IA. Le déploiement itératif nous aide à impliquer les différentes parties prenantes dans des conversations sur l'adoption des technologies d'IA plus efficacement qu'elles ne le feraient si elles n'avaient pas expérimenté ces outils directement.
3. Protéger les enfants
Un aspect clé de la sécurité est la protection des enfants. Nous exigeons que les personnes utilisant nos outils d'IA soient âgées de 18 ans ou plus, ou de 13 ans ou plus avec l'autorisation parentale, et nous travaillons sur des options de vérification.
Nous n'autorisons pas l'utilisation de notre technologie pour générer du contenu haineux, harcelant, violent ou pour adultes, entre autres catégories (préjudiciables). Notre dernier modèle, GPT-4, a un taux de réponse inférieur de 82 % pour les demandes de contenu non autorisées par rapport à GPT-3.5, et nous avons construit un système robuste pour surveiller les abus. GPT-4 est désormais disponible pour les utilisateurs de ChatGPT Plus et nous espérons le rendre accessible à davantage de personnes au fil du temps.
Nous déployons beaucoup d'efforts pour minimiser la probabilité que nos modèles produisent du contenu préjudiciable aux enfants. Par exemple, lorsqu'un utilisateur tente de télécharger du matériel abusif sans danger pour les enfants sur notre outil d'image, nous bloquons l'action et la signalons au Centre national pour les enfants disparus et exploités.
En plus de nos garde-fous de sécurité par défaut, nous travaillons avec des développeurs comme l'association à but non lucratif Khan Academy -- qui a créé un assistant basé sur l'IA qui sert à la fois de tuteur virtuel pour les étudiants et d'assistant de classe pour les enseignants -- Personnalisez les mesures de sécurité pour leur utilisation. cas. Nous développons également des fonctionnalités qui permettront aux développeurs de définir des normes plus strictes pour la sortie des modèles afin de mieux prendre en charge les développeurs et les utilisateurs qui souhaitent cette fonctionnalité.
4. Respecter la confidentialité
Notre grand modèle linguistique est formé sur un vaste corpus de texte, y compris du contenu public autorisé, ainsi que du contenu généré par des réviseurs humains. Nous n'utilisons pas de données pour vendre nos services, nos publicités ou créer des profils sur des personnes, nous utilisons des données pour rendre nos modèles plus utiles aux gens. ChatGPT, par exemple, améliore les capacités en formant davantage les personnes aux conversations avec lui.
Bien que certaines de nos données de formation incluent des informations personnelles sur l'Internet public, nous souhaitons que nos modèles découvrent le monde, pas le monde privé. Par conséquent, nous nous efforçons de supprimer les informations personnelles des ensembles de données de formation lorsque cela est possible, d'affiner nos modèles pour refuser les demandes d'informations privées et de répondre aux demandes des individus souhaitant que leurs informations personnelles soient supprimées de nos systèmes. Ces étapes minimisent la possibilité que notre modèle produise un contenu contenant des informations privées.
5. Améliorer la précision factuelle
Les grands modèles linguistiques prédisent et génèrent la prochaine séquence de mots en fonction des modèles qu'ils ont vus auparavant, y compris la saisie de texte fournie par l'utilisateur. Dans certains cas, le mot suivant le plus probable peut ne pas être factuellement exact.
Améliorer l'exactitude factuelle est une tâche importante pour OpenAI et de nombreux autres développeurs d'IA, et nous progressons. En tirant parti des commentaires des utilisateurs sur les sorties ChatGPT qui ont été signalées comme incorrectes en tant que source de données principale.
Nous reconnaissons qu'il reste encore beaucoup de travail à faire pour réduire davantage le risque d'hallucinations et sensibiliser le public aux limites actuelles de ces outils d'IA.
6. Recherche et engagement en cours
Nous pensons qu'un moyen pratique de répondre aux problèmes de sécurité de l'IA consiste à investir plus de temps et de ressources dans la recherche de techniques d'atténuation et de réglage efficaces et à les tester contre les abus du monde réel.
Il est important de noter que nous pensons que l’amélioration de la sécurité et des capacités de l’IA doit aller de pair. À ce jour, notre meilleur travail en matière de sécurité a consisté à travailler avec nos modèles les plus performants, car ils suivent mieux les instructions de l'utilisateur et sont plus faciles à guider ou à « coacher ».
Nous serons de plus en plus prudents à mesure que des modèles plus performants seront créés et déployés, et nous continuerons à renforcer les précautions de sécurité à mesure que nos systèmes d'IA se développent.
Bien que nous ayons attendu plus de 6 mois pour déployer GPT-4 afin de mieux comprendre ses capacités, ses avantages et ses risques, cela peut parfois prendre plus de temps pour améliorer la sécurité des systèmes d'IA. Par conséquent, les décideurs politiques et les fournisseurs d’IA devront veiller à ce que le développement et le déploiement de l’IA soient gérés efficacement à l’échelle mondiale et que personne ne « rogne sur les raccourcis » afin de réussir le plus rapidement possible. Il s’agit d’un défi difficile qui nécessite une innovation technologique et institutionnelle, mais c’est aussi une contribution que nous sommes impatients d’apporter.
Résoudre les problèmes de sécurité nécessite également un débat, une expérimentation et un engagement généralisés, notamment sur les limites du comportement des systèmes d’IA. Nous avons encouragé et continuerons de promouvoir la collaboration et le dialogue ouvert entre les parties prenantes afin de créer un écosystème d’IA sûr.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!