Publications d'OpenAI sur la manière d'assurer la sécurité de l'IA : une réglementation gouvernementale est nécessaire-IA-php.cn

Maison

Périphériques technologiques

Publications d'OpenAI sur la manière d'assurer la sécurité de l'IA : une réglementation gouvernementale est nécessaire

王林

Apr 07, 2023 pm 07:01 PM

chatgpt openai

Publications d'OpenAI sur la manière d'assurer la sécurité de l'IA : une réglementation gouvernementale est nécessaire

News le mercredi 6 avril, heure locale des États-Unis, OpenAIa publié un article détaillant ses méthodes pour assurer la sécurité de l'IA, notamment la réalisation d'évaluations de sécurité et l'amélioration des sauvegardes après la publication. , et protection des enfants et respect de la vie privée, etc. L’entreprise a déclaré qu’il était essentiel de garantir que les systèmes d’IA soient construits, déployés et utilisés en toute sécurité pour réaliser sa mission.

Voici le texte intégral de l'article d'OpenAI :

OpenAI s'engage à garantir une sécurité renforcée de l'IA qui profite au plus grand nombre. Nous savons que nos outils d’IA apportent aujourd’hui beaucoup d’aide aux gens. Des utilisateurs du monde entier nous ont signalé que ChatGPT les aidait à améliorer leur productivité, à renforcer leur créativité et à offrir une expérience d'apprentissage sur mesure. Mais nous reconnaissons également que, comme pour toute technologie, ces outils comportent de réels risques. C'est pourquoi nous travaillons dur pour garantir la sécurité à tous les niveaux du système.

Créer un IA système

Avant de lancer un nouveau système d'IA, nous effectuons des tests rigoureux, sollicitons l'avis d'experts externes et utilisons manuellement des techniques telles que l'apprentissage par renforcement des commentaires. pour améliorer les performances du modèle. Dans le même temps, nous avons également mis en place de vastes systèmes de sécurité et de surveillance.

Prenons l'exemple de notre dernier modèle GPT-4. Après avoir terminé la formation, nous avons effectué des tests à l'échelle de l'entreprise pendant 6 mois maximum pour nous assurer qu'il était plus sécurisé et plus fiable avant sa sortie publique.

Nous pensons que les systèmes d'intelligence artificielle puissants doivent faire l'objet d'évaluations de sécurité rigoureuses. Une réglementation est nécessaire pour garantir une adoption généralisée de cette pratique. C’est pourquoi nous nous engageons activement avec les gouvernements pour discuter de la meilleure forme de réglementation.

Apprenez de l'utilisation réelle et améliorez les garanties

Nous faisons de notre mieux pour prévenir les risques prévisibles avant le déploiement du système, mais l'apprentissage en laboratoire est toujours limité. Nous effectuons des recherches et des tests approfondis, mais nous ne pouvons pas prédire comment les gens pourraient utiliser notre technologie ou en faire un mauvais usage. Par conséquent, nous pensons que l’apprentissage de l’utilisation réelle est un élément essentiel dans la création et la publication de systèmes d’IA de plus en plus sécurisés.

Nous publions soigneusement et progressivement de nouveaux systèmes d'IA, avec des garanties substantielles en place, et continuons à nous améliorer en fonction des leçons que nous apprenons.

Nous fournissons les modèles les plus puissants dans nos propres services et API afin que les développeurs puissent intégrer la technologie directement dans leurs applications. Cela nous permet de surveiller et de prendre des mesures en cas d'abus et d'élaborer des réponses. De cette façon, nous pouvons prendre des mesures pratiques au lieu de simplement imaginer comment y faire face en théorie.

L'expérience de l'utilisation réelle nous a également amené à développer des politiques de plus en plus granulaires pour lutter contre les comportements qui présentent des risques réels pour les personnes, tout en permettant à notre technologie d'être utilisée de manière plus bénéfique.

Nous pensons que la société a besoin de plus de temps pour s'adapter à une intelligence artificielle de plus en plus puissante et que toutes les personnes concernées devraient avoir leur mot à dire dans le développement futur de l'intelligence artificielle. Le déploiement itératif aide les différentes parties prenantes à engager plus efficacement des conversations sur les technologies d’IA, et il est essentiel d’avoir une expérience directe de l’utilisation de ces outils.

Protéger les enfants

L'un des axes de notre travail en matière de sécurité est la protection des enfants. Nous exigeons que les personnes utilisant nos outils d'intelligence artificielle soient âgées de 18 ans ou plus, ou de 13 ans ou plus avec le consentement de leurs parents. Actuellement, nous travaillons sur la fonctionnalité de vérification.

Nous n'autorisons pas l'utilisation de notre technologie pour générer du contenu haineux, harcelant, violent ou adulte. Le dernier GPT-4 est 82 % moins susceptible de répondre aux demandes de contenu restreint que le GPT-3.5. Nous disposons de systèmes robustes pour surveiller les abus. GPT-4 est désormais disponible pour les abonnés de ChatGPT Plus, et nous espérons permettre à davantage de personnes d'en faire l'expérience au fil du temps.

Nous avons pris des mesures importantes pour minimiser le potentiel de nos modèles de produire du contenu préjudiciable aux enfants. Par exemple, lorsqu'un utilisateur tente de télécharger du matériel abusif sans danger pour les enfants sur notre outil de génération d'images, nous le bloquons et signalons le problème au Centre national pour les enfants disparus et exploités.

En plus de la protection de sécurité par défaut, nous travaillons avec des organisations de développement telles que l'organisation à but non lucratif Khan Academy pour adapter les mesures de sécurité à leurs besoins. Khan Academy a développé un assistant d'intelligence artificielle qui peut servir de tuteur virtuel pour les étudiants et d'assistant de classe pour les enseignants. Nous travaillons également sur des fonctionnalités qui permettent aux développeurs de définir des normes plus strictes pour la sortie des modèles afin de mieux prendre en charge les développeurs et les utilisateurs qui ont besoin de telles fonctionnalités.

Respectez la confidentialité

Nos grands modèles linguistiques sont formés sur un vaste corpus de texte, y compris du contenu accessible au public, du contenu sous licence et du contenu généré par des réviseurs humains. Nous n'utilisons pas ces données pour vendre nos services ou notre publicité, ni pour créer des profils. Nous utilisons simplement ces données pour améliorer la capacité de nos modèles à aider les gens, par exemple en rendant ChatGPT plus intelligent en ayant davantage de conversations avec les gens.

Bien qu'une grande partie de nos données de formation incluent des informations personnelles disponibles sur le Web public, nous souhaitons que nos modèles apprennent à connaître le monde dans son ensemble, et non les individus. Par conséquent, nous nous engageons à supprimer les informations personnelles des ensembles de données de formation lorsque cela est possible, à affiner les modèles pour refuser les demandes de requête d'informations personnelles et à répondre aux demandes des individus visant à supprimer leurs informations personnelles de nos systèmes. Ces mesures minimisent la probabilité que notre modèle génère des réponses contenant des informations personnelles.

Amélioration de la précision factuelle

Les grands modèles linguistiques d'aujourd'hui peuvent prédire les prochains mots susceptibles d'être utilisés en fonction des modèles précédents et du texte saisi par l'utilisateur. Mais dans certains cas, le mot suivant le plus probable peut en réalité être factuellement incorrect.

L'amélioration de l'exactitude factuelle est l'un des objectifs d'OpenAI et de nombreux autres organismes de recherche en IA, et nous progressons. Nous avons amélioré l'exactitude factuelle de GPT-4 en tirant parti des commentaires des utilisateurs sur les résultats de ChatGPT qui ont été signalés comme incorrects en tant que source de données principale. Par rapport au GPT-3.5, le GPT-4 est plus susceptible de produire un contenu factuel, avec une amélioration de 40 %.

Nous nous efforçons d'être aussi transparents que possible lorsque les utilisateurs s'inscrivent pour utiliser l'outil afin d'éviter d'éventuelles réponses incorrectes de ChatGPT. Cependant, nous avons reconnu qu’il reste encore du travail à faire pour réduire davantage le risque de malentendu et sensibiliser le public aux limites actuelles de ces outils d’IA.

Recherche et engagement continus

Nous pensons qu'un moyen pratique de résoudre le problème de la sécurité de l'IA consiste à investir plus de temps et de ressources dans des techniques efficaces d'atténuation et d'étalonnage et à cibler les situations du monde réel où elles peuvent être utilisées à mauvais escient pour tester.

Il est important de noter que nous pensons que l’amélioration de la sécurité et des capacités de l’IA doit se faire simultanément. Notre meilleur travail de sécurité à ce jour a été réalisé en travaillant avec nos modèles les plus performants, car ils suivent mieux les instructions de l'utilisateur et sont plus faciles à exploiter ou à « guider ».

Nous créerons et déploierons des modèles plus performants avec une prudence croissante, et continuerons à renforcer les précautions de sécurité à mesure que les systèmes d'IA évoluent.

Bien que nous ayons attendu plus de 6 mois pour déployer GPT-4 afin de mieux comprendre ses capacités, ses avantages et ses risques, l'amélioration de la sécurité des systèmes d'IA peut parfois prendre plus de temps. Par conséquent, les décideurs politiques et les développeurs d’IA doivent veiller à ce que le développement et le déploiement de l’IA soient efficacement réglementés à l’échelle mondiale afin que personne ne prenne de raccourcis pour garder une longueur d’avance. Il s’agit d’un défi difficile qui nécessite une innovation technologique et institutionnelle, mais nous sommes désireux d’y contribuer.

Résoudre les problèmes de sécurité de l’IA nécessitera également un débat, une expérimentation et un engagement approfondis, notamment en fixant des limites au comportement des systèmes d’IA. Nous avons encouragé et continuerons de promouvoir la collaboration et le dialogue ouvert entre les parties prenantes afin de créer un écosystème d’IA plus sûr.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Repo: Comment relancer ses coéquipiers

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Comment obtenir des graines géantes

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Combien de temps faut-il pour battre Split Fiction?

3 Il y a quelques semaines By DDD

R.E.P.O. Enregistrer l'emplacement du fichier: où est-il et comment le protéger?

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7332

Tutoriel Java

1627

Tutoriel CakePHP

1351

Tutoriel Laravel

1262

Tutoriel PHP

1209

Afficher plus

Related knowledge

ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne Aug 09, 2024 pm 09:37 PM

Le DALL-E 3 a été officiellement introduit en septembre 2023 en tant que modèle considérablement amélioré par rapport à son prédécesseur. Il est considéré comme l’un des meilleurs générateurs d’images IA à ce jour, capable de créer des images avec des détails complexes. Cependant, au lancement, c'était exclu

Choisir le modèle d'intégration qui correspond le mieux à vos données : un test comparatif des intégrations multilingues OpenAI et open source Feb 26, 2024 pm 06:10 PM

OpenAI a récemment annoncé le lancement de son modèle d'intégration de dernière génération, embeddingv3, qui, selon eux, est le modèle d'intégration le plus performant avec des performances multilingues plus élevées. Ce lot de modèles est divisé en deux types : les plus petits text-embeddings-3-small et les plus puissants et plus grands text-embeddings-3-large. Peu d'informations sont divulguées sur la façon dont ces modèles sont conçus et formés, et les modèles ne sont accessibles que via des API payantes. Il existe donc de nombreux modèles d'intégration open source. Mais comment ces modèles open source se comparent-ils au modèle open source open source ? Cet article comparera empiriquement les performances de ces nouveaux modèles avec des modèles open source. Nous prévoyons de créer une donnée

Un nouveau paradigme de programmation, quand Spring Boot rencontre OpenAI Feb 01, 2024 pm 09:18 PM

En 2023, la technologie de l’IA est devenue un sujet brûlant et a un impact énorme sur diverses industries, notamment dans le domaine de la programmation. Les gens sont de plus en plus conscients de l’importance de la technologie de l’IA, et la communauté Spring ne fait pas exception. Avec l’évolution continue de la technologie GenAI (Intelligence Artificielle Générale), il est devenu crucial et urgent de simplifier la création d’applications dotées de fonctions d’IA. Dans ce contexte, « SpringAI » a émergé, visant à simplifier le processus de développement d'applications fonctionnelles d'IA, en le rendant simple et intuitif et en évitant une complexité inutile. Grâce à « SpringAI », les développeurs peuvent plus facilement créer des applications dotées de fonctions d'IA, ce qui les rend plus faciles à utiliser et à exploiter.

L'éditeur Zed basé sur Rust est open source, avec prise en charge intégrée d'OpenAI et GitHub Copilot Feb 01, 2024 pm 02:51 PM

Auteur丨Compilé par TimAnderson丨Produit par Noah|51CTO Technology Stack (WeChat ID : blog51cto) Le projet d'éditeur Zed est encore en phase de pré-version et a été open source sous licences AGPL, GPL et Apache. L'éditeur offre des performances élevées et plusieurs options assistées par l'IA, mais n'est actuellement disponible que sur la plate-forme Mac. Nathan Sobo a expliqué dans un article que dans la base de code du projet Zed sur GitHub, la partie éditeur est sous licence GPL, les composants côté serveur sont sous licence AGPL et la partie GPUI (GPU Accelerated User) l'interface) adopte la Licence Apache2.0. GPUI est un produit développé par l'équipe Zed

Chatgpt peut-il être utilisé en Chine ? Mar 05, 2024 pm 03:05 PM

chatgpt peut être utilisé en Chine, mais ne peut pas être enregistré, ni à Hong Kong et Macao. Si les utilisateurs souhaitent s'inscrire, ils peuvent utiliser un numéro de téléphone mobile étranger pour s'inscrire. Notez que lors du processus d'enregistrement, l'environnement réseau doit être basculé vers. une adresse IP étrangère.

Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible Jul 19, 2024 am 01:29 AM

Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère

Comment installer chatgpt sur un téléphone mobile Mar 05, 2024 pm 02:31 PM

Étapes d'installation : 1. Téléchargez le logiciel ChatGTP depuis le site officiel ou la boutique mobile de ChatGTP ; 2. Après l'avoir ouvert, dans l'interface des paramètres, sélectionnez la langue chinoise 3. Dans l'interface de jeu, sélectionnez le jeu homme-machine et définissez la langue. Spectre chinois ; 4. Après avoir démarré, entrez les commandes dans la fenêtre de discussion pour interagir avec le logiciel.

N'attendez pas OpenAI, attendez qu'Open-Sora soit entièrement open source Mar 18, 2024 pm 08:40 PM

Il n'y a pas si longtemps, OpenAISora est rapidement devenu populaire grâce à ses étonnants effets de génération vidéo. Il s'est démarqué parmi la foule de modèles vidéo littéraires et est devenu le centre d'attention mondiale. Suite au lancement du processus de reproduction d'inférence de formation Sora avec une réduction des coûts de 46 % il y a 2 semaines, l'équipe Colossal-AI a entièrement open source le premier modèle de génération vidéo d'architecture de type Sora au monde "Open-Sora1.0", couvrant l'ensemble processus de formation, y compris le traitement des données, tous les détails de la formation et les poids des modèles, et joignez-vous aux passionnés mondiaux de l'IA pour promouvoir une nouvelle ère de création vidéo. Pour un aperçu, jetons un œil à une vidéo d'une ville animée générée par le modèle « Open-Sora1.0 » publié par l'équipe Colossal-AI. Ouvrir-Sora1.0

See all articles