Table des matières
Confidentialité
Biais, toxicité, désinformation
Propriété intellectuelle (PI)
Conclusion
Maison Périphériques technologiques IA 'Technologie de génération d'images' errant à la limite du droit : cet article vous apprend à éviter de devenir 'accusé'

'Technologie de génération d'images' errant à la limite du droit : cet article vous apprend à éviter de devenir 'accusé'

Apr 11, 2023 pm 02:55 PM
ai 技术

Ces dernières années, le contenu généré par l'IA (AIGC) a attiré beaucoup d'attention. Son contenu couvre des images, du texte, de l'audio, de la vidéo, etc. Cependant, l'AIGC est devenu une arme à double tranchant et a été controversé en raison de son utilisation irresponsable. .

Une fois que la technologie de génération d'images n'est pas utilisée correctement, vous pouvez devenir un "accusé".

Récemment, des chercheurs de Sony AI et Wisdom Source ont discuté des problèmes actuels de l'AIGC sous de nombreux aspects et de la manière de rendre le contenu généré par l'IA plus responsable.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

Lien papier : https://arxiv.org/pdf/2303.01325.pdf

Cet article se concentre sur trois problèmes principaux qui peuvent entraver le développement sain de l'AIGC, notamment : ( 1)Confidentialité ; (2)préjugés, toxicité, désinformation ; (3)Propriété intellectuelle (PI)risques.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

En documentant les risques connus et potentiels, ainsi que tout scénario d'abus possible de l'AIGC, cet article vise à attirer l'attention sur les risques potentiels et les abus de l'AIGC et à fournir des orientations pour répondre à ces risques afin de promouvoir l'AIGC. se développe dans une direction plus éthique et plus sûre au profit de la société.

Confidentialité

Il est bien connu que les grands modèles de base présentent une série de problèmes de fuite de confidentialité.

Des recherches antérieures ont montré qu'un intrus peut générer des séquences à partir d'un modèle GPT-2 entraîné et identifier ces séquences mémorisées à partir de l'ensemble d'entraînement, [Kandpal et al., 2022] attribue le succès de ces intrusions dans la vie privée à En raison de la En présence de données répétées dans l'ensemble d'apprentissage, des études ont prouvé que les séquences qui apparaissent plusieurs fois sont plus susceptibles d'être générées que les séquences qui n'apparaissent qu'une seule fois.

Étant donné que le modèle AIGC est formé sur des données explorées sur le Web à grande échelle, les problèmes de surajustement et de fuite de confidentialité deviennent particulièrement importants.

Par exemple, le modèle Stable Diffusion mémorise des images répétées dans les données d'entraînement [Rombach et al., 2022c]. [Somepalli et al., 2022] ont démontré qu'un modèle de diffusion stable copie de manière flagrante les images de ses données d'entraînement et génère des combinaisons simples d'objets de premier plan et d'arrière-plan dans l'ensemble de données d'entraînement.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

De plus, le modèle montre la capacité de reconstruire la mémoire, générant ainsi des objets sémantiquement identiques à l'objet d'origine mais ayant des formes de pixels différentes. L’existence de telles images soulève des inquiétudes quant à la mémoire et à la propriété des données.

De même, des recherches récentes montrent que le système Imagen de Google a également des problèmes pour divulguer des photos de personnes réelles et des images protégées par le droit d'auteur. Dans le récent procès de Matthew Butterick [Butterick, 2023], il a souligné que, étant donné que toutes les informations visuelles du système proviennent d'images d'entraînement protégées par le droit d'auteur, les images générées, quelle que soit leur apparence, doivent être l'œuvre de ces images d'entraînement.

De même, DALL·E 2 souffrait d'un problème similaire : il copiait parfois des images de ses données d'entraînement au lieu d'en créer de nouvelles.

OpenAI a découvert que ce phénomène s'est produit parce que l'image avait été copiée plusieurs fois dans l'ensemble de données. De même, ChatGPT a lui-même admis qu'il présentait un risque de fuite de confidentialité.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

Afin d'atténuer le problème de fuite de confidentialité des grands modèles, de nombreuses entreprises et chercheurs ont déployé de nombreux efforts pour défendre la vie privée. Au niveau industriel, Stability AI a reconnu les limites de Stable Diffusion.

A cet effet, ils mettent à disposition un site internet (https://rom1504.github.io/clip-retrieval/) pour identifier les images mémorisées par Stable Diffusion.

De plus, la société d'art Spawning AI a créé un site Web appelé « Have I Been Trained » (https://haveibeentrained.com) pour aider les utilisateurs à déterminer si leurs photos ou œuvres ont été utilisées pour une formation en intelligence artificielle.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

OpenAI tente de résoudre les problèmes de confidentialité en réduisant la duplication des données.

De plus, des entreprises telles que Microsoft et Amazon ont interdit aux employés de partager des données sensibles avec ChatGPT pour empêcher les employés de divulguer la confidentialité, car ces informations peuvent être utilisées pour la formation des futures versions de ChatGPT.

Au niveau académique, Somepalli et al. ont étudié un cadre de récupération d'images pour identifier la duplication de contenu, et Dockhorn et al. ont également proposé un modèle de diffusion différentielle de la confidentialité pour garantir la confidentialité du modèle généré.

Biais, toxicité, désinformation

Les données de formation pour le modèle AIGC proviennent du monde réel. Cependant, ces données peuvent par inadvertance renforcer des stéréotypes nuisibles, exclure ou marginaliser certains groupes et contenir des sources de données toxiques, ce qui peut inciter. la haine ou la violence et offenser des individus [Weidinger et al., 2021].

Les modèles formés ou affinés sur ces ensembles de données problématiques peuvent hériter de stéréotypes néfastes, de préjugés sociaux et de toxicité, ou même générer de la désinformation, conduisant à une discrimination injuste et à nuire à certains groupes sociaux.

Par exemple, le modèle Stable Diffusion v1 est principalement formé sur l'ensemble de données LAION-2B, qui ne contient que des images avec des descriptions en anglais. Par conséquent, le modèle est biaisé en faveur des Blancs et des cultures occidentales, et les indices provenant d’autres langues peuvent ne pas être pleinement représentés.

Bien que les versions ultérieures du modèle de diffusion stable aient été affinées sur les versions filtrées de l'ensemble de données LAION, le problème du biais restait. De même, DALLA·E, DALLA·E 2 et Imagen présentent également des préjugés sociaux et des stéréotypes négatifs à l'égard des groupes minoritaires.

De plus, il a été démontré qu'Imagen a des préjugés sociaux et culturels même lorsqu'il génère des images de non-humains. En raison de ces problèmes, Google a décidé de ne pas rendre Imagen accessible au public.

Afin d'illustrer le biais inhérent au modèle AIGC, nous avons testé Stable Diffusion v2.1. Les images générées à l'aide de l'invite « Trois ingénieurs courant dans la prairie » étaient toutes des hommes, et aucun d'entre eux n'appartenait aux négligés. minorité ethnique, ce qui illustre le manque de diversité dans les images générées.

Technologie de génération dimages errant à la limite du droit : cet article vous apprend à éviter de devenir accusé

De plus, le modèle AIGC peut également produire des informations erronées. Par exemple, le contenu généré par GPT et ses dérivés peut sembler exact et faisant autorité, mais peut contenir des informations totalement incorrectes.

Par conséquent, il peut fournir des informations trompeuses dans certains domaines (comme l'école, le droit, la médecine, les prévisions météorologiques). Par exemple, dans le domaine médical, les réponses fournies par ChatGPT concernant les dosages médicaux peuvent être inexactes ou incomplètes, ce qui peut mettre la vie en danger. Dans le domaine des transports, si les conducteurs suivent les mauvaises règles de circulation données par ChatGPT, cela peut entraîner des accidents, voire la mort.

De nombreuses défenses ont été mises en place contre les données et modèles problématiques.

OpenAI filtre finement l'ensemble de données de formation d'origine et supprime tout contenu violent ou pornographique dans les données de formation DALLA·E 2. Cependant, le filtrage peut introduire des biais dans les données de formation qui sont ensuite propagées aux modèles en aval.

Pour résoudre ce problème, OpenAI a développé une technologie de pré-formation pour atténuer les biais causés par les filtres. De plus, afin de garantir que le modèle AIGC puisse refléter en temps opportun la situation sociale actuelle, les chercheurs doivent régulièrement mettre à jour les ensembles de données utilisés par le modèle, ce qui contribuera à prévenir l'impact négatif causé par le décalage d'information.

Il convient de noter que même si les biais et les stéréotypes dans les données sources peuvent être réduits, ils peuvent toujours se propager ou même être exacerbés lors de la formation et du développement des modèles AIGC. Par conséquent, il est essentiel d’évaluer la présence de biais, de toxicité et de désinformation tout au long du cycle de vie de formation et de développement du modèle, et pas seulement au niveau de la source de données.

Propriété intellectuelle (PI)

Avec le développement rapide et l'application généralisée de l'AIGC, la question du droit d'auteur de l'AIGC est devenue particulièrement importante.

En novembre 2022, Matthew Butterick a déposé un recours collectif contre GitHub, filiale de Microsoft, accusant son service de génération de code produit Copilot d'enfreindre les lois sur le droit d'auteur. Comme pour les modèles de conversion texte-image, certains modèles génératifs ont été accusés de porter atteinte aux droits originaux des artistes sur leurs œuvres.

[Somepalli et al., 2022] montre que les images générées par Stable Diffusion peuvent être copiées à partir des données d'entraînement. Bien que Stable Diffusion refuse tout droit de propriété sur les images générées et permette aux utilisateurs de les utiliser librement tant que le contenu de l'image est légal et inoffensif, cette liberté déclenche toujours de féroces conflits sur le droit d'auteur.

Les modèles génératifs comme Stable Diffusion sont formés sur des images à grande échelle provenant d'Internet sans l'autorisation du détenteur de la propriété intellectuelle, certaines personnes pensent donc que cela viole leurs droits.

Pour résoudre les problèmes de propriété intellectuelle, de nombreuses entreprises de l'AIGC ont pris des mesures.

Par exemple, Midjourney a inclus une politique de retrait DMCA dans ses conditions de service, permettant aux artistes de demander que leur œuvre soit supprimée de l'ensemble de données si une violation du droit d'auteur est suspectée.

De même, Stability AI prévoit de donner aux artistes la possibilité d'exclure leur travail de l'ensemble de formation pour les futures versions de Stable Diffusion. De plus, les filigranes de texte [He et al., 2022a ; He et al., 2022b] peuvent également être utilisés pour identifier si ces outils AIGC utilisent des échantillons provenant d'autres sources sans autorisation.

Par exemple, Stable Diffusion génère des images avec un filigrane Getty Images [Vincent, 2023].

OpenAI développe une technologie de filigrane pour identifier le texte généré par les modèles GPT, un outil que les enseignants peuvent utiliser pour détecter le plagiat dans les devoirs. Google a également appliqué des filigranes Parti aux images qu'il publie. En plus des filigranes, OpenAI a récemment publié un classificateur permettant de distinguer le texte généré par l'IA du texte écrit par l'homme.

Conclusion

Bien que l'AIGC en soit encore à ses balbutiements, elle se développe rapidement et restera active dans un avenir prévisible.

Afin que les utilisateurs et les entreprises comprennent pleinement ces risques et prennent les mesures appropriées pour atténuer ces menaces, nous résumons les risques actuels et potentiels du modèle AIGC dans cet article.

Si ces risques potentiels ne peuvent pas être pleinement compris et si des mesures de défense contre les risques et des garanties de sécurité appropriées sont adoptées, le développement de l'AIGC pourrait se heurter à des défis et des obstacles réglementaires importants. Par conséquent, nous avons besoin d’une participation communautaire plus large pour contribuer à un AIGC responsable.

Enfin, merci SonyAI et BAAI !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie 'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie Apr 21, 2025 pm 02:48 PM

Le plongeon sur le marché des crypto-monnaies a provoqué la panique parmi les investisseurs, et Dogecoin (Doge) est devenu l'une des zones les plus difficiles. Son prix a fortement chuté et le verrouillage de la valeur totale de la finance décentralisée (DEFI) (TVL) a également connu une baisse significative. La vague de vente de "Black Monday" a balayé le marché des crypto-monnaies, et Dogecoin a été le premier à être touché. Son Defitvl a chuté aux niveaux de 2023 et le prix de la devise a chuté de 23,78% au cours du dernier mois. Le Defitvl de Dogecoin est tombé à un minimum de 2,72 millions de dollars, principalement en raison d'une baisse de 26,37% de l'indice de valeur SOSO. D'autres plates-formes de Defi majeures, telles que le Dao et Thorchain ennuyeux, TVL ont également chuté de 24,04% et 20, respectivement.

Quelles sont les dix principales plates-formes du cercle d'échange de devises? Quelles sont les dix principales plates-formes du cercle d'échange de devises? Apr 21, 2025 pm 12:21 PM

Les principaux échanges comprennent: 1. Binance, le plus grand volume de trading au monde, prend en charge 600 devises et les frais de gestion des points sont de 0,1%; 2. Okx, une plate-forme équilibrée, prend en charge 708 paires de trading, et les frais de traitement des contrats perpétuels sont de 0,05%; 3. Gate.io, couvre 2700 petites monnaies, et les frais de traitement des points sont de 0,1% à 0,3%; 4. Coinbase, la référence de conformité américaine, les frais de traitement des points sont de 0,5%; 5. Kraken, la haute sécurité et l'audit de réserve régulière.

Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Apr 21, 2025 pm 07:15 PM

Les échanges jouent un rôle essentiel sur le marché des crypto-monnaies d'aujourd'hui. Ce ne sont pas seulement des plateformes pour les investisseurs pour négocier, mais aussi des sources importantes de liquidité du marché et la découverte des prix. Les plus grands échanges de devises virtuels au monde se classent parmi les dix premiers, et ces échanges sont non seulement bien en avance dans le volume des échanges, mais présentent également leurs propres avantages dans l'expérience utilisateur, la sécurité et les services innovants. Les échanges qui dépassent la liste ont généralement une grande base d'utilisateurs et une influence approfondie du marché, et leur volume de trading et leurs types d'actifs sont souvent difficiles à atteindre par d'autres échanges.

WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé Apr 21, 2025 am 10:45 AM

Binance est le suzerain de l'écosystème mondial de trading d'actifs numériques, et ses caractéristiques comprennent: 1. Le volume de négociation quotidien moyen dépasse 150 milliards de dollars, prend en charge 500 paires de négociation, couvrant 98% des monnaies grand public; 2. La matrice d'innovation couvre le marché des dérivés, la mise en page Web3 et le système éducatif; 3. Les avantages techniques sont des moteurs de correspondance d'une milliseconde, avec des volumes de traitement de pointe de 1,4 million de transactions par seconde; 4. Conformité Progress détient des licences de 15 pays et établit des entités conformes en Europe et aux États-Unis.

Rexas Finance (RXS) peut dépasser Solana (Sol), Cardano (ADA), XRP et Dogecoin (DOGE) en 2025 Rexas Finance (RXS) peut dépasser Solana (Sol), Cardano (ADA), XRP et Dogecoin (DOGE) en 2025 Apr 21, 2025 pm 02:30 PM

Sur le marché volatil des crypto-monnaies, les investisseurs recherchent des alternatives qui vont au-delà des devises populaires. Bien que les crypto-monnaies bien connues telles que Solana (Sol), Cardano (ADA), XRP et Dogecoin (DOGE) sont également confrontées à des défis tels que le sentiment du marché, l'incertitude réglementaire et l'évolutivité. Cependant, un nouveau projet émergent, la rexasfinance (RXS), est en émergence. Il ne s'appuie pas sur les effets de célébrités ou le battage médiatique, mais se concentre sur la combinaison des actifs du monde réel (RWA) avec la technologie de la blockchain pour offrir aux investisseurs une façon innovante d'investir. Cette stratégie le fait espérer être l'un des projets les plus réussis de 2025. Rexasfi

La plate-forme de médias sociaux Web3 Tox collabore avec Omni Labs pour intégrer l'infrastructure d'IA La plate-forme de médias sociaux Web3 Tox collabore avec Omni Labs pour intégrer l'infrastructure d'IA Apr 21, 2025 pm 07:06 PM

La plate-forme décentralisée de médias sociaux Tox a atteint un partenariat stratégique avec Omnilabs, un leader des solutions d'intelligence artificielle, pour intégrer les capacités d'intelligence artificielle dans l'écosystème web3. Ce partenariat est publié par le compte officiel de Tox Officiel de Tox et vise à créer un environnement en ligne plus juste et plus intelligent. Omnilabs est connu pour ses systèmes autonomes intelligents, avec sa capacité AI-AS-A-Service (AIAAS) soutenant de nombreux protocoles Defi et NFT. Son infrastructure utilise des agents d'IA pour la prise de décision en temps réel, les processus automatisés et l'analyse approfondie des données, visant à s'intégrer de manière transparente dans l'écosystème décentralisé pour autonomiser la plate-forme blockchain. La collaboration avec Tox rendra les outils d'IA d'Omnilabs plus étendus, en les intégrant dans les réseaux sociaux décentralisés,

Classement des échanges à effet de levier dans le cercle des devises Les dernières recommandations des dix premiers échanges à effet de levier dans le cercle des devises Classement des échanges à effet de levier dans le cercle des devises Les dernières recommandations des dix premiers échanges à effet de levier dans le cercle des devises Apr 21, 2025 pm 11:24 PM

Les plates-formes qui ont des performances exceptionnelles dans le commerce, la sécurité et l'expérience utilisateur en effet de levier en 2025 sont: 1. OKX, adaptés aux traders à haute fréquence, fournissant jusqu'à 100 fois l'effet de levier; 2. Binance, adaptée aux commerçants multi-monnaies du monde entier, offrant un effet de levier 125 fois élevé; 3. Gate.io, adapté aux joueurs de dérivés professionnels, fournissant 100 fois l'effet de levier; 4. Bitget, adapté aux novices et aux commerçants sociaux, fournissant jusqu'à 100 fois l'effet de levier; 5. Kraken, adapté aux investisseurs stables, fournissant 5 fois l'effet de levier; 6. BUTBIT, adapté aux explorateurs Altcoin, fournissant 20 fois l'effet de levier; 7. Kucoin, adapté aux commerçants à faible coût, fournissant 10 fois l'effet de levier; 8. Bitfinex, adapté au jeu senior

Prévisions des prix WorldCoin (WLD) 2025-2031: WLD atteindra-t-il 4 $ d'ici 2031? Prévisions des prix WorldCoin (WLD) 2025-2031: WLD atteindra-t-il 4 $ d'ici 2031? Apr 21, 2025 pm 02:42 PM

WorldCoin (WLD) se démarque sur le marché des crypto-monnaies avec ses mécanismes uniques de vérification biométrique et de protection de la vie privée, attirant l'attention de nombreux investisseurs. WLD a permis de se produire avec remarquablement parmi les Altcoins avec ses technologies innovantes, en particulier en combinaison avec la technologie d'Intelligence artificielle OpenAI. Mais comment les actifs numériques se comporteront-ils au cours des prochaines années? Prédons ensemble le prix futur de WLD. Les prévisions de prix de 2025 WLD devraient atteindre une croissance significative de la WLD en 2025. L'analyse du marché montre que le prix moyen du WLD peut atteindre 1,31 $, avec un maximum de 1,36 $. Cependant, sur un marché baissier, le prix peut tomber à environ 0,55 $. Cette attente de croissance est principalement due à WorldCoin2.

See all articles