Bataille offensive et défensive rapide ! L'Université de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.-IA-php.cn

Maison

Bataille offensive et défensive rapide ! L'Université de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

王林

Apr 12, 2023 am 10:31 AM

图像攻防

Quelle est la chose la plus précieuse en 2022 ? rapide!

Le modèle de génération d'images guidées par texte (génération d'images guidées par texte), tel que DALL-E 2, est devenu un succès et les internautes génèrent sans cesse toutes sortes d'images amusantes.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Mais si vous souhaitez que le modèle génère des images cibles claires et utilisables, vous devez maîtriser le bon "sort", c'est-à-dire que l'invite doit être soigneusement conçue avant de pouvoir être utilisée. Certaines personnes créent même des sites Web pour. vendre des invites

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Si l'invite est un mauvais sort, l'image générée peut être "soupçonnée de violer la réglementation".

Bien que DALL-E 2 ait mis en place divers mécanismes pour éviter que le modèle ne soit abusé lors de sa sortie, comme la suppression des images violentes, haineuses ou inappropriées des données d'entraînement en utilisant des moyens techniques pour empêcher la génération de photos hyper réalistes ; de visages humains, en particulier certaines personnalités publiques.

Pendant la phase de génération, DALL-E 2 définit également un filtre d'invite qui ne permet pas aux mots d'invite saisis par l'utilisateur de contenir du contenu violent, adulte ou politique.

Mais récemment, des chercheurs de l'Université de Columbia ont découvert que certains mots apparemment absurdes pouvaient être ajoutés à l'invite, rendant le filtre incapable de reconnaître la signification du mot, mais le système d'IA peut finalement renvoyer des images générées significatives.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Lien papier : https://arxiv.org/pdf/2208.04135.pdf

L'auteur propose deux méthodes de construction d'invites. La première est appelée invite macaronique, où le sens original du mot macaronique fait référence. une variété de mots de langues sont mélangés pour créer de nouveaux mots. Au Pakistan, par exemple, les mélanges d'ourdou et d'anglais sont courants.

Le corpus de formation du DALL-E 2 est généralement constitué de données collectées sur Internet. Le processus d'établissement de connexions conceptuelles entre le texte et les images impliquera plus ou moins l'apprentissage multilingue, afin que le modèle formé puisse reconnaître plusieurs langues à la fois. en même temps des capacités conceptuelles.

Vous pouvez ainsi utiliser des combinaisons multilingues pour former de nouveaux mots, contourner le filtre d'invite conçu par les humains et atteindre l'objectif de résister aux attaques.

Par exemple, le mot « oiseaux » est Vögel en allemand, uccelli en italien, oiseaux en français et pájaros en espagnol. Après que le modèle CLIP utilise l'algorithme de codage par paire d'octets (BPE) pour segmenter la phrase d'invite de saisie, Can be. divisé en plusieurs sous-mots.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Après avoir réorganisé les sous-mots en nouveaux mots, comme saisir uccoisegeljaros, DALL-E 2 peut toujours générer des images d'oiseaux, mais les humains sont complètement incapables de comprendre le sens du mot.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Même si les limites du sous-mot ne sont pas strictement respectées, par exemple, s'il est remplacé par voiscellpajaraux et oisvogajaro, le modèle peut toujours générer des images d'oiseaux.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

En plus des oiseaux, les chercheurs ont découvert que la méthode de combinaison de plusieurs langues peut obtenir de bons résultats dans différents domaines d'images, et les résultats de génération d'images montrent une très grande cohérence.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

La génération d'images pertinentes du règne animal aux paysages, véhicules, scènes et émotions est un jeu d'enfant.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Bien que différents modèles de génération d'images guidées par texte aient des architectures, des données d'entraînement et des méthodes de segmentation de mots différentes, en principe, les astuces macaroniques peuvent être appliquées à n'importe quel modèle formé sur des données multilingues, comme dans DALL-E mini. L’effet se retrouve dans le modèle.

Il convient de noter que malgré des noms similaires, DALL-E 2 et DALL-E mini sont assez différents. Ils ont des architectures différentes (DALL-E mini n'utilise pas de modèle de diffusion), sont formés sur différents ensembles de données et utilisent différents tokenizers (DALL-E mini utilise le tokenizer BART, qui peut se comporter différemment des mots divisés du tokenizer CLIP).

Malgré ces différences, les embouts macaroniques fonctionnent toujours sur les deux modèles, et les principes qui les sous-tendent doivent être étudiés plus en détail.

Mais tous les signaux macaroniques ne sont pas transférés de manière appropriée entre les différents modèles, par exemple, alors que farpapmaripterling a produit une image de papillon dans DALL-E 2 comme prévu, il a produit une image de champignon dans DALL-E mini.

Bataille offensive et défensive rapide ! L'Université de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Les chercheurs supposent que les modèles peut-être plus grands formés sur des ensembles de données plus grands sont plus sensibles aux signaux macaroniques, car ils apprennent entre les unités de sous-mots et les concepts visuels dans différentes langues. Des relations plus fortes.

Cela pourrait expliquer pourquoi certaines astuces macaroniques qui produisent les résultats attendus dans DALL-E 2 ne fonctionnent pas dans DALL-E mini, mais il existe peu d'exemples du contraire.

Cette tendance n'est peut-être pas une bonne nouvelle, car les modèles à grande échelle peuvent être plus vulnérables aux attaques adverses utilisant des indices macaroniques.

En plus d'utiliser des mots composés simples comme invites, les mots composés peuvent également être intégrés dans la syntaxe anglaise pour former des phrases, et l'effet de la génération d'images est similaire à celui des mots originaux.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Et un autre avantage des mots composés est qu'ils peuvent être combinés pour produire des scènes plus spécifiques et complexes. Même si les indices macaroniques complexes doivent se conformer à la structure syntaxique de l'anglais, ce qui rend les résultats générés plus faciles à interpréter que les indices utilisant des chaînes synthétiques, les informations transmises au modèle restent relativement vagues.

Pour la plupart des gens, sans exposition préalable aux signaux macaroniques et sans connaissance du langage utilisé pour l'hybridation, il peut être difficile de deviner quel genre de scénario se produirait avec l'invite Un eidelucertlagarzard mangeant un maripofarterling.

De plus, ces invites sophistiquées ne déclencheront pas de filtres de contenu basés sur des listes noires, malgré le fait qu'ils utilisent des mots anglais ordinaires, tant que les concepts censurés sont suffisamment « cryptés » à l'aide de méthodes macaroniques.

La pointe macaronique ne nécessite pas nécessairement de combiner des sous-mots dans plusieurs langues. Les combiner dans une seule langue peut également produire des concepts visuels efficaces. Cependant, les personnes familiarisées avec l'anglais peuvent deviner l'effet recherché de la chaîne. Par exemple, le mot happy est. très Il est facile de deviner que c'est un mot composé de joyeux et joyeux.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

La deuxième méthode est appelée Evocative Prompting. Contrairement au macaronique, l'évocation n'a pas besoin de déclencher une association visuelle à partir de combinaisons de mots existantes, mais est basée sur la signification statistique de certaines combinaisons de lettres dans un champ spécifique", a déclaré Arouse. nouveau mot.

En vous référant à la nomenclature binomiale dans la classification biologique, vous pouvez créer un nouveau « mot pseudo-latin » basé sur le « nom du genre » et « l'épithète de l'espèce », et DALL-E peut générer le mot correspondant en fonction du thème correspondant. espèces.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

De nouvelles images de médicaments peuvent également être générées selon les règles de dénomination des médicaments.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Les indices évocateurs peuvent également être appliqués à des associations entre des caractéristiques spécifiques d'une langue et des caractéristiques visuelles liées au lieu et à la culture de la langue correspondante. Par exemple, en fonction du nom du bâtiment, le modèle peut déduire le style du pays. Par exemple, la scène générée par Woldenbüchel ressemble à un village allemand ou autrichien ; Valtorigiano ressemble à une ancienne ville italienne ; Beaussoncour ressemble à un village historique ; ville en France.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

Cependant, ce ne sont pas nécessairement tous des bâtiments. Par exemple, la dernière image générée avec DALL-E mini est un portrait français du XVIIe siècle, pas un lieu français, mais le lien avec la culture française est toujours conservé.

Des indices évocateurs peuvent également être combinés avec une hybridation lexicale pour mieux contrôler les caractéristiques spécifiques de la sortie.

L'introduction de morceaux de mots anglais dans la nomenclature pseudo-latine amènera DALL-E 2 à générer des images d'animaux avec des attributs spécifiques. Par exemple, le mot d'invite scariosus ferocianensis combine effrayant (effrayant) et féroce (féroce) avec des termes pseudo-latins, qui. peut générer des images de « reptiles » traditionnellement effrayants tels que les scorpions.

Bataille offensive et défensive rapide ! LUniversité de Columbia a proposé la méthode de création de mots BPE, qui peut contourner le mécanisme de révision DALL-E 2, qui a été trompée.

cutiosus adorablensis combine mignon et adorable avec des termes pseudo-latins pour générer des images de mammifères mignons au sens traditionnel ; watosus swimensis combine l'eau et la natation avec des affixes pseudo-latins Ensemble, il peut générer des images d'animaux aquatiques flyosus wingensis combine ; voler et ailé avec des affixes pseudo-latins pour générer des images d'insectes volants.

En principe, le vocabulaire généré par la méthode macaronique peut fournir un moyen simple et apparemment fiable de contourner le filtre d'invite. Les personnes ayant des arrière-pensées peuvent l'utiliser pour générer des mots nuisibles, offensants, illégaux ou autres contenus sensibles, y compris violents. les images haineuses, racistes, sexistes ou pornographiques, ainsi que les images susceptibles de porter atteinte aux droits de propriété intellectuelle ou de représenter des personnes réelles.

Bien que les entreprises qui fournissent des services de génération d'images aient déployé des efforts considérables pour empêcher la génération de telles sorties conformément à leurs politiques de contenu, les astuces macaroniques peuvent toujours constituer une menace énorme pour les protocoles de sécurité des systèmes commerciaux de génération d'images.

La menace posée par les signaux évocateurs est moins évidente, car ils ne constituent pas un moyen très efficace et fiable de déclencher des chaînes d'associations visuelles spécifiques, et ils se limitent principalement à des concepts liés à de larges caractéristiques morphologiques des mots ou à une association vague. .

En général, les astuces macaroniques sont plus exploitables que les astuces évocatrices, et le filtrage du contenu par liste noire par mots clés dans ce type de modèle n'est pas suffisant pour résister aux attaques.

Est-ce que DALL-E 2 va s'éteindre ?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Will R.E.P.O. Vous avez un jeu croisé?

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7552

Tutoriel CakePHP

1382

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment effacer l'historique des images récentes de l'arrière-plan du bureau dans Windows 11 Apr 14, 2023 pm 01:37 PM

<p>Windows 11 améliore la personnalisation du système, permettant aux utilisateurs d'afficher un historique récent des modifications précédemment apportées à l'arrière-plan du bureau. Lorsque vous entrez dans la section de personnalisation de l'application Paramètres système Windows, vous pouvez voir diverses options, la modification du fond d'écran en fait partie. Mais vous pouvez maintenant voir le dernier historique des fonds d’écran définis sur votre système. Si vous n'aimez pas voir cela et souhaitez effacer ou supprimer cet historique récent, continuez à lire cet article, qui vous aidera à en savoir plus sur la façon de le faire à l'aide de l'Éditeur du Registre. </p><h2>Comment utiliser la modification du registre

Comment télécharger l'image de fond d'écran Windows Spotlight sur PC Aug 23, 2023 pm 02:06 PM

Les fenêtres ne négligent jamais l’esthétique. Des champs verts bucoliques de XP au design tourbillonnant bleu de Windows 11, les fonds d’écran par défaut sont une source de plaisir pour les utilisateurs depuis des années. Avec Windows Spotlight, vous avez désormais un accès direct chaque jour à des images magnifiques et impressionnantes pour votre écran de verrouillage et votre fond d’écran. Malheureusement, ces images ne traînent pas. Si vous êtes tombé amoureux de l'une des images phares de Windows, vous voudrez savoir comment les télécharger afin de pouvoir les conserver comme arrière-plan pendant un certain temps. Voici tout ce que vous devez savoir. Qu’est-ce que WindowsSpotlight ? Window Spotlight est un programme de mise à jour automatique du fond d'écran disponible dans Personnalisation et dans l'application Paramètres.

Comment utiliser la technologie de segmentation sémantique d'images en Python ? Jun 06, 2023 am 08:03 AM

Avec le développement continu de la technologie de l’intelligence artificielle, la technologie de segmentation sémantique des images est devenue une direction de recherche populaire dans le domaine de l’analyse d’images. Dans la segmentation sémantique d'image, nous segmentons différentes zones d'une image et classons chaque zone pour obtenir une compréhension globale de l'image. Python est un langage de programmation bien connu. Ses puissantes capacités d'analyse et de visualisation de données en font le premier choix dans le domaine de la recherche sur les technologies d'intelligence artificielle. Cet article expliquera comment utiliser la technologie de segmentation sémantique d'images en Python. 1. Les connaissances préalables s’approfondissent

iOS 17 : Comment utiliser le recadrage en un clic des photos Sep 20, 2023 pm 08:45 PM

Avec l'application iOS 17 Photos, Apple facilite le recadrage des photos selon vos spécifications. Lisez la suite pour savoir comment. Auparavant, dans iOS 16, le recadrage d'une image dans l'application Photos impliquait plusieurs étapes : appuyez sur l'interface d'édition, sélectionnez l'outil de recadrage, puis ajustez le recadrage à l'aide d'un geste de pincement pour zoomer ou en faisant glisser les coins de l'outil de recadrage. Dans iOS 17, Apple a heureusement simplifié ce processus afin que lorsque vous zoomez sur une photo sélectionnée dans votre bibliothèque Photos, un nouveau bouton Recadrer apparaisse automatiquement dans le coin supérieur droit de l'écran. En cliquant dessus, l'interface de recadrage complète s'affichera avec le niveau de zoom de votre choix. Vous pourrez ainsi recadrer la partie de l'image que vous aimez, faire pivoter l'image, inverser l'image, appliquer un rapport d'écran ou utiliser des marqueurs.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter n'importe quel vêtement et modifier vos mouvements. Apr 11, 2023 pm 02:31 PM

Grâce au rendu différenciable fourni par NeRF, les modèles génératifs 3D récents ont obtenu des résultats époustouflants sur des objets stationnaires. Cependant, dans une catégorie plus complexe et déformable comme le corps humain, la génération 3D pose encore de grands défis. Cet article propose une représentation NeRF combinée efficace du corps humain, permettant la génération de corps humain 3D haute résolution (512 x 256) sans utiliser de modèles de super-résolution. EVA3D a largement surpassé les solutions existantes sur quatre ensembles de données du corps humain à grande échelle, et le code est open source. Nom de l'article : EVA3D : Génération humaine compositionnelle en 3D à partir de collections d'images 2D Adresse de l'article : http

Une nouvelle perspective sur la génération d'images : discussion des méthodes de généralisation basées sur NeRF Apr 09, 2023 pm 05:31 PM

La nouvelle génération d'images en perspective (NVS) est un domaine d'application de la vision par ordinateur. Dans le jeu SuperBowl de 1998, le RI de la CMU a démontré la vision stéréo multi-caméras (MVS). À cette époque, cette technologie a été transférée à une chaîne de télévision sportive du pays. États-Unis, mais il n’a finalement pas été commercialisé ; la société britannique BBC Broadcasting a investi dans la recherche et le développement à cet effet, mais il n’a pas été véritablement commercialisé. Dans le domaine du rendu basé sur l'image (IBR), il existe une branche des applications NVS, à savoir le rendu basé sur l'image en profondeur (DBIR). De plus, la télévision 3D, qui était très populaire en 2010, devait également obtenir des effets stéréoscopiques binoculaires à partir de la vidéo monoculaire, mais en raison de l'immaturité de la technologie, elle n'est finalement pas devenue populaire. A cette époque, des méthodes basées sur l’apprentissage automatique commençaient déjà à être étudiées, comme

Comment redimensionner par lots des images à l'aide de PowerToys sous Windows Aug 23, 2023 pm 07:49 PM

Ceux qui doivent travailler quotidiennement avec des fichiers image doivent souvent les redimensionner pour les adapter aux besoins de leurs projets et de leurs tâches. Cependant, si vous avez trop d’images à traiter, les redimensionner individuellement peut prendre beaucoup de temps et d’efforts. Dans ce cas, un outil comme PowerToys peut s'avérer utile, entre autres, pour redimensionner par lots des fichiers image à l'aide de son utilitaire de redimensionnement d'image. Voici comment configurer vos paramètres de redimensionnement d'image et commencer le redimensionnement par lots d'images avec PowerToys. Comment redimensionner des images par lots avec PowerToys PowerToys est un programme tout-en-un doté d'une variété d'utilitaires et de fonctionnalités pour vous aider à accélérer vos tâches quotidiennes. L'un de ses utilitaires est les images

Effacez les imperfections et les rides en un clic : interprétation approfondie du modèle de beauté de la peau haute définition ABPN de la DAMO Academy Apr 12, 2023 pm 12:25 PM

Avec le développement vigoureux de l’industrie de la culture numérique, la technologie de l’intelligence artificielle a commencé à être largement utilisée dans le domaine de l’édition et de l’embellissement d’images. Parmi elles, l’embellissement de la peau en portrait est sans aucun doute l’une des technologies les plus utilisées et les plus demandées. Les algorithmes de beauté traditionnels utilisent une technologie d'édition d'images basée sur des filtres pour obtenir des effets automatisés de resurfaçage de la peau et d'élimination des imperfections, et ont été largement utilisés dans les réseaux sociaux, les diffusions en direct et d'autres scénarios. Cependant, dans le secteur de la photographie professionnelle, où les seuils sont élevés, en raison des exigences élevées en matière de résolution d'image et de normes de qualité, les retoucheurs manuels restent la principale force productive dans la retouche beauté des portraits, accomplissant des tâches telles que le lissage de la peau, l'élimination des imperfections, le blanchiment, etc. travail. Habituellement, le temps de traitement moyen nécessaire à un retoucheur professionnel pour effectuer des opérations d'embellissement de la peau sur un portrait haute définition est de 1 à 2 minutes. Dans des domaines tels que la publicité, le cinéma et la télévision, qui nécessitent une plus grande précision.

See all articles