


Vom einzelnen Gegner zum vielfältigen Gegner: CVPR 2023 untersucht verallgemeinerbare, vielfältige gegnerische Angriffe
Ist das Gesichtserkennungssystem, das angeblich eine Genauigkeit von 99 % hat, wirklich unzerbrechlich? Tatsächlich kann das Gesichtserkennungssystem leicht gebrochen werden, indem einige Änderungen an den Gesichtsfotos vorgenommen werden, die sich nicht auf das visuelle Urteilsvermögen auswirken. Beispielsweise kann festgestellt werden, dass es sich bei dem Mädchen von nebenan und der männlichen Berühmtheit um dieselbe Person handelt Angriff. Das Ziel gegnerischer Angriffe besteht darin, gegnerische Proben zu finden, die natürlich sind und das neuronale Netzwerk verwirren können. Im Wesentlichen besteht das Auffinden gegnerischer Proben darin, die Schwachstellen des neuronalen Netzwerks zu finden.
Kürzlich hat ein Forschungsteam der Dongfang University of Technology ein Paradigma für einen generalisierten Mannigfaltigkeitsangriff (GMAA) vorgeschlagen, der „den traditionellen „Punkt“-Angriffsmodus zu einem „Gesichts“-Angriffsmodus umwandeltund die Generalisierungsfähigkeit erheblich verbessert des gegnerischen Angriffsmodells und entwickelt eine neue Idee für die Arbeit gegnerischer Angriffe. Diese Forschung verbessert frühere Arbeiten sowohl aus der Zieldomäne als auch aus der gegnerischen Domäne. Auf der Zieldomäne findet diese Studie leistungsfähigere gegnerische Beispiele mit hoher Generalisierung, indem sie die Menge der Zustände der Zielidentität angreift. Für den kontradiktorischen Bereich haben frühere Arbeiten nach diskreten kontradiktorischen Stichproben gesucht, d. h. nach mehreren „Schwachstellen“ (Punkten) des Systems, während diese Forschung nach kontinuierlichen kontradiktorischen Mannigfaltigkeiten sucht, d das neuronale Netzwerk. Darüber hinaus führt diese Studie in Domänenkenntnisse der Ausdrucksbearbeitung ein und schlägt ein neues Paradigma vor, das auf der Instanziierung des Ausdruckszustandsraums basiert. Durch kontinuierliches Abtasten der generierten kontradiktorischen Mannigfaltigkeit können wir stark verallgemeinerbare kontradiktorische Muster mit kontinuierlichen Ausdrucksänderungen erhalten. Im Vergleich zu Methoden wie Make-up, Beleuchtung und Hinzufügen von Störungen ist der
Ausdruckszustandsraum universeller und natürlicher und wird nicht vom Geschlecht beeinflusst und Beleuchtung.Die Forschungsarbeit wurde vom CVPR 2023 angenommen.
Papier-Link: Bitte klicken Sie hier, um das Papier anzuzeigen
Der Inhalt, der neu geschrieben werden muss, ist: Code-Link https://github.com/tokaka22/GMAA
EinführungsmethodeIm Ziel Domänenteil, zuvor Die gesamte Arbeit besteht darin, gegnerische Muster für ein bestimmtes Foto der Zielidentität A zu entwerfen. Wie in Abbildung 2 dargestellt, wird der Angriffseffekt jedoch erheblich verringert, wenn die durch diese Angriffsmethode erzeugte gegnerische Stichprobe zum Angriff auf ein anderes Foto von A verwendet wird. Angesichts solcher Angriffe ist der regelmäßige Wechsel der Fotos in der Gesichtserkennungsdatenbank natürlich eine wirksame Abwehrmaßnahme. Die in dieser Studie vorgeschlagene GMAA trainiert jedoch nicht nur auf einer einzelnen Stichprobe der Zielidentität, sondern sucht auch nach gegnerischen Stichproben, die den Satz von Zielidentitätszuständen angreifen können die aktualisierte Gesichtserkennungsbibliothek. Gute Angriffsleistung.
Diese leistungsfähigeren gegnerischen Beispiele entsprechen auch den schwächeren Bereichen des neuronalen Netzwerks und sind einer eingehenden Untersuchung wert.In früheren Forschungen auf dem Gebiet der Gegnerschaft wird normalerweise nach einer oder mehreren diskreten Gegnerproben gesucht, was dem Finden eines oder mehrerer „Punkte“ entspricht, an denen das neuronale Netzwerk im hochdimensionalen Raum anfällig ist. Diese Studie geht jedoch davon aus, dass neuronale Netze im gesamten „Gesicht“ anfällig sein können und daher alle gegnerischen Beispiele auf diesem „Gesicht“ finden sollten. Ziel dieser Forschung ist es daher, gegnerische Mannigfaltigkeiten im hochdimensionalen Raum zu finden. Zusammenfassend ist GMAA ein neues Angriffsparadigma, das gegnerische Mannigfaltigkeiten verwendet, um die Zustandsmenge der Zielidentität anzugreifen.
Bitte beachten Sie Abbildung 1, die die Kernidee des Artikels darstelltIn dieser Studie wird insbesondere das Facial Action Coding System (FACS) als Domänenwissen zur Instanziierung des vorgeschlagenen neuen Angriffsparadigmas vorgestellt . FACS ist ein System zur Kodierung des Gesichtsausdrucks. Es unterteilt das Gesicht in verschiedene Muskeleinheiten. Die Größe des Vektorelements repräsentiert die Muskelaktivität der entsprechenden Einheit und kodiert so den Ausdruckszustand . . Im Bild unten stellt beispielsweise das erste Element des AU-Vektors, AU1, den Grad dar, in dem die innere Augenbraue angehoben wird Die Forschung zielt darauf ab, eine Vielzahl von Zielzuständen anzugreifen, um eine bessere Angriffsleistung auf unbekannte Zielbilder zu erzielen. Diese Forschung erstellt eine gegnerische Mannigfaltigkeit, die dem AU-Raum entspricht, und kann durch Ändern der gegnerischen Mannigfaltigkeit Proben auf der gegnerischen Mannigfaltigkeit abtasten AU-Wert-Probe: Durch kontinuierliche Änderung des AU-Werts werden kontradiktorische Stichproben mit sich ständig ändernden Ausdrücken generiert
Es ist erwähnenswert, dass diese Studie den Ausdruckszustandsraum verwendet, um das GMAA-Angriffsparadigma zu instanziieren. Dies liegt daran, dass Mimik der häufigste Zustand bei menschlichen Gesichtsaktivitäten ist und der Ausdruckszustandsraum relativ stabil ist und nicht durch Rasse oder Geschlecht beeinflusst wird (Licht kann die Hautfarbe verändern und Make-up kann das Geschlecht beeinflussen). Solange andere geeignete Zustandsräume gefunden werden können, kann dieses Angriffsparadigma tatsächlich verallgemeinert und auf andere gegnerische Angriffsaufgaben in der Natur angewendet werden.
Der Inhalt, der neu geschrieben werden muss, ist: ModellergebnisseDie visuellen Ergebnisse dieser Studie sind in der folgenden Animation dargestellt. Jeder Animationsrahmen ist ein gegnerisches Beispiel, das durch Abtasten auf der gegnerischen Mannigfaltigkeit erhalten wird. Durch kontinuierliche Stichproben kann eine Reihe kontradiktorischer Beispiele mit sich ständig ändernden Ausdrücken erhalten werden (links). Der rote Wert in der Animation stellt die Ähnlichkeit zwischen dem gegnerischen Beispiel des aktuellen Frames und dem Zielbeispiel (rechts) unter dem Gesichtserkennungssystem Face++ dar.
In Tabelle 1 sind vier Gesichtserkennungsmodelle in zwei Black-Box-Angriffen aufgeführt Erfolgsquote für den Datensatz. Unter diesen ist MAA eine reduzierte Version von GMAA, die das Punktangriffsmodell nur auf vielfältige Angriffe im gegnerischen Bereich ausdehnt. In der Zieldomäne greift es immer noch ein einzelnes Ziel an. Der Statussatz des Angriffsziels ist eine übliche experimentelle Einstellung. Der Artikel fügt diese Einstellung zu den drei Methoden einschließlich MAA in Tabelle 2 hinzu (der fett gedruckte Teil in der Tabelle ist das Ergebnis des Hinzufügens dieser Einstellung in Tabelle 2 (A „G“). wird zum Namen der Methode hinzugefügt, um sie zu unterscheiden), was bestätigt, dass die Erweiterung der Zieldomäne die Verallgemeinerung gegnerischer Proben verbessern kann




erzeugte kontradiktorische Mannigfaltigkeit homöomorph zum AU-Vektorraum ist.

Zusammenfassung ist eine Zusammenfassung und Zusammenfassung vorhandener Informationen oder Erfahrungen. Dabei handelt es sich um einen Prozess der Organisation und Zusammenfassung von Gedanken mit dem Ziel, die wichtigsten Ideen und Schlussfolgerungen herauszuarbeiten. Das Zusammenfassen kann uns helfen, das Gelernte besser zu verstehen und uns daran zu erinnern, und es kann uns auch dabei helfen, besser zu kommunizieren und unsere Ideen auszutauschen. Durch das Zusammenfassen können wir komplexe Informationen vereinfachen und auf ihre Kernpunkte reduzieren, sodass sie leichter zu verstehen und anzuwenden sind. Zusammenfassungen sind ein wichtiges Instrument im Lern- und Kommunikationsprozess. Sie können uns helfen, große Informationsmengen effizienter zu verarbeiten und zu nutzen. Ob im Studium, bei der Arbeit oder im Leben: Zusammenfassen ist eine wesentliche Fähigkeit. Zusammenfassend schlägt diese Studie ein neues Angriffsparadigma namens GMAA vor, das gleichzeitig die Zieldomäne und die gegnerischen Domänen erweitert und so die Leistung von Angriffen verbessert. Für die Zieldomäne verbessert GMAA die Generalisierungsfähigkeit auf die Zielidentität, indem es eine Sammlung von Zuständen anstelle eines einzelnen Bildes angreift. Darüber hinaus erweitert GMAA den kontradiktorischen Bereich von diskreten Punkten auf semantisch kontinuierliche kontradiktorische Mannigfaltigkeiten („Punkt-zu-Oberfläche“)
. Diese Studie instanziiert das GMAA-Angriffsparadigma, indem sie Domänenwissen zur Ausdrucksbearbeitung einführt. Umfangreiche Vergleichsexperimente belegen, dass GMAA eine bessere Angriffsleistung und eine natürlichere visuelle Qualität aufweist als andere Konkurrenzmodelle.Das obige ist der detaillierte Inhalt vonVom einzelnen Gegner zum vielfältigen Gegner: CVPR 2023 untersucht verallgemeinerbare, vielfältige gegnerische Angriffe. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



In der modernen Fertigung ist die genaue Fehlererkennung nicht nur der Schlüssel zur Sicherstellung der Produktqualität, sondern auch der Kern für die Verbesserung der Produktionseffizienz. Allerdings mangelt es vorhandenen Datensätzen zur Fehlererkennung häufig an der Genauigkeit und dem semantischen Reichtum, die für praktische Anwendungen erforderlich sind, was dazu führt, dass Modelle bestimmte Fehlerkategorien oder -orte nicht identifizieren können. Um dieses Problem zu lösen, hat ein Spitzenforschungsteam bestehend aus der Hong Kong University of Science and Technology Guangzhou und Simou Technology innovativ den „DefectSpectrum“-Datensatz entwickelt, der eine detaillierte und semantisch reichhaltige groß angelegte Annotation von Industriedefekten ermöglicht. Wie in Tabelle 1 gezeigt, bietet der Datensatz „DefectSpectrum“ im Vergleich zu anderen Industriedatensätzen die meisten Fehleranmerkungen (5438 Fehlerproben) und die detaillierteste Fehlerklassifizierung (125 Fehlerkategorien).

Die offene LLM-Community ist eine Ära, in der hundert Blumen blühen und konkurrieren. Sie können Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 und viele andere sehen hervorragende Darsteller. Allerdings weisen offene Modelle im Vergleich zu den proprietären Großmodellen GPT-4-Turbo in vielen Bereichen noch erhebliche Lücken auf. Zusätzlich zu allgemeinen Modellen wurden einige offene Modelle entwickelt, die sich auf Schlüsselbereiche spezialisieren, wie etwa DeepSeek-Coder-V2 für Programmierung und Mathematik und InternVL für visuelle Sprachaufgaben.

Herausgeber | ScienceAI Basierend auf begrenzten klinischen Daten wurden Hunderte medizinischer Algorithmen genehmigt. Wissenschaftler diskutieren darüber, wer die Werkzeuge testen soll und wie dies am besten geschieht. Devin Singh wurde Zeuge, wie ein pädiatrischer Patient in der Notaufnahme einen Herzstillstand erlitt, während er lange auf eine Behandlung wartete, was ihn dazu veranlasste, den Einsatz von KI zu erforschen, um Wartezeiten zu verkürzen. Mithilfe von Triage-Daten aus den Notaufnahmen von SickKids erstellten Singh und Kollegen eine Reihe von KI-Modellen, um mögliche Diagnosen zu stellen und Tests zu empfehlen. Eine Studie zeigte, dass diese Modelle die Zahl der Arztbesuche um 22,3 % verkürzen können und die Verarbeitung der Ergebnisse pro Patient, der einen medizinischen Test benötigt, um fast drei Stunden beschleunigt. Der Erfolg von Algorithmen der künstlichen Intelligenz in der Forschung bestätigt dies jedoch nur

Für KI ist die Mathematikolympiade kein Problem mehr. Am Donnerstag hat die künstliche Intelligenz von Google DeepMind eine Meisterleistung vollbracht: Sie nutzte KI, um meiner Meinung nach die eigentliche Frage der diesjährigen Internationalen Mathematikolympiade zu lösen, und war nur einen Schritt davon entfernt, die Goldmedaille zu gewinnen. Der IMO-Wettbewerb, der gerade letzte Woche zu Ende ging, hatte sechs Fragen zu Algebra, Kombinatorik, Geometrie und Zahlentheorie. Das von Google vorgeschlagene hybride KI-System beantwortete vier Fragen richtig und erzielte 28 Punkte und erreichte damit die Silbermedaillenstufe. Anfang dieses Monats hatte der UCLA-Professor Terence Tao gerade die KI-Mathematische Olympiade (AIMO Progress Award) mit einem Millionenpreis gefördert. Unerwarteterweise hatte sich das Niveau der KI-Problemlösung vor Juli auf dieses Niveau verbessert. Beantworten Sie die Fragen meiner Meinung nach gleichzeitig. Am schwierigsten ist es meiner Meinung nach, da sie die längste Geschichte, den größten Umfang und die negativsten Fragen haben

Herausgeber |KX Bis heute sind die durch die Kristallographie ermittelten Strukturdetails und Präzision, von einfachen Metallen bis hin zu großen Membranproteinen, mit keiner anderen Methode zu erreichen. Die größte Herausforderung, das sogenannte Phasenproblem, bleibt jedoch die Gewinnung von Phaseninformationen aus experimentell bestimmten Amplituden. Forscher der Universität Kopenhagen in Dänemark haben eine Deep-Learning-Methode namens PhAI entwickelt, um Kristallphasenprobleme zu lösen. Ein Deep-Learning-Neuronales Netzwerk, das mithilfe von Millionen künstlicher Kristallstrukturen und den entsprechenden synthetischen Beugungsdaten trainiert wird, kann genaue Elektronendichtekarten erstellen. Die Studie zeigt, dass diese Deep-Learning-basierte Ab-initio-Strukturlösungsmethode das Phasenproblem mit einer Auflösung von nur 2 Angström lösen kann, was nur 10 bis 20 % der bei atomarer Auflösung verfügbaren Daten im Vergleich zur herkömmlichen Ab-initio-Berechnung entspricht

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der Förderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datensätze können nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die Fähigkeiten großer Sprachmodelle (LLMs) bewerten, insbesondere die Fähigkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datensätze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datensätze immer noch einige Mängel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schränken jedoch den Antwortauswahlbereich des Modells ein und können die Fähigkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollständig testen. Im Gegensatz dazu offene Fragen und Antworten

Herausgeber |. Der Einsatz von Ziluo AI bei der Rationalisierung der Arzneimittelforschung nimmt explosionsartig zu. Durchsuchen Sie Milliarden von Kandidatenmolekülen nach solchen, die möglicherweise über Eigenschaften verfügen, die für die Entwicklung neuer Medikamente erforderlich sind. Es sind so viele Variablen zu berücksichtigen, von Materialpreisen bis hin zum Fehlerrisiko, dass es keine leichte Aufgabe ist, die Kosten für die Synthese der besten Kandidatenmoleküle abzuwägen, selbst wenn Wissenschaftler KI einsetzen. Hier entwickelten MIT-Forscher SPARROW, ein quantitatives Entscheidungsalgorithmus-Framework, um automatisch die besten molekularen Kandidaten zu identifizieren und so die Synthesekosten zu minimieren und gleichzeitig die Wahrscheinlichkeit zu maximieren, dass die Kandidaten die gewünschten Eigenschaften aufweisen. Der Algorithmus bestimmte auch die Materialien und experimentellen Schritte, die zur Synthese dieser Moleküle erforderlich sind. SPARROW berücksichtigt die Kosten für die gleichzeitige Synthese einer Charge von Molekülen, da häufig mehrere Kandidatenmoleküle verfügbar sind

Im Jahr 2023 entwickeln sich fast alle Bereiche der KI in beispielloser Geschwindigkeit weiter. Gleichzeitig verschiebt die KI ständig die technologischen Grenzen wichtiger Bereiche wie der verkörperten Intelligenz und des autonomen Fahrens. Wird der Status von Transformer als Mainstream-Architektur großer KI-Modelle durch den multimodalen Trend erschüttert? Warum ist die Erforschung großer Modelle auf Basis der MoE-Architektur (Mixture of Experts) zu einem neuen Trend in der Branche geworden? Können Large Vision Models (LVM) ein neuer Durchbruch im allgemeinen Sehvermögen sein? ...Aus dem PRO-Mitglieder-Newsletter 2023 dieser Website, der in den letzten sechs Monaten veröffentlicht wurde, haben wir 10 spezielle Interpretationen ausgewählt, die eine detaillierte Analyse der technologischen Trends und industriellen Veränderungen in den oben genannten Bereichen bieten, um Ihnen dabei zu helfen, Ihre Ziele in der Zukunft zu erreichen Jahr vorbereitet sein. Diese Interpretation stammt aus Week50 2023
