Inhaltsverzeichnis
Abbildung 2 Übersicht über das Narrator-Framework
Kombinierter globaler und lokaler Szenendiagrammmechanismus
Über den Autor
Heim Technologie-Peripheriegeräte KI Neuer Durchbruch in der „interaktiven Generierung von Personen und Szenen'! Tianda University und Tsinghua University veröffentlichen Narrator: textgesteuert, natürlich kontrollierbar |

Neuer Durchbruch in der „interaktiven Generierung von Personen und Szenen'! Tianda University und Tsinghua University veröffentlichen Narrator: textgesteuert, natürlich kontrollierbar |

Sep 11, 2023 pm 11:13 PM
场景 清华 narrator

Die Erzeugung natürlicher und kontrollierbarer Human Scene Interaction (HSI) spielt in vielen Bereichen wie der Erstellung von Virtual Reality/Augmented Reality (VR/AR)-Inhalten und der auf den Menschen ausgerichteten künstlichen Intelligenz eine wichtige Rolle.

Bestehende Methoden weisen jedoch eine begrenzte Steuerbarkeit, begrenzte Interaktionstypen und unnatürlich erzeugte Ergebnisse auf, was ihre Anwendungsszenarien im wirklichen Leben erheblich einschränkt.

In der Forschung von ICCV 2023 haben die Universitäten Tianjin und Tsinghua ein Team gebildet mit einer Lösung namens Narrator, um dieses Problem zu untersuchen. Diese Lösung konzentriert sich auf die herausfordernde Aufgabe, auf natürliche und kontrollierte Weise realistische und vielfältige Interaktionen zwischen Mensch und Szene aus Textbeschreibungen zu generieren. likun/projects/Narrator

Der umgeschriebene Inhalt lautet: Code-Link: https://github.com/HaibiaoXuan/Narrator

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023Aus der Perspektive der menschlichen Kognition sollte das generative Modell idealerweise in der Lage sein, räumliche Beziehungen richtig zu beurteilen und erkunden Sie die Freiheitsgrade von Interaktionen.

Daher schlägt der Autor ein generatives Modell vor, das auf relationalem Denken basiert. Dieses Modell modelliert die räumlichen Beziehungen in Szenen und Beschreibungen durch Szenendiagramme und führt einen Interaktionsmechanismus auf Teilebene ein, der interaktive Aktionen als atomare Körperteilzustände darstellt

Insbesondere schlägt der Autor eine einfache, aber effektive Mehrpersonengeneration vor Strategie, dies ist die erste Erkundung der kontrollierbaren interaktiven Generierung von Mehrpersonenszenen bestehende Arbeit

Methodenmotivation

Bestehende Methoden zur Generierung von Mensch-Szene-Interaktionen konzentrieren sich hauptsächlich auf die physikalisch-geometrische Beziehung der Interaktion, es fehlt ihnen jedoch die semantische Kontrolle über die Generierung, und sie sind auch auf die Einzelspieler-Generierung beschränkt.

Daher konzentrieren sich die Autoren auf die anspruchsvolle Aufgabe, aus Beschreibungen in natürlicher Sprache realistische und vielfältige Interaktionen zwischen Mensch und Szene kontrollierbar zu generieren. Die Autoren stellten fest, dass Menschen typischerweise räumliche Wahrnehmung und Handlungserkennung nutzen, um Menschen, die an verschiedenen Orten an verschiedenen Interaktionen teilnehmen, auf natürliche Weise zu beschreiben.

Bild

Der umgeschriebene Inhalt lautet wie folgt: Gemäß Abbildung 1 kann der Erzähler auf natürliche und kontrollierte Weise semantisch konsistente und physikalisch sinnvolle Mensch-Szenen-Interaktionen erzeugen, die auf die folgenden Situationen anwendbar sind: (a) durch Raumbeziehung -Geführte Interaktion, (b) Interaktion, die durch mehrere Aktionen gesteuert wird, (c) Interaktion zwischen mehreren Personen und (d) Interaktion zwischen Person und Szene, die die oben genannten Interaktionstypen kombiniert

Konkret können räumliche Beziehungen verwendet werden, um die Wechselbeziehungen zwischen zu beschreiben verschiedene Objekte in einer Szene oder einem lokalen Bereich. Interaktive Aktionen werden durch den Zustand atomarer Körperteile spezifiziert, wie z. B. die Füße einer Person auf dem Boden, sich auf den Oberkörper stützen, mit der rechten Hand klopfen, den Kopf senken usw.

Mit diesem Ausgangspunkt wird die Der Autor verwendet Szenendiagramme, um räumliche Beziehungen darzustellen, und schlägt vor, dass er einen JGLSG-Mechanismus (Joint Global and Local Scene Graph) verwendet, um eine globale Positionserkennung für die nachfolgende Generation bereitzustellen. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Angesichts der Tatsache, dass der Zustand von Körperteilen der Schlüssel zur Simulation realistischer Interaktionen im Einklang mit dem Text ist, führte der Autor gleichzeitig einen Part-Level-Action-Mechanismus (PLA) ein, um die Entsprechung zwischen menschlichen Körperteilen und Aktionen herzustellen.

Der Autor profitiert von der effektiven Beobachtungserkennung und der Flexibilität und Wiederverwendbarkeit des vorgeschlagenen relationalen Denkens und schlägt außerdem eine einfache und effektive Strategie zur Generierung mehrerer Personen vor, die damals die erste natürlich kontrollierbare und benutzergenerierte Strategie war. Freundliche Lösung zur Generierung von Multi-Human Scene Interaction (MHSI).

Methodenideen

Überblick über das Narrator-Framework

Das Ziel von Narrator besteht darin, Interaktionen zwischen Charakteren und Szenen auf natürliche und kontrollierbare Weise zu erzeugen, die semantisch mit Textbeschreibungen übereinstimmen und die drei physisch zusammenbringen -dimensionale Szene

Bild

Abbildung 2 Übersicht über das Narrator-Framework

Wie in Abbildung 2 gezeigt, verwendet diese Methode einen auf Transformer basierenden Conditional Variational Autoencoder (cVAE), der hauptsächlich die folgenden Mehrere umfasst Teile:

Im Vergleich zu bestehenden Forschungsergebnissen entwerfen wir einen gemeinsamen Mechanismus für globale und lokale Szenendiagramme, um über komplexe räumliche Beziehungen nachzudenken und ein globales Positionierungsbewusstsein zu erreichen. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

2) Ausrichtung auf Personen, die gleichzeitig vorbeikommen. Beobachtung von interaktive Aktionen, die von verschiedenen Körperteilen ausgeführt werden, wodurch ein Aktionsmechanismus auf Komponentenebene eingeführt wird, um realistische und vielfältige Interaktionen zu erzielen.

Während des Prozesses zur Optimierung der Szenenwahrnehmung haben wir zusätzlich den interaktiven zweiteiligen Verlust eingeführt, um bessere Ergebnisse zu erzielen

4) Erweitert sich weiter auf die Generierung von Mehrpersonen-Interaktionen und fördert letztendlich den ersten Schritt in der Mehrpersonen-Szeneninteraktion.

Kombinierter globaler und lokaler Szenendiagrammmechanismus

Die Begründung räumlicher Beziehungen kann dem Modell szenenspezifische Hinweise liefern, was eine wichtige Rolle bei der Erzielung einer natürlichen Steuerbarkeit der Interaktion zwischen Mensch und Szene spielt.

Um dieses Ziel zu erreichen, schlägt der Autor einen gemeinsamen Mechanismus für globale und lokale Szenendiagramme vor, der durch die folgenden drei Schritte implementiert wird:

1. Globale Szenendiagrammgenerierung: Verwenden Sie bei gegebener Szene vorab das Training Das Szenendiagrammmodell generiert ein globales Szenendiagramm, d. h. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023, wobei 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023, 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 Objekte mit Kategoriebezeichnungen sind, 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 die Beziehung zwischen 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 und 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 ist, n die Anzahl der Objekte ist, m die Anzahl der Beziehungen ist;

2. Generierung lokaler Szenendiagramme: Verwenden Sie semantische Parsing-Tools, um die beschriebene Satzstruktur zu identifizieren und lokale Szenen zu extrahieren und zu generieren

, wobei

das Triplett von Subjekt-Prädikat-Objekt definiert;

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Szenendiagramm-Übereinstimmung: durch dasselbe Objekt Mit semantischen Tags entspricht das Modell den Knoten im globalen Szenendiagramm und im lokalen Szenendiagramm und fügt einen virtuellen menschlichen Knoten hinzu, indem die Kantenbeziehung erweitert wird, um Positionsinformationen bereitzustellen Der Autor schlägt einen feinkörnigen Aktionsmechanismus auf Teilebene vor, durch den das Modell in der Lage ist, wichtige Zustände von Körperteilen zu erkennen und irrelevante Teile einer bestimmten Interaktion zu ignorieren

Konkret untersucht der Autor umfangreiche und vielfältige interaktive Aktionen und kartiert diese Mögliche Aktionen auf die fünf Hauptteile des menschlichen Körpers: Kopf, Rumpf, linker/rechter Arm, linke/rechte Hand und linker/rechter Unterkörper.

In der nachfolgenden Codierung können wir One-Hot verwenden, um diese Aktionen und Körperteile gleichzeitig darzustellen und sie entsprechend der entsprechenden Beziehung zu verbinden

Der Autor ist in der interaktiven Generierung von Multi-Aktionen An Der Aufmerksamkeitsmechanismus wird eingesetzt, um den Status verschiedener Teile der Körperstruktur zu erfahren.

Bei einer bestimmten Kombination interaktiver Aktionen wird die Aufmerksamkeit zwischen dem Körperteil, der jeder Aktion entspricht, und allen anderen Aktionen automatisch abgeschirmt.

Nehmen Sie als Beispiel „eine Person, die mit einem Schrank auf dem Boden hockt“. Das Hocken entspricht dem Zustand des Unterkörpers, sodass die Aufmerksamkeit, die auf andere Teile gerichtet ist, auf Null blockiert wird. Umgeschriebener Inhalt: Nehmen Sie als Beispiel „eine Person, die mit einem Schrank auf dem Boden hockt“. Das Hocken entspricht dem Zustand des Unterkörpers, sodass die Aufmerksamkeit anderer Körperteile vollständig blockiert wird. Optimierung der Szenenwahrnehmung

Der Autor nutzt geometrische und physikalische Einschränkungen für die szenenbezogene Optimierung, um die Generierungsergebnisse zu verbessern. Während des gesamten Optimierungsprozesses stellt diese Methode sicher, dass die generierte Pose nicht abweicht, während sie gleichzeitig den Kontakt mit der Szene fördert und den Körper einschränkt, um eine gegenseitige Durchdringung mit der Szene zu vermeiden

Angesichts der dreidimensionalen Szene S und der generierten SMPL-X-Parameter , der Optimierungsverlust beträgt:

Dazu gehört 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023, dass Körperscheitelpunkte mit der Szene in Kontakt kommen; 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 ist ein Kollisionsbegriff, der auf der vorzeichenbehafteten Distanz basiert; Szene und abgetasteter menschlicher Körper. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 ist ein Regularisierungsfaktor, der verwendet wird, um Parameter zu bestrafen, die von der Initialisierung abweichen. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Multiplayer Scene Interaction (MHSI)

In realen Szenen interagiert in vielen Fällen nicht nur eine Person mit der Szene, sondern mehrere Personen interagieren unabhängig oder verbunden.

Allerdings erfordern bestehende Methoden aufgrund fehlender MHSI-Datensätze meist zusätzlichen manuellen Aufwand und können diese Aufgabe nicht kontrollierbar und automatisch bewältigen.

Zu diesem Zweck nutzt der Autor nur vorhandene Einzelpersonendatensätze und schlägt eine einfache und effektive Strategie für die Richtung der Mehrpersonengenerierung vor.

Anhand einer Textbeschreibung, die sich auf mehrere Personen bezieht, analysiert der Autor diese zunächst in mehrere lokale Szenendiagramme

und interaktive Aktionen 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 und definiert den Kandidatensatz als 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023, wobei l die Anzahl der Personen ist. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Für jedes Element im Kandidatensatz wird es zunächst zusammen mit der Szene

und dem entsprechenden globalen Szenendiagramm 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 in Narrator eingegeben und dann der Optimierungsprozess durchgeführt. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Um Kollisionen zwischen Personen zu bewältigen, wird im Optimierungsprozess ein zusätzlicher Verlust

eingeführt, wobei 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 der vorzeichenbehaftete Abstand zwischen Personen ist. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Wenn der Optimierungsverlust dann niedriger ist als der auf der Grundlage experimenteller Erfahrungen ermittelte Schwellenwert, wird dieses generierte Ergebnis akzeptiert und aktualisiert

durch Hinzufügen menschlicher Knoten; andernfalls wird das generierte Ergebnis als nicht vertrauenswürdig betrachtet und aktualisiert 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023 durch Abschirmung des entsprechenden Objektknotens. 「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Es ist erwähnenswert, dass diese Aktualisierungsmethode die Beziehung zwischen den Ergebnissen jeder Generation und den Ergebnissen der vorherigen Generation herstellt, ein gewisses Maß an Überfüllung vermeidet und eine vernünftigere räumliche Verteilung und interaktiver als die einfache Mehrfachgenerierung aufweist .lebensecht. Der obige Prozess kann wie folgt ausgedrückt werden: 1], POSA [2], COINS [3] werden sinnvoll erweitert, um mit Textbeschreibungen zu arbeiten und dieselben Datensätze zum Trainieren ihrer offiziellen Modelle zu verwenden. Nach der Änderung haben wir diese Methoden PiGraph-Text, POSA-Text und COINS-Text genannt

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023Bilder

Abbildung 3 Qualitative Vergleichsergebnisse verschiedener Methoden

Abbildung 3 zeigt die qualitativen Vergleichsergebnisse von Narrator und drei Basislinien. Aufgrund der Darstellungsbeschränkungen von PiGraph-Text treten schwerwiegendere Penetrationsprobleme auf.

POSA-Text fällt während des Optimierungsprozesses häufig in lokale Minima, was zu schlechten interaktiven Kontakten führt. COINS-Text bindet Aktionen an bestimmte Objekte, es mangelt ihm an globalem Bewusstsein für die Szene, er führt zu einer Durchdringung mit nicht spezifizierten Objekten und es ist schwierig, mit komplexen räumlichen Beziehungen umzugehen.

Im Gegensatz dazu kann der Erzähler auf der Grundlage verschiedener Ebenen von Textbeschreibungen korrekte Überlegungen zu räumlichen Beziehungen anstellen und Körperzustände bei mehreren Aktionen analysieren, wodurch bessere Generierungsergebnisse erzielt werden.

In Bezug auf den quantitativen Vergleich übertrifft Narrator, wie in Tabelle 1 gezeigt, andere Methoden in fünf Indikatoren, was zeigt, dass die mit dieser Methode generierten Ergebnisse eine genauere Textkonsistenz und eine bessere physische Plausibilität aufweisen.

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023Tabelle 1 Quantitative Vergleichsergebnisse verschiedener Methoden

Darüber hinaus bietet der Autor detaillierte Vergleiche und Analysen, um die Wirksamkeit der vorgeschlagenen MHSI-Strategie besser zu verstehen.

Angesichts der Tatsache, dass es derzeit keine Arbeit an MHSI gibt, wählten sie einen unkomplizierten Ansatz als Basis, nämlich sequentielle Generierung und Optimierung mit COINS.

Um einen fairen Vergleich zu ermöglichen, wird auch ein künstlicher Kollisionsverlust eingeführt. Abbildung 4 und Tabelle 2 zeigen die qualitativen bzw. quantitativen Ergebnisse, die beide deutlich beweisen, dass die vom Autor vorgeschlagene Strategie auf MHSI semantisch konsistent und physikalisch sinnvoll ist.

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023Abbildung 4 Qualitativer Vergleich mit MHSI unter Verwendung der sequentiellen Generierungs- und Optimierungsmethode von COINS

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Über den Autor

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Die Hauptrichtungen der Forschung umfassen drei -dimensionales Sehen, Computer Vision und Erzeugung von Interaktionen zwischen Mensch und Szene

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Hauptforschungsrichtungen: dreidimensionales Sehen, Computer Vision, Rekonstruktion des menschlichen Körpers und der Kleidung

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

Die Forschungsrichtungen umfassen hauptsächlich dreidimensionales Sehen Vision, Computer Vision und Bilderzeugung. Die Forschungsrichtung konzentriert sich hauptsächlich auf menschzentrierte Computer Vision und Grafik. Hauptforschungsrichtungen: Computergrafik, dreidimensionales Sehen und Computerfotografie

Persönlicher Homepage-Link: https://liuyebin.com/「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

[ 1] Savva M, Chang A M, Ghosh P, Tesch J, et al. 14718.

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023[3] Zhao K, Wang S, Zhang Y, et al. Kompositionelle Mensch-Szenen-Interaktionssynthese mit semantischer Kontrolle[C].

Das obige ist der detaillierte Inhalt vonNeuer Durchbruch in der „interaktiven Generierung von Personen und Szenen'! Tianda University und Tsinghua University veröffentlichen Narrator: textgesteuert, natürlich kontrollierbar |. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie lässt sich das Long-Tail-Problem in autonomen Fahrszenarien lösen? Wie lässt sich das Long-Tail-Problem in autonomen Fahrszenarien lösen? Jun 02, 2024 pm 02:44 PM

Gestern wurde ich während des Interviews gefragt, ob ich irgendwelche Long-Tail-Fragen gestellt hätte, also dachte ich, ich würde eine kurze Zusammenfassung geben. Das Long-Tail-Problem des autonomen Fahrens bezieht sich auf Randfälle bei autonomen Fahrzeugen, also mögliche Szenarien mit geringer Eintrittswahrscheinlichkeit. Das wahrgenommene Long-Tail-Problem ist einer der Hauptgründe, die derzeit den betrieblichen Designbereich intelligenter autonomer Einzelfahrzeugfahrzeuge einschränken. Die zugrunde liegende Architektur und die meisten technischen Probleme des autonomen Fahrens wurden gelöst, und die verbleibenden 5 % der Long-Tail-Probleme wurden nach und nach zum Schlüssel zur Einschränkung der Entwicklung des autonomen Fahrens. Zu diesen Problemen gehören eine Vielzahl fragmentierter Szenarien, Extremsituationen und unvorhersehbares menschliches Verhalten. Der „Long Tail“ von Randszenarien beim autonomen Fahren bezieht sich auf Randfälle in autonomen Fahrzeugen (AVs). Randfälle sind mögliche Szenarien mit geringer Eintrittswahrscheinlichkeit. diese seltenen Ereignisse

Der perfekte Leitfaden für Tsinghua Mirror Source: Machen Sie Ihre Softwareinstallation reibungsloser Der perfekte Leitfaden für Tsinghua Mirror Source: Machen Sie Ihre Softwareinstallation reibungsloser Jan 16, 2024 am 10:08 AM

Tsinghua Image Source-Nutzungsleitfaden: Um Ihre Softwareinstallation reibungsloser zu gestalten, sind spezifische Codebeispiele erforderlich. Im täglichen Gebrauch von Computern müssen wir häufig verschiedene Software installieren, um unterschiedliche Anforderungen zu erfüllen. Allerdings stoßen wir bei der Installation von Software häufig auf Probleme wie eine langsame Download-Geschwindigkeit und die fehlende Verbindungsfähigkeit, insbesondere bei der Verwendung ausländischer Spiegelquellen. Um dieses Problem zu lösen, stellt die Tsinghua-Universität eine Spiegelquelle bereit, die umfangreiche Softwareressourcen bereitstellt und eine sehr schnelle Download-Geschwindigkeit aufweist. Lassen Sie uns als Nächstes etwas über die Nutzungsstrategie der Tsinghua-Spiegelquelle erfahren. Erste,

In welchen Szenarien tritt ClassCastException in Java auf? In welchen Szenarien tritt ClassCastException in Java auf? Jun 25, 2023 pm 09:19 PM

Java ist eine stark typisierte Sprache, die zur Laufzeit einen Datentypabgleich erfordert. Aufgrund des strikten Typkonvertierungsmechanismus von Java tritt bei einer Nichtübereinstimmung des Datentyps im Code eine ClassCastException auf. ClassCastException ist eine der häufigsten Ausnahmen in der Java-Sprache. In diesem Artikel werden die Ursachen von ClassCastException und deren Vermeidung vorgestellt. Was ist ClassCastException?

Haben Sie diese Stresstest-Tools für Linux-Systeme verwendet? Haben Sie diese Stresstest-Tools für Linux-Systeme verwendet? Mar 21, 2024 pm 04:12 PM

Sind Sie als Betriebs- und Wartungspersonal schon einmal auf dieses Szenario gestoßen? Sie müssen Tools verwenden, um eine hohe CPU- oder Speicherauslastung des Systems zu testen, um Alarme auszulösen, oder die Parallelitätsfähigkeiten des Dienstes durch Stresstests testen. Als Betriebs- und Wartungsingenieur können Sie mit diesen Befehlen auch Fehlerszenarien nachbilden. Dann kann Ihnen dieser Artikel dabei helfen, häufig verwendete Testbefehle und -tools zu beherrschen. 1. Einleitung Um Probleme im Projekt zu lokalisieren und zu reproduzieren, müssen in manchen Fällen Tools zur Durchführung systematischer Stresstests zur Simulation und Wiederherstellung von Fehlerszenarien eingesetzt werden. Zu diesem Zeitpunkt sind Test- oder Stresstest-Tools besonders wichtig. Als Nächstes werden wir die Verwendung dieser Tools in verschiedenen Szenarien untersuchen. 2. Testtools 2.1 Tool zur Netzwerkgeschwindigkeitsbegrenzung tctc ist ein Befehlszeilentool zum Anpassen von Netzwerkparametern unter Linux. Es kann zur Simulation verschiedener Netzwerke verwendet werden.

In zwei Sätzen: Lassen Sie die KI VR-Szenen generieren! Oder eine Art 3D- oder HDR-Panorama? In zwei Sätzen: Lassen Sie die KI VR-Szenen generieren! Oder eine Art 3D- oder HDR-Panorama? Apr 12, 2023 am 09:46 AM

​Big Data Digest Produziert von: Caleb In letzter Zeit kann man sagen, dass ChatGPT äußerst beliebt ist. Am 30. November veröffentlichte OpenAI den Chat-Roboter ChatGPT und stellte ihn der Öffentlichkeit kostenlos zum Testen zur Verfügung. Seitdem ist er in China weit verbreitet. Mit einem Roboter zu sprechen bedeutet, den Roboter aufzufordern, eine bestimmte Anweisung auszuführen, beispielsweise ein Schlüsselwort einzugeben und die KI das entsprechende Bild generieren zu lassen. Das scheint nicht ungewöhnlich zu sein. Hat OpenAI im April nicht auch eine neue Version von DALL-E aktualisiert? OpenAI, wie alt bist du? (Warum sind es immer Sie?) Was wäre, wenn Digest sagen würde, dass es sich bei den generierten Bildern um 3D-Bilder, HDR-Panoramen oder VR-basierte Bildinhalte handelt? Kürzlich Singapur

Tsinghua Optics AI erscheint in der Natur! Physisches neuronales Netzwerk, Backpropagation ist nicht mehr erforderlich Tsinghua Optics AI erscheint in der Natur! Physisches neuronales Netzwerk, Backpropagation ist nicht mehr erforderlich Aug 10, 2024 pm 10:15 PM

Die Ergebnisse der Tsinghua-Universität mithilfe von Licht zum Trainieren neuronaler Netze wurden kürzlich in Nature veröffentlicht! Was soll ich tun, wenn ich den Backpropagation-Algorithmus nicht anwenden kann? Sie schlugen eine Trainingsmethode im Fully Forward Mode (FFM) vor, die den Trainingsprozess direkt im physischen optischen System durchführt und so die Einschränkungen herkömmlicher digitaler Computersimulationen überwindet. Vereinfacht ausgedrückt war es früher notwendig, das physikalische System im Detail zu modellieren und diese Modelle dann auf einem Computer zu simulieren, um das Netzwerk zu trainieren. Die FFM-Methode eliminiert den Modellierungsprozess und ermöglicht es dem System, experimentelle Daten direkt zum Lernen und zur Optimierung zu nutzen. Dies bedeutet auch, dass beim Training nicht mehr jede Schicht von hinten nach vorne überprüft werden muss (Backpropagation), sondern die Parameter des Netzwerks direkt von vorne nach hinten aktualisiert werden können. Um eine Analogie wie ein Puzzle zu verwenden: Backpropagation

Lernen Sie, gängige Kafka-Befehle zu verwenden und flexibel auf verschiedene Szenarien zu reagieren. Lernen Sie, gängige Kafka-Befehle zu verwenden und flexibel auf verschiedene Szenarien zu reagieren. Jan 31, 2024 pm 09:22 PM

Grundlagen zum Erlernen von Kafka: Beherrschen Sie allgemeine Befehle und bewältigen Sie problemlos verschiedene Szenarien. 1. Erstellen Sie Topicbin/kafka-topics.sh--create--topicmy-topic--partitions3--replication-factor22. -list3. Themendetails anzeigen bin/kafka-to

Lassen Sie uns über die Modellfusionsmethode großer Modelle sprechen Lassen Sie uns über die Modellfusionsmethode großer Modelle sprechen Mar 11, 2024 pm 01:10 PM

In früheren Praktiken wurde die Modellfusion häufig verwendet, insbesondere in Diskriminanzmodellen, wo sie als eine Methode angesehen wird, die die Leistung stabil verbessern kann. Allerdings ist die Funktionsweise generativer Sprachmodelle aufgrund des damit verbundenen Decodierungsprozesses nicht so einfach wie bei diskriminativen Modellen. Darüber hinaus sind aufgrund der zunehmenden Anzahl von Parametern großer Modelle in Szenarien mit größeren Parameterskalen die Methoden, die beim einfachen Ensemble-Lernen berücksichtigt werden können, eingeschränkter als beim maschinellen Lernen mit niedrigen Parametern, wie z. B. klassisches Stapeln, Boosten usw Andere Methoden, weil Stapelmodelle Das Parameterproblem kann nicht einfach erweitert werden. Daher erfordert das Ensemble-Lernen für große Modelle sorgfältige Überlegungen. Im Folgenden erläutern wir fünf grundlegende Integrationsmethoden, nämlich Modellintegration, probabilistische Integration, Grafting Learning, Crowdsourcing-Voting und MOE

See all articles