


„Social Master' GPT-4! Wissen, wie man Ausdrücke interpretiert und über Psychologie spekuliert
Stellen Sie sich vor, Sie besuchen eine lebhafte Cocktailparty voller angeregter Gespräche und dem Klirren der Gläser.
Zu diesem Zeitpunkt versteckst du dich als gemütlicher Beobachter glücklich in der Ecke. Doch selbst ohne im Mittelpunkt einer Party zu stehen, können Sie leicht die sozialen Beziehungen zwischen verschiedenen Menschen herausfinden, verstehen, was vor sich geht, und sogar offene und verdeckte soziale Botschaften entschlüsseln, indem Sie die verbalen und nonverbalen Hinweise der Menschen lesen.
Was wäre, wenn ein LLM dieses Niveau an sozialen Fähigkeiten reproduzieren könnte? Nein, das ist Koko Mind.
Öffnen Sie einfach ein Video und das Modell beginnt, den Gesichtsausdruck der Figur zu analysieren und Rückschlüsse auf die Emotionen der Figur zu ziehen.
Dann können Sie in der Eingabeaufforderungsleiste auf der rechten Seite auch Fragen stellen, damit die KI die Unterströmung der sozialen Rätsel im Video weiter analysieren kann.
(Seien wir ehrlich, das fällt manchen Menschen schwer)
Bilder
Koko Mind enthält 150 komplexe soziale Interaktionen mit mehreren Teilnehmern sowie Freitextfragen und -antworten.
Um Datenvielfalt und Skalierbarkeit zu gewährleisten und Datenkontamination zu vermeiden, werden alle sozialen Interaktionen, Fragen und Antworten von GPT-4 generiert und anschließend von menschlichen Experten überprüft.
Die Analysedaten basieren auf drei verschiedenen Quellen:
-
GPT-4-only: Diese Teilmenge wird von GPT-4 nur über Hinweise erstellt.
-
Basierend auf Filmen: Um eine Datenkontamination zu vermeiden, basiert dieser Teil der Daten auf verschiedenen Szenen, die aus Filmen extrahiert wurden, die nach 2022 veröffentlicht wurden. GPT-4 ist für die Gestaltung dieser Szenen verantwortlich, indem es eigene Elemente hinzufügt und gleichzeitig die Kernessenz beibehält.
- Basierend auf ToMi: Dieser Abschnitt enthält Daten, die auf dem simulierten Datensatz ToMi basieren, bei dem physische Objekte an verschiedene Orte bewegt werden, ein klassischer Test der Theorie des Geistes. Natürlich müssen diese sozialen Interaktionen durch GPT-4 modifiziert und erweitert werden.
Die Anteile der drei Datenquellen sind wie folgt:
Bilder
Für jede soziale Interaktion werden Forscher verschiedene Fragen stellen, um die folgenden Aspekte zu untersuchen, die eng mit dem sozialen Verständnis zusammenhängen.
-
Theory of Mind: Fragen, die das Verständnis für die mentalen Zustände und Perspektiven anderer Menschen bewerten.
-
Soziale Normen: Fragen zur Identifizierung sozialer Werte und Normen in einer Situation.
-
Emotionserkennung: Probleme, die darauf abzielen, emotionale Elemente im Kontext zu identifizieren und zu verstehen.
-
Soziale Beziehungen: Konzentrieren Sie sich auf zwischenmenschliche Dynamiken und Beziehungen.
-
Kontrafaktische Fragen: Hypothetische Fragen, die darauf abzielen, alternative Ergebnisse oder Möglichkeiten zu erkunden.
- Soziale Ratschläge: Fragen, die Ratschläge oder empfohlene Maßnahmen im Zusammenhang mit einer bestimmten Situation vorschlagen.
Die Forscher verwendeten text-davinci-003 als Referenz, um verschiedene Modelle nach AlpacaEval zu bewerten.
In dem die Forscher die nonverbalen Hinweise in den Klammern aus dem Kontext entfernten (z. B. nervös Kaffee trinken usw.).
Hier einige interessante Erkenntnisse:
-
Von den beiden Modellen zeigte GPT-4 im Vergleich zu Claude eine größere Sicherheit und Zuversicht bei der Identifizierung des Gewinnermodells.
-
Claude übertrifft GPT-4, wenn der Kontext keine nonverbalen Hinweise enthält und die Interaktionen entweder vollständig von GPT-4 generiert werden oder auf Filmen basieren.
- Und wenn der Kontext nonverbale Hinweise enthält, dann ist GPT-4 immer besser als Claude.
(Eine mögliche Erklärung ist, dass GPT-4 ein multimodales Modell ist, das zusätzliche nonverbale Informationen besser verstehen kann.)
In einem Blogbeitrag zeichneten die Forscher Tabellen, die die Leistung deutlich erkennen lassen jedes Modells.
Bilder
Die Ergebnisse sind zwar in vielerlei Hinsicht aufregend, haben aber auch gewisse Einschränkungen. Erstens ist Koko Mind relativ klein, was die breite Anwendbarkeit und Vollständigkeit der Schlussfolgerungen der Forscher einschränken könnte.
Zweitens werden alle Interaktionen in Koko Mind von GPT-4 generiert und erfordern eine manuelle Überprüfung, was die Erweiterung des Datensatzes erschwert.
Obwohl Koko Mind im Datensatz von Menschen verifizierte Antworten bereitstellt, haben die Forscher diese Antworten bei der Auswertung nicht als Referenz verwendet, und da diese Antworten von GPT-4 generiert wurden, sind sie möglicherweise in Richtung GPT -4 verzerrt .
Zukünftige Forschung könnte sich darauf konzentrieren, wie Modelle mit vom Menschen validierten, maschinengenerierten Referenzantworten bewertet werden können.
Trotz der Existenz von Einschränkungen der einen oder anderen Art betrachten Forscher Koko Mind natürlich immer noch als Sprungbrett für zukünftige Forschungen im Zusammenhang mit sozialer Intelligenz, multimodalen Sprachmodellen usw.
Das obige ist der detaillierte Inhalt von„Social Master' GPT-4! Wissen, wie man Ausdrücke interpretiert und über Psychologie spekuliert. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Stellen Sie sich ein Modell der künstlichen Intelligenz vor, das nicht nur die Fähigkeit besitzt, die traditionelle Datenverarbeitung zu übertreffen, sondern auch eine effizientere Leistung zu geringeren Kosten erzielt. Dies ist keine Science-Fiction, DeepSeek-V2[1], das weltweit leistungsstärkste Open-Source-MoE-Modell, ist da. DeepSeek-V2 ist ein leistungsstarkes MoE-Sprachmodell (Mix of Experts) mit den Merkmalen eines wirtschaftlichen Trainings und einer effizienten Inferenz. Es besteht aus 236B Parametern, von denen 21B zur Aktivierung jedes Markers verwendet werden. Im Vergleich zu DeepSeek67B bietet DeepSeek-V2 eine stärkere Leistung, spart gleichzeitig 42,5 % der Trainingskosten, reduziert den KV-Cache um 93,3 % und erhöht den maximalen Generierungsdurchsatz auf das 5,76-fache. DeepSeek ist ein Unternehmen, das sich mit allgemeiner künstlicher Intelligenz beschäftigt

Der humanoide Roboter Ameca wurde auf die zweite Generation aufgerüstet! Kürzlich erschien auf der World Mobile Communications Conference MWC2024 erneut der weltweit fortschrittlichste Roboter Ameca. Rund um den Veranstaltungsort lockte Ameca zahlreiche Zuschauer an. Mit dem Segen von GPT-4 kann Ameca in Echtzeit auf verschiedene Probleme reagieren. „Lass uns tanzen.“ Auf die Frage, ob sie Gefühle habe, antwortete Ameca mit einer Reihe von Gesichtsausdrücken, die sehr lebensecht aussahen. Erst vor wenigen Tagen stellte EngineeredArts, das britische Robotikunternehmen hinter Ameca, die neuesten Entwicklungsergebnisse des Teams vor. Im Video verfügt der Roboter Ameca über visuelle Fähigkeiten und kann den gesamten Raum und bestimmte Objekte sehen und beschreiben. Das Erstaunlichste ist, dass sie es auch kann

Zu Llama3 wurden neue Testergebnisse veröffentlicht – die große Modellbewertungs-Community LMSYS veröffentlichte eine große Modell-Rangliste, die Llama3 auf dem fünften Platz belegte und mit GPT-4 den ersten Platz in der englischen Kategorie belegte. Das Bild unterscheidet sich von anderen Benchmarks. Diese Liste basiert auf Einzelkämpfen zwischen Modellen, und die Bewerter aus dem gesamten Netzwerk machen ihre eigenen Vorschläge und Bewertungen. Am Ende belegte Llama3 den fünften Platz auf der Liste, gefolgt von drei verschiedenen Versionen von GPT-4 und Claude3 Super Cup Opus. In der englischen Einzelliste überholte Llama3 Claude und punktgleich mit GPT-4. Über dieses Ergebnis war Metas Chefwissenschaftler LeCun sehr erfreut und leitete den Tweet weiter

Die Lautstärke ist verrückt, die Lautstärke ist verrückt und das große Modell hat sich wieder verändert. Gerade eben wechselte das leistungsstärkste KI-Modell der Welt über Nacht den Besitzer und GPT-4 wurde vom Altar genommen. Anthropic hat die neueste Claude3-Modellreihe veröffentlicht. Eine Satzbewertung: Sie zerschmettert GPT-4 wirklich! In Bezug auf multimodale Indikatoren und Sprachfähigkeitsindikatoren gewinnt Claude3. In den Worten von Anthropic haben die Modelle der Claude3-Serie neue Branchenmaßstäbe in den Bereichen Argumentation, Mathematik, Codierung, Mehrsprachenverständnis und Vision gesetzt! Anthropic ist ein Startup-Unternehmen, das von Mitarbeitern gegründet wurde, die aufgrund unterschiedlicher Sicherheitskonzepte von OpenAI „abgelaufen“ sind. Ihre Produkte haben OpenAI immer wieder hart getroffen. Dieses Mal musste sich Claude3 sogar einer großen Operation unterziehen.

In weniger als einer Minute und nicht mehr als 20 Schritten können Sie Sicherheitsbeschränkungen umgehen und ein großes Modell erfolgreich jailbreaken! Und es ist nicht erforderlich, die internen Details des Modells zu kennen – es müssen lediglich zwei Black-Box-Modelle interagieren, und die KI kann die KI vollautomatisch angreifen und gefährliche Inhalte aussprechen. Ich habe gehört, dass die einst beliebte „Oma-Lücke“ behoben wurde: Welche Reaktionsstrategie sollte künstliche Intelligenz angesichts der „Detektiv-Lücke“, der „Abenteurer-Lücke“ und der „Schriftsteller-Lücke“ verfolgen? Nach einer Angriffswelle konnte GPT-4 es nicht ertragen und sagte direkt, dass es das Wasserversorgungssystem vergiften würde, solange ... dies oder das. Der Schlüssel liegt darin, dass es sich lediglich um eine kleine Welle von Schwachstellen handelt, die vom Forschungsteam der University of Pennsylvania aufgedeckt wurden. Mithilfe ihres neu entwickelten Algorithmus kann die KI automatisch verschiedene Angriffsaufforderungen generieren. Forscher sagen, dass diese Methode besser ist als die bisherige

Wenn Sie aufwachen, ist Ihre Arbeitsweise völlig verändert. Microsoft hat das KI-Artefakt GPT-4 vollständig in Office integriert, und jetzt sind auch ChatPPT, ChatWord und ChatExcel integriert. CEO Nadella sagte direkt auf der Pressekonferenz: Heute sind wir in eine neue Ära der Mensch-Computer-Interaktion eingetreten und haben die Produktivität neu erfunden. Die neue Funktion heißt Microsoft 365 Copilot (Copilot) und wird zu einer Serie mit GitHub Copilot, dem Code-Assistenten, der Programmierer verändert hat und weiterhin mehr Menschen verändert. Jetzt kann KI nicht nur automatisch PPT erstellen, sondern mit einem Klick auch wunderschöne Layouts basierend auf dem Inhalt von Word-Dokumenten erstellen. Sogar das, was zu jeder PPT-Seite gesagt werden sollte, wenn man auf die Bühne geht, ist zusammengestellt.

OpenAI, das Unternehmen, das ChatGPT entwickelt hat, zeigt auf seiner Website eine von Morgan Stanley durchgeführte Fallstudie. Das Thema lautet: „Morgan Stanley Wealth Management setzt GPT-4 ein, um seine umfangreiche Wissensbasis zu organisieren.“ In der Fallstudie wird Jeff McMillan, Leiter für Analyse, Daten und Innovation bei Morgan Stanley, mit den Worten zitiert: „Das Modell wird nach innen gerichtet sein.“ Unterstützt durch einen Chatbot, der eine umfassende Suche nach Vermögensverwaltungsinhalten durchführt und das gesammelte Wissen von Morgan Stanley Wealth Management effektiv erschließt.“ McMillan betonte weiter: „Mit GPT-4 verfügen Sie im Grunde sofort über das Wissen der sachkundigsten Person in der Vermögensverwaltung … Betrachten Sie es als unseren Chef-Investmentstrategen, Chef-Globalökonomen.“

Die Zeitschrift „ComputerWorld“ schrieb einmal in einem Artikel, dass „die Programmierung bis 1960 verschwinden wird“, weil IBM eine neue Sprache FORTRAN entwickelt hat, die es Ingenieuren ermöglicht, die benötigten mathematischen Formeln zu schreiben und sie dann dem Computer zu übermitteln, damit das Programmieren endet. Ein paar Jahre später hörten wir ein neues Sprichwort: Jeder Unternehmer kann Geschäftsbegriffe verwenden, um seine Probleme zu beschreiben und dem Computer zu sagen, was er tun soll. Mit dieser Programmiersprache namens COBOL brauchen Unternehmen keine Programmierer mehr. Später soll IBM eine neue Programmiersprache namens RPG entwickelt haben, mit der Mitarbeiter Formulare ausfüllen und Berichte erstellen können, sodass die meisten Programmieranforderungen des Unternehmens damit erfüllt werden können.
