Kreativität ist eine einzigartige menschliche Fähigkeit, die es uns ermöglicht, neuartige, wertvolle und bedeutungsvolle Werke wie Kunst, Literatur, Wissenschaft, Technologie usw. zu schaffen. Kreativität ist auch eine wichtige treibende Kraft in der menschlichen Gesellschaft. Sie fördert Entwicklung und Fortschritt in Kultur, Wirtschaft, Bildung und anderen Bereichen. Was genau ist Kreativität? Wie kam es dazu? Wie wird es bewertet und verbessert? Diese Fragen beschäftigen Forscher verschiedener Disziplinen wie Psychologen, Kognitionswissenschaftler und Philosophen. Mit der rasanten Entwicklung der Technologie der künstlichen Intelligenz (KI) haben diese Themen auch im KI-Bereich Aufmerksamkeit erregt. Kann KI so kreativ sein wie Menschen? Wenn ja, wie definieren, messen und fördern Sie KI-Kreativität? Diese Fragen haben nicht nur theoretische Bedeutung, sondern auch praktischen Wert, da die Kreativität der KI die Anwendung und Entwicklung der KI in verschiedenen Bereichen beeinflussen wird.
Das akademische Forum für Wissenschaft und Technologie arxiv.org veröffentlichte am 3. Januar den neuesten Artikel „Kann KI so kreativ sein wie Menschen?“. Der Artikel wurde von vielen bekannten KI-Forschern aus den USA, Großbritannien und Singapur verfasst Dieses von zwei Kollegen gemeinsam verfasste Papier ist eine eingehende Untersuchung der KI-Kreativität. Es schlägt ein neuartiges Kreativitätsbewertungsparadigma vor, nämlich die relative Kreativität, und legt einen quantifizierbaren Kreativitätsrahmen fest Kreativität. Das Papier treibt nicht nur theoretische Diskussionen voran, sondern stellt auch praktische Werkzeuge und Methoden zur Bewertung und Verbesserung des kreativen Potenzials von KI bereit. Die wichtigsten Beiträge und Innovationen dieses Papiers sind wie folgt:
schlägt das Konzept der relativen Kreativität vor und wandelt die Kreativitätsbewertung von KI-Systemen von einem absoluten Standard in einen Vergleich mit einem bestimmten menschlichen Schöpfer um, wodurch dies im kreativen Prozess berücksichtigt wird inhärente Subjektivität und stützt sich auf die vergleichende Methode zur Beurteilung der Intelligenz aus dem Turing-Test. Dieser innovative Ansatz vergleicht KI-Kreativität mit menschlicher Kreativität und ermöglicht uns so ein besseres Verständnis der Leistung und Fähigkeiten von KI-Systemen im kreativen Prozess. Durch die Einbeziehung der Subjektivität in das Bewertungssystem können wir die Kreativität von KI-Systemen umfassender beurteilen und sie mit menschlichen Schöpfern vergleichen, wodurch sie besser wird.
Um die Kreativität von KI zu bewerten, wird das Konzept der statistischen Kreativität eingeführt, a Methode, die Theoriebildung und empirische Bewertung kombiniert. Diese Methode konzentriert sich darauf, ob KI den kreativen Output einer bestimmten Personengruppe nachahmen kann, wodurch die Kreativität der KI quantitativ bewertet und die praktische Anwendbarkeit des theoretischen Rahmens verbessert wird.
Die Anwendung statistischer Kreativität auf autoregressive Modelle ist eine weit verbreitete Sprachmodellierungstechnik. Diese Technik gilt als etwas kreativ und verfügt über eine praktische Metrik zur Bewertung der statistischen Kreativität eines Modells. Insbesondere im Hinblick auf die Vorhersage der nächsten Marke lässt sich diese Metrik an die Anforderungen moderner KI-Modelle anpassen und zeigt das Potenzial, mit dem technologischen Fortschritt Schritt zu halten.
Die Forschung führt eine objektive Funktion namens „Statistischer Kreativitätsverlust“ für das Training kreativer KI-Modelle ein. Die Studie analysiert auch die Obergrenze des statistischen Kreativitätsverlusts und die damit verbundenen Konzepte zur Generalisierung beim Deep Learning, wie z. B. Rademacher-Komplexität, gegenseitige Information und ε-Abdeckungszahl. Diese theoretischen Anleitungen und praktischen Maßnahmen leisten wichtige Hilfe bei der Förderung der kreativen Fähigkeiten von KI-Modellen.
Kreativität ist eine Fähigkeit, die schwer zu definieren und zu messen ist, da sie subjektive, situative, mehrdimensionale und dynamische Faktoren beinhaltet. Es kann unterschiedliche Ansichten und Standards darüber geben, was Kreativität ist und was kreative Arbeit ist. Daher ist es unrealistisch und unfair, eine absolute Definition von Kreativität zu geben oder KI-Systemen eine absolute Kreativitätsbewertung zu geben. Der Autor ist der Ansicht, dass die Bewertung der Kreativität relativ und nicht absolut sein sollte, das heißt, die Kreativität von KI-Systemen sollte auf der Grundlage der Ebenen und Eigenschaften verschiedener menschlicher Schöpfer verglichen werden. Auf diese Weise ist die Beurteilung von Kreativität kein statischer, fester und einheitlicher Standard mehr, sondern ein dynamischer, flexibler und vielfältiger Prozess, der die Natur und Vielfalt der Kreativität besser widerspiegeln kann.
Der Autor schlug das Konzept der relativen Kreativität (Relative Kreativität) vor und definierte es wie folgt: Ein KI-System gilt als relativ kreativ, wenn es basierend auf den biografischen Informationen des Schöpfers Informationen generieren kann, die denen eines bestimmten menschlichen Schöpfers ähneln. Wenn das Werk nicht zu unterscheiden ist, kann das KI-System als ebenso kreativ wie dieser Schöpfer angesehen werden. Die „Relativität“ der relativen Kreativität spiegelt sich darin wider, dass sie von den Unterschieden zwischen den verglichenen Individuen abhängt. Beispielsweise könnte ein KI-System im Vergleich zu einem nicht fachkundigen menschlichen Schöpfer sehr kreativ erscheinen, im Vergleich zu einem erfahrenen Designer oder Künstler jedoch weniger kreativ. Relative Kreativität berücksichtigt auch die Subjektivität der Kreativität, wie Originalität, divergentes Denken und Problemlösungsfähigkeiten, die in den Auswahlprozess einfließen, der menschliche Schöpfer verankert. Da die Beurteilung der Kreativität auf einer menschlichen Perspektive basiert, ist das Konzept der relativen Kreativität auch vom Turing-Test inspiriert, einer vergleichenden Methode zur Beurteilung der KI-Intelligenz, indem beurteilt wird, ob ein KI-System mit Menschen konkurrieren kann.
Bilder
Abbildung 1: Darstellung der relativen Kreativität und der statistischen Kreativität. In Abbildung 1 erklären wir die relative Kreativität (a) und die statistische Kreativität (b). Unter relativer Kreativität versteht man die Beurteilung der Fähigkeit einer KI, unter Berücksichtigung derselben biografischen Einflüsse Kunst zu schaffen, die praktisch nicht von einem hypothetischen menschlichen Schöpfer zu unterscheiden ist. Statistische Kreativität hingegen wird bewertet, indem die Fähigkeit KI-generierter Kreationen gemessen wird, nicht von vorhandenen menschlichen Schöpfern zu unterscheiden, wie durch eine Verteilungsdistanzmetrik bestimmt.
Relative Kreativität weist einige Ähnlichkeiten mit dem Turing-Test auf, es gibt jedoch auch einige Unterschiede. Die Ähnlichkeit besteht darin, dass sie alle auf einer menschlichen Perspektive basieren und die Fähigkeiten des KI-Systems bewerten, indem sie die Leistung des KI-Systems mit der von Menschen vergleichen. Der Unterschied besteht darin, dass das Ziel des Turing-Tests darin besteht, die Intelligenz eines KI-Systems zu bewerten, während das Ziel der relativen Kreativität darin besteht, die Kreativität eines KI-Systems zu bewerten. Intelligenz und Kreativität sind zwei verschiedene Dimensionen, die sich möglicherweise überschneiden, aber auch einige Unterschiede aufweisen. Beispielsweise kann ein KI-System intelligent, aber nicht unbedingt kreativ sein und umgekehrt. Ein weiterer Unterschied besteht darin, dass die Beurteilung des Turing-Tests auf Gesprächen basiert, während die Beurteilung der relativen Kreativität auf der Arbeit basiert. Dialog ist ein interaktiver, dynamischer Echtzeitprozess, während Arbeit ein statisches, festes, verzögertes Ergebnis ist. Daher kann die Beurteilung der relativen Kreativität schwieriger sein, da hierfür mehr Faktoren wie Stil, Inhalt, Qualität, Originalität usw. der Arbeit berücksichtigt werden müssen. Der Autor ist der Ansicht, dass relative Kreativität eine umfassendere und tiefergehende Methode zur Bewertung von Kreativität ist, die nicht nur die Leistung des KI-Systems, sondern auch den Hintergrund und die Eigenschaften des menschlichen Schöpfers berücksichtigt.
Obwohl das Konzept der relativen Kreativität aufschlussreich ist, fehlt ihm noch eine operative Bewertungsmethode. Um diesen Mangel auszugleichen, führt der Autor das Konzept der statistischen Kreativität (Statistische Kreativität) ein, das wie folgt definiert ist: Ein KI-System gilt als statistisch kreativ, wenn es bei einer gegebenen Gruppe menschlicher Schöpfer Folgendes erzeugen kann: nicht vom kreativen Output der Gruppe zu unterscheiden ist, dann kann das KI-System als genauso kreativ angesehen werden wie die Gruppe. Der „statistische“ Charakter der statistischen Kreativität spiegelt sich darin wider, dass sie die Kreativität von KI-Systemen auf der Grundlage beobachtbarer Daten und nicht auf der Grundlage abstrakter Standards bewertet.
Bilder
Der Autor schlug ein Maß für statistische Kreativität vor, nämlich E0(q), ein empirisches Maß, das verwendet wird, um den Unterschied zwischen den kreativen Fähigkeiten eines KI-Modells und der Ununterscheidbarkeit einer Gruppe menschlicher Schöpfer abzuschätzen . Je niedriger der Wert von E0(q), desto besser kann das KI-Modell die kreative Fähigkeit der Gruppe nachahmen. Der Autor gibt auch einen Satz der statistischen Kreativität an, der die Bedingungen verdeutlicht, unter denen ein KI-Modell als δ-kreativ eingestuft werden kann, d. h. E0(q)
Autoregressive Modelle sind eine gängige Technik von Large Language Models (LLMs), die kohärenten Text generiert, indem sie das nächste Token basierend auf der vorherigen Textsequenz der Wahrscheinlichkeitsverteilung vorhersagt. Autoregressiven Modellen wird aufgrund ihrer Fähigkeit, neuartige Texte wie Gedichte, Geschichten, Codes usw. zu generieren, ein gewisses Maß an Kreativität zugeschrieben. Allerdings ist die Frage, wie die Kreativität autoregressiver Modelle bewertet und verbessert werden kann, noch offen. Die Autoren wenden das Konzept der statistischen Kreativität auf autoregressive Modelle an und schlagen ein Maß für die statistische Kreativität für die Vorhersage des nächsten Tokens vor, nämlich E1(q), ein empirisches Maß zur Schätzung eines autoregressiven Modells und einer Ununterscheidbarkeit zwischen den kreativen Fähigkeiten von Gruppen von menschliche Schöpfer. Je niedriger der Wert von E1(q), desto besser kann das autoregressive Modell die kreative Fähigkeit der Gruppe nachahmen.
Bilder
Der Autor gab auch einen Satz für die statistische Kreativität eines autoregressiven Modells an und verdeutlichte die Bedingungen, unter denen ein autoregressives Modell als Delta-Kreativität eingestuft werden kann, d. h. E1(q) < ; δ, und wir haben einen ausreichend großen Stichprobensatz für die Auswertung. Dieser Satz liefert nicht nur eine Klassifizierungsmethode für Kreativität, sondern auch einen Kreativitätsgrad, nämlich δ, der den Unterschied zwischen dem autoregressiven Modell und der kreativen Fähigkeit einer Gruppe menschlicher Schöpfer darstellt. Die Behauptung der Autoren ist einfach: Wenn ein autoregressives Modell Sequenzen (wie Gedichte oder Geschichten) erzeugen kann, die der Arbeit einer Gruppe menschlicher Künstler ähneln, dann weist es ein mit dieser Gruppe vergleichbares Maß an Kreativität auf. Um diese Bewertung zu quantifizieren, führen die Autoren die Metrik E1(q) ein.
Next-Token-Vorhersage ist die Kerntechnologie autoregressiver Modelle, die die Qualität und Vielfalt der vom Modell generierten Textsequenzen bestimmt. Die Schwierigkeit der Vorhersage des nächsten Tokens hängt vom gegebenen Kontext und der Wahrscheinlichkeit des Tokens des Ziels ab. Wenn der Kontext klar und spezifisch ist, ist es einfacher, den nächsten Token vorherzusagen, da einige Token sinnvoller und häufiger sind. Wenn der Kontext beispielsweise „Ich esse gerne“ lautet, könnte das nächste Tag „Apfel“, „Brot“, „Knödel“ usw. lauten. Wenn der Kontext jedoch vage und abstrakt ist, ist die Vorhersage des nächsten Tokens schwieriger, da viele Token ohne klaren Vorteil möglich sind. Wenn der Kontext beispielsweise „Ich möchte“ lautet, könnte das nächste Tag „Reisen“, „Studieren“, „Schlafen“ usw. lauten. In diesem Fall erfordert das autoregressive Modell eine größere Kreativität, um sinnvolle und interessante Textsequenzen zu generieren.
Die Bedeutung der Vorhersage des nächsten Tags besteht darin, dass sie den Grad der Kreativität des autoregressiven Modells und seine Ähnlichkeit mit der Kreativität menschlicher Schöpfer widerspiegelt. Ein autoregressives Modell zeigt die gleiche Kreativität wie ein menschlicher Schöpfer, wenn es den nächsten Token erzeugen kann, der nicht von der Arbeit eines menschlichen Schöpfers in einem anderen Kontext zu unterscheiden ist. Diese Bewertung der Kreativität kann durch Messungen der statistischen Kreativität wie E1(q) durchgeführt werden. Der Autor ist der Ansicht, dass diese Bewertungsmethode eine objektivere und wissenschaftlichere Methode ist, die nicht auf dem subjektiven Urteil des Menschen beruht, sondern auf der Berechnung von Daten und Wahrscheinlichkeiten basiert. Die Forschung des Autors bietet eine neue Perspektive und Methode für die Kreativität autoregressiver Modelle, die dazu beiträgt, die Generierungsfähigkeit und Qualität des Modells zu verbessern.
Prompt-konditionierte große Sprachmodelle (LLMs) sind ein hochmodernes Modellparadigma, das Prompts (Prompts) nutzen kann, um das Potenzial freizusetzen Fähigkeiten des Modells. Hinweise sind eine Methode zur Bereitstellung von Eingabe- und Ausgabeformaten für das Modell, die verwendet werden können, um das Modell bei der Ausführung verschiedener Aufgaben wie Textklassifizierung, Textgenerierung, Textzusammenfassung usw. zu unterstützen. Eingabeaufforderungen funktionieren ähnlich wie menschliche Heuristiken und stimulieren Kreativität und Flexibilität in Modellen. Allerdings bleibt die Frage offen, wie die Kreativität prompt-basierter LLMs bewertet und gesteigert werden kann. Die Autoren wenden das Konzept der statistischen Kreativität auf Cue-basierte LLMs an und schlagen ein Maß für die statistische Kreativität für verschiedene kontextuelle Cues vor, nämlich E2(q), ein empirisches Maß zur Schätzung eines Cue-basierten LLM und der Ununterscheidbarkeit des Kreativen Fähigkeiten einer Gemeinschaft menschlicher Schöpfer. Je niedriger der Wert von E2(q), desto besser kann das prompt-basierte LLM die kreative Fähigkeit der Gruppe nachahmen. Der Autor gibt auch einen Rückschluss auf die statistische Kreativität eines auf Eingabeaufforderungen basierenden LLM und erläutert die Bedingungen, unter denen ein auf Eingabeaufforderungen basierendes LLM als δ-Kreativität eingestuft werden kann, d. h. E2(q)
Statistischer Kreativitätsverlust (Statistischer Kreativitätsverlust) ist eine optimierbare Zielfunktion, die zum Trainieren kreativer KI-Modelle verwendet wird. Es wird auf der Grundlage von Maßen der statistischen Kreativität wie E0(q), E1(q) oder E2(q) definiert. Je niedriger der Wert des statistischen Kreativitätsverlusts ist, desto besser kann das KI-Modell die kreativen Fähigkeiten einer Gruppe menschlicher Schöpfer nachahmen. Die Autoren schlagen eine Obergrenze für den statistischen Kreativitätsverlust, Formel (2), und ihre Konzepte im Zusammenhang mit der Verallgemeinerung beim Deep Learning vor, wie z. B. Rademacher-Komplexität, gegenseitige Information und ε-Abdeckungszahl (ε-Abdeckungszahl) usw. Die Autoren analysieren die Obergrenze für den Verlust statistischer Kreativität als Funktion der Log-Wahrscheinlichkeit der nächsten Token-Vorhersage und der Menge an Ersteller-Produktionsdaten, die zum Erreichen statistischer Kreativität erforderlich sind. Die Ergebnisse der Autoren unterstreichen die Bedeutung der Diversität in Paaren zwischen Schöpfer und Werk und nicht einfach nur der Verfügbarkeit großer Mengen an Schöpfungsdaten. Diese Erkenntnis macht das Konzept der statistischen Kreativität insbesondere in aktuellen KI-Frameworks anwendbar, die auf der Vorhersage der nächsten Marke basieren. Die Forschung des Autors bietet nicht nur eine theoretische Perspektive, sondern leitet auch die Diskussion über KI-Kreativität, befürwortet den Einsatz relativer Bewertung zur Förderung empirischer Forschung und schafft einen Rahmen für die Bewertung und Verbesserung der kreativen Fähigkeiten von KI-Modellen.
Der Autor bespricht abschließend frühere verwandte Arbeiten zur Definition und Anwendung von Kreativität, die hauptsächlich die beiden Bereiche Sehen und Sprache betreffen. Die Autoren stellen fest, dass es zwar viele Studien gibt, die versuchen, Elemente der Kreativität in generativen Modellen anzuwenden, keine jedoch Kreativität direkt definiert oder direkt optimiert. Vielmehr zielt die Forschung der Autoren darauf ab, eine theoretische Grundlage für Kreativität zu schaffen, einen Rahmen, der natürlich frühere Erkenntnisse über die Vielfalt und Qualität der Generation einbezieht. Die Autoren erwarten, dass ihre Beiträge den Grundstein für zukünftige Forschung legen und die Verbesserung der Modellkreativität vorantreiben.
Im Bereich des Sehens haben Modelle zur Erzeugung kreativer Bilder erhebliche Fortschritte gemacht, was die Frage aufwirft, ob Maschinen kreative Kunst produzieren können. Hertzmann (2018) untersucht dieses Thema eingehend und hebt die Schnittstelle zwischen Computergrafik und künstlerischer Innovation hervor. Xu et al. (2012a) schlugen eine kreative 3D-Modellierungsmethode vor, die je nach Benutzerpräferenzen verschiedene Modelle generieren kann. Generative Adversarial Networks (GANs) (Goodfellow et al., 2014) wurden von Elgammal et al. (2017) verwendet, um die Schaffung einzigartiger künstlerischer Stile voranzutreiben, indem sie Abweichungen von bekannten Stilen maximieren. Sbai et al. (2018) verstärken diese Voreingenommenheit weiter und ermutigen das Modell, einen anderen Stil als das Trainingsset zu haben. Die kreative Generierung kann auch als kombinatorischer Prozess betrachtet werden, wobei Ge et al. (2021) und Ranaweera (2016) die Bedeutung der Integration detaillierter Elemente betonen. Auf dieser Grundlage zerlegten Vinker et al. (2023) das Konzept der Personalisierung in visuelle Elemente für eine innovative Neuorganisation, die den kreativen Output bereicherte.
Im Bereich der Sprache hat die Entwicklung von Sprachmodellen Forscher auch dazu veranlasst, zu untersuchen, wie die Nutzung von Daten optimiert werden kann, um die Anpassungsfähigkeit von Modellen in verschiedenen Bereichen, Aufgaben und Sprachen zu verbessern (Gururangan et al., 2020; Devlin et al., 2019; Conneau et al., 2020). Forscher haben auch eine Tendenz gezeigt, Sprachmodelle zu verwenden, um Nuancen in der menschlichen Kommunikation zu interpretieren (Schwartz et al., 2013; Wu et al., 2022). Diese Erkenntnisse wurden auch zur Verbesserung von Klassifizierungsmodellen genutzt (Hovy, 2015; Flek, 2020). Mit der zunehmenden Beliebtheit generativer Modelle sind Menschen auch an einer kontrollierbaren Textgenerierung interessiert, d. h. die Ausgabe des Modells muss einige Einschränkungen erfüllen, wie z. B. Höflichkeit (Saha et al., 2022; Sennrich et al., 2016), Emotion (Liu et al., 2016) al., 2021; Dathathri et al., 2019; He et al., 2020) oder andere Stilbeschränkungen. Schließlich ist auch die Textstilübertragung (TST), die den Stil des Eingabetextes in einen festgelegten Zielstil umwandelt, zu einer beliebten Aufgabe geworden. Stil kann sich auf eine Reihe unterschiedlicher text- und autorenspezifischer Merkmale beziehen, wie etwa Höflichkeit (Madaan et al., 2020), Formalität (Rao und Tetreault, 2018; Briakou et al., 2021), Einfachheit (Zhu et al. , 2021) 2010; van den Bercken et al., 2019; Cao et al., 2020), Autor (Xu et al., 2012b; Carlson et al., 2018), Geschlecht des Autors (Prabhumoye et al., 2018) und so weiter (Jin et al., 2022). Während alle diese Anwendungen versuchen, Elemente der Kreativität in generativen Modellen anzuwenden, definiert keine direkt Kreativität oder optimiert sie direkt. Stattdessen konzentrieren sie sich auf die Verbesserung der Modellleistung bei vordefinierten Aufgaben als Indikator für Kreativität. Im Gegensatz dazu zielt die Forschung der Autoren darauf ab, eine theoretische Grundlage für Kreativität zu schaffen. In diesen Rahmen fließen selbstverständlich frühere Erkenntnisse zur Vielfalt und Qualität der Generation ein. Die Autoren erwarten, dass ihre Beiträge den Grundstein für zukünftige Forschung legen und die Verbesserung der Modellkreativität vorantreiben.
Referenz: https://arxiv.org/abs/2401.01623
Das obige ist der detaillierte Inhalt vonKann künstliche Intelligenz Kreativität zeigen wie Menschen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!