


Mobvois interne Beta erforscht das Großmodell „Sequence Monkey', um exklusive Produkte für Privatpersonen und Unternehmen zu entwickeln
Am 20. April veranstaltete Mobvoi in Peking die AIGC-Strategiekonferenz 2023 mit dem Thema „AGI·Advent“. Bei dem Treffen kündigte Mobvoi einen internen Test zur Erkundung des großen Modells „Sequence Monkey“ an und schlug vor, dass CoPilot überall verfügbar sein wird. Gleichzeitig wurde basierend auf den Funktionen des großen Modells auch eine CoPilot-Produktmatrix für Entwickler und ein Upgrade eingeführt Version für die C-Seite. Fragen zur Sprachassistenten-Magie sowie interne Tests und Erkundung unternehmensspezifischer Großmodelle für die B-Seite. Darunter umfasst die CoPilot-Produktmatrix für Entwickler vier AIGC-Produkte, nämlich die KI-Schreibplattform „Qiaowen“, die KI-Malplattform „Yihua“, die KI-Synchronisationsplattform „Magic Sound Workshop“ und die digitale menschliche Video- und Live-Übertragungsplattform „Wonderful Yuan“.
Selbst entwickeltes großes Modell „Sequence Monkey“, um AGI beim „Ankommen“ zu helfen
Mobvois großes Sprachmodell „Sequence Monkey“ ist ein großes Sprachmodell mit multimodalen Generierungsfunktionen. Das Modell basiert auf der Sprache The Das Kernfähigkeitssystem deckt die sechs Dimensionen „Wissen, Dialog, Mathematik, Logik, Argumentation und Planung“ ab und kann gleichzeitig verschiedene Aufgaben wie Textgenerierung, Bildgenerierung, 3D-Inhaltsgenerierung, Sprachgenerierung und Spracherkennung unterstützen.
Das große Modell „Sequence Monkey“ verfügt bereits über bestimmte Fähigkeiten zum Verstehen natürlicher Sprache, Wissen, Logik und Argumentation. Es kann schnell Antworten auf komplexere Fragen liefern, wie zum Beispiel „Welche Provinzhauptstadt hat eine größere Bevölkerung, Hunan oder Hubei?“ „Erhalten Sie genaue Ergebnisse.
Berichten zufolge wurde der chinesische Name von Mobvois selbstentwickeltem Großmodell „Sequence Monkey“ vom „Infinite Monkey“-Theorem des Mathematikers Emile Borel im frühen 20. Jahrhundert inspiriert. Nach diesem Theorem würde eine Gruppe von Affen, wenn sie zufällig eine Schreibmaschine treffen würden, schließlich ein vollständiges Werk von Shakespeare produzieren. Dieser Satz basiert auf Wahrscheinlichkeitstheorie und kombinatorischer Mathematik und veranschaulicht die Einheit der Wahrscheinlichkeit. Das Konstruktionsprinzip des von Mobvoi selbst entwickelten großen Modells ähnelt dem von „Infinite Monkey“. Massive Textsequenzen werden vom unabhängigen Algorithmus von Mobvoi kontinuierlich trainiert und durch große Rechenleistung verdaut und verstanden und werden zum „Sequence Monkey“.
Li Zhifei, Gründer und CEO von Mobvoi, sagte, dass es bei großen Modellen nicht nur um große Parameter geht kognitives Modell. Es ist die Modellierung der Sprache. Sprache ist die Grenze des Denkens, daher haben große Modelle unbegrenzten Raum für Fantasie. „Sequence Monkey“ hat während des Trainingsprozesses seine „emergenten“ Fähigkeiten unter Beweis gestellt. Es befindet sich derzeit in der „Aufklärungsphase“ und wird sich in Zukunft immer schneller verbessern. Er glaubt auch, dass es der beste „Job“ für große Models sein wird, ein menschlicher CoPilot zu sein, und dass CoPilot in Zukunft überall sein wird.
One-Stop-CoPilot-Produktmatrix, die den gesamten Prozess der Inhaltserstellung ermöglicht
Basierend auf dem großen Modell „Sequence Monkey“ hat Mobvoi in internen Tests eine Vielzahl von AIGC-Produkten und -Anwendungen für Ersteller untersucht und für Tausende erstellt der Ersteller Eine CoPilot-Produktmatrix aus einer Hand, die den gesamten Prozess der Inhaltserstellung ermöglicht. Derzeit hat Mobvoi mit mehr als 5 Millionen registrierten Benutzern und mehr als einer Million zahlenden Benutzern weltweit die „Dreifaltigkeit“ aus Technologie, Produkten und Kommerzialisierung erreicht.
Mobvoi – Ihr KI-Schreibassistent (write.mobvoi.com)
Als erstes CoPilot-Produkt, das auf der Pressekonferenz vorgestellt wurde, decken die KI-Schreibfunktionen von „Mobvoi“ das Büro am Arbeitsplatz, Marketing und neue Medien ab Kreatives Schreiben, das Benutzern kontinuierlich Inspiration und kreative Richtung beim Verfassen von Jahresendzusammenfassungen, Kundenservice-Worten, Skripten, Werbetexten und anderen Inhalten bieten kann.
Um Benutzern besser dabei zu helfen, die Effizienz der Inhaltserstellung zu verbessern, hat „Qiaowen“ acht wichtige KI-Bearbeitungsfunktionen eingeführt, nämlich Stiltransformation, Extraktion wichtiger Punkte, Korrekturlesen und Fehlerkorrektur, Fortsetzung, Umschreiben, Erweiterung, Abkürzung und Übersetzung. „Qiaowen“ kann beim Schreiben auch automatisch Bilder generieren und bietet Benutzern so ein Schreiberlebnis, das sowohl Bilder als auch Text umfasst.
Zhihua – Ihr KI-Malassistent (paint.mobvoi.com)
Für Designer, Illustratoren und andere Kreative, die neben Text auch einen starken Bedarf an Design haben, hat die interne Beta von Mobvoi die KI-Malplattform „Yihua“ untersucht. „Word Painting“ unterstützt 8 kreative Stile, darunter zweidimensional, Steampunk und Illustration. Benutzer müssen nur Text eingeben, und „Yihuahua“ kann gleichzeitig 8 hochauflösende 2K-Bilder mit realistischem Licht und Schatten und reichhaltigen Details erzeugen.
Zusätzlich zur Verwendung von Text zum Erstellen von Bildern verfügt es auch über KI-Zeichenfunktionen wie Zeichnungen zum Erstellen von Bildern, Animationsgenerierung und personalisierte Avatargenerierung, was die kreativen Methoden der Benutzer erheblich bereichert. Für Unternehmensbenutzer unterstützt „Yihua“ auch die exklusive Modellanpassung, sodass Unternehmensbenutzer den Modellstil an ihre eigenen Bedürfnisse anpassen können, und unterstützt die kollaborative Produktion mehrerer Personen, um den Zeichnungsanforderungen von Unternehmen besser gerecht zu werden.
Derzeit hat „Yiyanhua“ mit der Heimdekorations-Designplattform Kujiale ein Forschungsziel erreicht. Auf der Kujiale-Plattform können Benutzer „Yiyanhua“ verwenden, um ihre Bedürfnisse in Worten zu beschreiben und sie einfach zu ändern und die Position von Möbeln anzupassen usw. und entwerfen Sie dann einen Dekorationsplan, der Ihnen gefällt.
Moyin Workshop – Ihr KI-Synchronisationsassistent (moyin.com)
Für KI-Synchronisationsszenarien hat Mobvoi eine neue Generation von KI-Synchronisationsprodukten „Moyin Workshop“ auf den Markt gebracht. „Magic Sound Workshop“ (Überseeversion von DupDub) ist die weltweit führende Komplett-KI-Synchronisationsplattform aus einer Hand. Sie bietet Benutzern mehr als 1.000 Klangfarben, mehr als 2.000 Stimmstile und mehr als 20 Dialekte und Fremdsprachen.
Mit der Unterstützung der Großmodelltechnologie ist „Magic Sound Workshop“ die weltweit erste Synchronisierungsplattform, die mit Großmodell-KI-Schreibfunktionen ausgestattet ist und mehrere Szenarien wie KI-Schreiben, KI-Überspielen und Bearbeiten abdeckt. Mit seiner Hilfe können Benutzer ganz einfach Inhalte erstellen, die Texterstellung und Synchronisation integrieren, beispielsweise Film- und Fernsehkommentare, Hörbücher, Online-Bildung und Nachrichtensendungen. Derzeit hat „Magic Sound Workshop“ eine Zusammenarbeit mit führenden Unternehmen in vielen Branchen wie WeChat Reading, Juvenile Get und Volkswagen erreicht.
Um Benutzern ein besseres Synchronisationserlebnis zu bieten, unterstützt „Magic Sound Workshop“ die Anpassung von 7 Emotionen, darunter Ruhe, Traurigkeit, Freude usw. für ausgewählte Geräusche, einschließlich Frauen mittleren Alters, Jungen usw. 10 Arten von Charaktere wurden migriert und es wurden auch personalisierte Bearbeitungsfunktionen für AI-Sound wie Rhythmusanpassung, lokale Geschwindigkeitsänderung und Synchronisation mit mehreren Personen geöffnet, sodass Benutzer Sounds wie das Bearbeiten von Dokumenten mit Word bearbeiten können.
Zusätzlich zur Auswahl und Bearbeitung von Sounds wird der „Magic Sound Workshop“ auch eine „Pinch Sound“-Funktion starten, die auf Funktionen zur Generierung umfangreicher Modellsprachen basiert. Benutzer können Geschlecht, Alter, Sprache, Stil und Emotionen frei wählen Klangeigenschaften, von 0 bis 1. Erstellen Sie den gewünschten Klang.
Wunderbarer Yuan – Ihr digitaler KI-Klon (weta365.com)
Basiert auf den Generierungsfähigkeiten von Text, Bildern, Tönen usw., damit Videoinhaltsersteller schneller und schneller neuartige, lebendige und interessante Werke erstellen können Besser gesagt, Mobvois interne Tests untersuchten die KI-Plattform für die Erstellung digitaler Bilder und die Live-Übertragung „Wonderful Yuan“.
Berichten zufolge verfügt die Plattform „Wonderful Yuan“ derzeit über 100 digitale Personen, über 1.000 digitale 3D-Assets und über 1.000 Sounds. Mit der multimodalen Generierungstechnologie unterstützt die „Wonderful Yuan“-Plattform derzeit drei verschiedene Formen der digitalen Humangenerierung: Bildmodellierung (2D digitaler Mensch), Videomodellierung (2,5D digitaler Mensch) und 3D-Modellierung (3D digitaler Mensch). Die Funktion zum Klonen von Bildern erfordert lediglich ein 5-minütiges Live-Videomaterial, um das Bild und Verhalten des Benutzers 1:1 wiederzugeben und so einen digitalen Klon für den Benutzer mit konsistenter Stimme und natürlichen Bewegungen zu erstellen.
Von Privatpersonen bis hin zu Unternehmen wird CoPilot überall präsent sein
Mobvoi verfügt über eine umfassende Erfahrung im Bereich der Sprachassistenten. Die Forschung zu KI-Sprache lässt sich bis vor zehn Jahren zurückverfolgen Der Assistent „Xiaowen Assistant“ wiederholte 2015 den „Xiaowen Secretary“, startete 2017 ein VPA mit vollständigem Szenario und aktualisierte das VPA im Jahr 2019. Nach zehn Jahren der Akkumulation und Entwicklung kann CoPilot-Magic Xiaowen, das von Mobvoi auf dieser Konferenz in internen Tests untersucht wurde, als Synthese von Siri und ChatGPT verstanden werden.
„Hallo, hallo, wo ist das nächste Hot-Pot-Restaurant?“, „Hallo, können Sie mir sagen, wie das Wetter morgen in Peking ist?“ – die Menschen sind es gewohnt, relevante Informationen nachzuschlagen, bevor sie Essen, Kleidung, Unterkunft usw. benötigen Als Entwicklung für einzelne Benutzer kann „Magic Xiaowen“ Benutzern helfen, Enzyklopädieinformationen zu überprüfen, das Wetter zu überprüfen, Restaurants zu überprüfen und Hotels zu überprüfen, und kann auch frei mit Benutzern chatten, sodass Benutzer Informationen bequemer und einfacher erhalten können schnell
Laut der Einleitung basiert „CoPilot“ auf dem Konzept eines Superassistenten. Es wird über ein Gehirn mit hohem IQ verfügen, das auf einem großen Modell basiert und in der Lage ist, riesige Datenmengen zu analysieren und mit Menschen in der Realität zu kommunizieren Es wird auch eine schöne Stimme und ein schönes Bild haben und kann mit jeder Hardware-Plattform wie Mobiltelefonen, Uhren, Automaschinen usw. ausgestattet werden - Hochwertige Lehrkräfte, sachkundige Anwälte, professionelle Ärzte, Kundendienst für Finanzmanagement usw., um bei Bedarf jederzeit und überall den Druck zu demonstrieren. „Sequence Monkey“ öffnet das Ökosystem und stärkt mehr Branchen
Basierend auf den zugrunde liegenden Fähigkeiten des großen Modells „Sequence Monkey“ bietet „Mobvoi Copilot“ für B-End-Benutzer und vertikale Bereiche nicht nur universelle Fähigkeitsunterstützungsdienste und digitale Anpassungsdienste für menschliche Bilder eröffnen auch ihre eigene Rolle Funktionen erweitern und Datenschnittstellen weiter iterieren. Bedürftige Unternehmensbenutzer können sich im Web anmelden, um API-Dienste aufzurufen, und durch Hochladen von Dokumenten branchenspezifische Inhalte trainieren, um eine individuelle Sprachinteraktion zu erreichen. Die URL von Sequence Monkey lautet openapi.mobvoi.com.
Derzeit hat Mobvoi eine Zusammenarbeit mit der ersten Gruppe interner Beta-Explorationspartner in zehn großen Branchen erreicht, darunter Automobil, Bildung, Anwaltskanzleien, Finanzen, medizinische Versorgung, Tourismus usw. In der Zukunft wird Mobvoi „CoPilot“ schrittweise verstärkt Mehrere Branchen helfen mehr Unternehmen dabei, ihre eigenen exklusiven Großmodelle zu haben und ihren eigenen exklusiven „CoPilot“ zu erstellen.Das obige ist der detaillierte Inhalt vonMobvois interne Beta erforscht das Großmodell „Sequence Monkey', um exklusive Produkte für Privatpersonen und Unternehmen zu entwickeln. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen





Ein weiterer Doppelklick ist das Debüt einer neuen Funktion. Wollten Sie schon immer den Hintergrund einer Figur in einem Bild ändern, aber die KI erzeugt immer den Effekt „Das Objekt ist weder die Person noch das Objekt“. Selbst in ausgereiften Generierungstools wie Midjourney und DALL・E sind einige Prompt-Fähigkeiten erforderlich, um die Charakterkonsistenz aufrechtzuerhalten. Andernfalls ändern sich die Charaktere und Sie erzielen nicht die gewünschten Ergebnisse. Diesmal ist es jedoch Ihre Chance. Die neue „Character-Video“-Funktion des AIGC-Tools PixVerse kann Ihnen dabei helfen. Darüber hinaus können dynamische Videos generiert werden, um Ihre Charaktere lebendiger zu machen. Geben Sie ein Bild ein und Sie erhalten die entsprechenden dynamischen Videoergebnisse. Auf der Grundlage der Beibehaltung der Konsistenz der Charaktere ermöglichen die reichhaltigen Hintergrundelemente und die Charakterdynamik die generierten Ergebnisse

Einleitung Nach dem Start von ChatGPT war es, als wäre die Büchse der Pandora geöffnet worden. Wir beobachten derzeit einen technologischen Wandel in vielen Arbeitsweisen. Menschen verwenden ChatGPT, um Websites und Apps zu erstellen und sogar Romane zu schreiben. Mit dem Hype und der Einführung von KI-generierenden Tools haben wir auch eine Zunahme bösartiger Akteure beobachtet. Wenn Sie die neuesten Nachrichten verfolgen, haben Sie sicher gehört, dass ChatGPT die Wharton MBA-Prüfung bestanden hat. Bisher hat ChatGPT Prüfungen in Bereichen abgelegt, die von der Medizin bis zum Jurastudium reichen. Über Prüfungen hinaus nutzen Studierende es, um Aufgaben einzureichen, Autoren reichen generative Inhalte ein und Forscher können durch einfaches Eintippen von Eingabeaufforderungen qualitativ hochwertige Arbeiten erstellen. Um den Missbrauch generativer Inhalte zu bekämpfen

Die Technologie der künstlichen Intelligenz, die aus natürlicher Sprachverarbeitung, Spracherkennung, Sprachsynthese, maschinellem Lernen und anderen Technologien besteht, ist für ihre Anwendung in verschiedenen Branchen weithin anerkannt. Da Weiyin ab Ende 2022 an der Spitze von KI-Anwendungen steht, hat er weiterhin die Überraschungen miterlebt, die die AIGC-Technologie mit sich bringt, und hat auch das Glück, an dieser Technologiewelle teilzunehmen, die die ganze Welt erfasst. Nach Schulung, Tests, Abstimmung und Anwendung kombinierte Weiyin seine umfassende Erfahrung in der Kundendienstbranche mit leistungsstarken Funktionen für große Modelle, um einen generativen KI-Kundendienstroboter zu entwickeln, der sowohl für die Agentenseite als auch für die Geschäftsseite geeignet ist. Gleichzeitig verband Weiyin auch die zugrunde liegenden Fähigkeiten mit der Weiyin Vision-Reihe intelligenter Produkte und bildete schließlich eine „1+5“-Matrix für generative KI-Intelligenzprodukte. Darunter ist „1“ die große Modelldienstplattform für Weiyins unabhängiges Training .

Laut Nachrichten vom 14. März gab Xiaomi heute offiziell bekannt, dass die AIGC-Bearbeitungsfunktion von Xiaomi Photo Album offiziell auf den Mobiltelefonen Xiaomi 14 Ultra eingeführt wird und in diesem Rahmen vollständig auf Mobiltelefonen der Serien Xiaomi 14, Xiaomi 14 Pro und Redmi K70 eingeführt wird Monat. Das AI-Großmodell bringt zwei neue Funktionen in das Xiaomi Photo Album: Intelligent Image Expansion und Magic Elimination Pro. Die AI-Smart-Bilderweiterung unterstützt die Erweiterung und automatische Komposition schlecht komponierter Bilder. Die Bedienungsmethode ist: Öffnen Sie das Fotoalbum zum Bearbeiten – geben Sie Zuschneiden und Drehen ein – klicken Sie auf Smart-Bilderweiterung. Magic Elimination Pro kann Passanten auf Touristenfotos nahtlos eliminieren. Die Verwendungsmethode ist: Öffnen Sie das Fotoalbum zum Bearbeiten – geben Sie Magic Elimination ein – klicken Sie oben rechts auf Pro. Derzeit verfügt das Gerät Xiaomi 14Ultra über intelligente Bilderweiterungs- und Magic-Eliminierungs-Pro-Funktionen.

Nach mehr als einem Jahr Entwicklung ist AIGC schrittweise von der Textdialog- und Bildgenerierung zur Videogenerierung übergegangen. Rückblickend führte die Geburt von Sora vor vier Monaten zu einer Umstrukturierung im Bereich der Videogenerierung und förderte den Umfang und die Tiefe der Anwendung von AIGC im Bereich der Videoerstellung energisch. In einer Zeit, in der alle über große Modelle sprechen, sind wir einerseits überrascht über den visuellen Schock, den die Videogenerierung mit sich bringt, andererseits stehen wir vor der Schwierigkeit der Umsetzung. Zwar befinden sich große Modelle noch in der Einlaufphase von der Technologieforschung und -entwicklung bis zur Anwendungspraxis und müssen noch auf der Grundlage tatsächlicher Geschäftsszenarien abgestimmt werden, aber die Distanz zwischen Ideal und Realität wird allmählich kleiner. Marketing als wichtiges Umsetzungsszenario für die Technologie der künstlichen Intelligenz ist zu einer Richtung geworden, in der viele Unternehmen und Praktiker Durchbrüche erzielen möchten. Sobald Sie die entsprechenden Methoden beherrschen, wird der kreative Prozess der Vermarktung von Videos abgeschlossen sein

Herausgeber des Machine Power Report: Yang Wen Wer kann der King of AI-Videokreis werden? In der amerikanischen Fernsehserie „Game of Thrones“ gibt es einen „Eisernen Thron“. Der Legende nach wurde es vom riesigen Drachen „Schwarzer Tod“ erschaffen, der Tausende von von Feinden weggeworfenen Schwertern zum Schmelzen brachte und so höchste Autorität symbolisierte. Um auf diesem eisernen Stuhl zu sitzen, begannen die großen Familien zu kämpfen und zu kämpfen. Seit der Entstehung von Sora wurde im KI-Videokreis ein energisches „Game of Thrones“ gestartet. Zu den Hauptakteuren in diesem Spiel zählen RunwayGen-3 und Luma von der anderen Seite des Ozeans sowie die einheimischen Kuaishou Keling, ByteDream, und Zhimo. Spectrum Qingying, Vidu, PixVerseV2 usw. Heute werden wir bewerten und sehen, wer qualifiziert ist, auf dem „Eisernen Thron“ des KI-Videokreises zu sitzen. -1- Vincent Video

Am 16. Mai startete das Meitu Design Studio von Meitu die Funktion „AI Poster“, die darauf abzielt, die Designschwelle zu senken und die Produktionseffizienz zu verbessern. Mit der Unterstützung von AIGC können mehr Laien problemlos hochwertige Poster erstellen. Zu den traditionellen Methoden der Posterproduktion gehören die Verwendung professioneller Designtools wie Photoshop und die Verwendung praktischer Designtools wie Postervorlagen. PS erfordert von professionellen Designern eine kompetente Arbeit, aber selbst professionelle Designer müssen viel Zeit damit verbringen, ständig Details wie Größen- und Farbabstimmung anzupassen, was viel Zeit und Energie kostet. Personen ohne Designkenntnisse können zur Vervollständigung des Designs nur vorgefertigte Postervorlagen verwenden. Die Auswahl von Vorlagen, das Ersetzen von Bildern und das Ersetzen von Text sind jedoch ebenfalls zeitaufwändig, und selbst wenn Benutzer viel Zeit aufwenden, können sie manchmal nicht das Ideal erreichen

Herausgeber des Machine Power Report: Yang Wen Die Welle der künstlichen Intelligenz, repräsentiert durch große Modelle und AIGC, hat unsere Art zu leben und zu arbeiten still und leise verändert, aber die meisten Menschen wissen immer noch nicht, wie sie sie nutzen sollen. Aus diesem Grund haben wir die Kolumne „KI im Einsatz“ ins Leben gerufen, um detailliert vorzustellen, wie KI durch intuitive, interessante und prägnante Anwendungsfälle für künstliche Intelligenz eingesetzt werden kann, und um das Denken aller anzuregen. Wir heißen Leser auch willkommen, innovative, praktische Anwendungsfälle einzureichen. Einsende-E-Mail: content@jiqizhixin.com Der Bildschirm wurde in den letzten zwei Tagen von einem schwarzen Affen geklaut. Wie unglaublich heiß ist das? Tiktok, Weibo und offizielle Accounts chatten alle mit nur einem Wisch über das heimische Spiel „Black Myth: Wukong“. Sogar die offiziellen Medien haben mit Live-Übertragungen begonnen. Es gibt auch Unternehmen, die direkt Urlaub nehmen, damit die Mitarbeiter dies tun können
