


Kann die angesagte generative KI intelligente Lautsprecher wieder zum Leben erwecken?
Produkte wie Smart Speaker, die heute bei vielen Verbrauchern fast in Vergessenheit geraten, stehen nach der „Verrücktheit“ der Jahre 2017 und 2018 bei den meisten Verbrauchern längst nicht mehr im Fokus. Gerade als alle dachten, dass intelligente Lautsprecher eine Eintagsfliege wären, schien das Aufkommen von ChatGPT den intelligenten Lautsprechern eine zweite Chance zu geben und auch dieser rückläufigen Branche eine neue Chance zu geben. Können intelligente Lautsprecher und die mittlerweile beliebte generative KI Funken erzeugen?
Für die Smart-Speaker-Branche könnte generative KI wie Regen nach einer langen Dürre sein. Relevanten Marktumfragedaten zufolge beliefen sich die online überwachten Einzelhandelsverkäufe von inländischen Smart Speakern im ersten Quartal 2023 aufgrund der kombinierten Auswirkungen von Faktoren wie starker Produkthomogenität und sinkender Verbrauchernachfrage auf 1,57 Millionen Einheiten, was einem weiteren Rückgang um 40,6 % entspricht. , während im gesamten Jahr 2022 der inländische Omni-Channel-Absatz von intelligenten Lautsprechern 26,31 Millionen Einheiten betrug, was einem Rückgang von 28 % gegenüber dem Vorjahr entspricht.
Warum sind Smart Speaker, die einst große Hoffnungen bei den großen Giganten hatten und sogar als mögliche Einstiegspunkte ins Smart Home galten, in den letzten Jahren in den Abgrund gerutscht? Eigentlich gibt es nur einen Grund: Intelligente Lautsprecher sind einfach nicht intelligent genug.
Im Jahr 2017, als das Konzept der Smart Speaker sehr beliebt war, gab es in der Branche eine Diskussion darüber, ob der Fokus bei Smart Speakern auf „Intelligenz“ oder „Klangqualität“ liegen sollte. Am Ende nutzten eine Reihe von Produkten, die sich auf Klangqualität konzentrierten, wie Tencent Listening und Apple HomePod, ihre tragischen Misserfolge, um zu beweisen, dass das Verkaufsargument intelligenter Lautsprecher nur Intelligenz sein kann.
Allerdings kann das Intelligenzniveau der meisten intelligenten Lautsprecher leider nur als „erweitert“ beschrieben werden, während große Hersteller der künstlichen Intelligenz und akustischen Technologien wie ASR (Spracherkennung), natürlicher semantischer NLP-Verarbeitung und Fernfeld nur begrenzte Aufmerksamkeit schenken Der Fortschritt bei der Tonaufnahme ist etwas zu optimistisch. Tatsächlich ist der intelligente Lautsprecher aus technischer Sicht sehr einfach. Sein Arbeitsmodus besteht darin, die Stimme des Benutzers zu sammeln, dann das Audio an den Server zu senden, dann die Ergebnisse zu berechnen und zu erzeugen und schließlich die Ergebnisse an den intelligenten Lautsprecher zu senden in bestimmte Verhaltensweisen einbinden, beispielsweise eine Anwendung öffnen oder auf die Frage eines Benutzers antworten.
Ja, der Smart Speaker selbst hat nichts mit künstlicher Intelligenz zu tun. Die wahren Identitäten von Xiaoai, Xiaodu und Tmall Genie sind auf den entsprechenden Servern verborgen. All dies führt auch dazu, dass der Schlüssel zur Bestimmung des Erlebnisses intelligenter Lautsprecher in der Fernfeld-Schallaufnahmetechnologie liegt, also in der Fähigkeit, die Sprachbefehle des Benutzers in komplexen akustischen Umgebungen genau zu erfassen. Schließlich kann der Benutzer nicht „sagen“. ein Witz“ und der intelligente Lautsprecher hört zu. Nennen wir es „ein Lied spielen“.
Die Lösung für intelligente Lautsprecher besteht darin, ein großes Mikrofonarray zum Sammeln von Ton zu verwenden. Es gibt jedoch einen Problempunkt, der noch nicht gelöst wurde, nämlich das Aufwecken der Stimme (Stichwort Spotting). Wenn Sie intelligente Lautsprecher verwenden, müssen Sie Weckwörter wie „Hi, Siri“, „Xiao Ai Classmate“ und „Xiaodu Xiaodu“ verwenden, um dem intelligenten Lautsprecher mitzuteilen, dass Sie mit ihm sprechen, was bedeutet, dass er intelligent ist Redner Dem Redner fehlt die Fähigkeit, aktiv zu dienen. Noch wichtiger ist, dass intelligente Lautsprecher aufgrund technischer Einschränkungen lange Zeit nur einfache Anweisungen verstehen konnten, wie zum Beispiel „Lautstärke erhöhen/verringern“, „das Lied von dem und dem abspielen“ und komplexere Anweisungen Die Satzerkennung ist oft schwierig.
Die Bedeutung generativer KI wie ChatGPT und Wen Xinyiyan für intelligente Lautsprecher besteht darin, dass erstere intelligenten Lautsprechern dabei helfen kann, komplexere Sätze zu verstehen und eine natürlichere Kommunikation zu ermöglichen. Ich glaube, Freunde, die Microsoft Bing Chat, Baidu Wenxinyiyan oder ChatGPT verwendet haben, sollten wissen, dass es bei Gesprächen mit dieser Art generativer KI nicht nötig ist, eine einleitende Aussage wie „Hallo, ChatGPT“ zu verwenden, sondern direkt mit der Eingabe beginnen zu können Inhalt. Dialogprozess.
Da die generative KI auf einem groß angelegten Sprachmodell (LLM, Large Language Model) basiert, fügt sie manuelle Annotationsdaten und verstärkende Lerntechnologie aus menschlichem Feedback hinzu und wird durch die Knowledge-Graph-Technologie, eine Art Knowledge-Graph-Multi, ergänzt - Beziehungsdiagramme, die als strukturierte Tripel geschrieben sind (einschließlich Entitäten, Konzepten und Beziehungen), ermöglichen es der KI, die Bedeutung menschlicher Anweisungen zu verstehen und letztendlich Inhalte aus einer riesigen Informationsdatenbank auszuwählen, um sie zu beantworten.
Die größte Änderung bei Produkten wie ChatGPT im Vergleich zu Siri und Xiaoai ist die Möglichkeit, mehrere Gesprächsrunden zu führen. Im Vergleich zu Siri, das fast wie ein „Fischgedächtnis“ ist, kann ChatGPT immer mit Benutzern sprechen, gepaart mit einer klareren Wahrnehmung von Emotionen, sodass Benutzer das Gefühl haben, wirklich mit einer lebenden Person zu sprechen. Bei einem Verbraucherprodukt ist es den Benutzern offensichtlich egal, wie fortschrittlich die technischen Prinzipien dahinter sind, sondern sie konzentrieren sich darauf, ob es Probleme lösen oder Bedürfnisse erfüllen kann.
Der Reiz der generativen KI liegt in ihrer hohen Obergrenze an Fähigkeiten. Gleichzeitig kann sie in gewissem Maße auch die sozialen Bedürfnisse der Benutzer erfüllen ChatGPT hat einen „virtuellen Begleiter“ nach seinem Vorbild eingeführt und mehr als 1.000 Benutzer gewonnen. Im Allgemeinen kann die Kombination generativer KI mit intelligenten Lautsprechern deren Mängel nahezu ausgleichen und ihr ein Maß an Intelligenz verleihen, das auf dem Verbrauchermarkt eingesetzt werden kann.
Tatsächlich haben einige Hersteller intelligenter Lautsprecher bereits Maßnahmen ergriffen. Als Baidu beispielsweise im Februar dieses Jahres Wen Xin Yi Yan aufwärmte, hatte Xiaodu bereits im April angekündigt, Wen Genie hat auf „Niaodu“ zugegriffen. Der durch das „Vogel teilt den Vogel“-Modell geschaffene „KI-Mundersatz“ kündigte auch seinen Zugang zu Alibabas Tongyi Qianwen an.
Aber es muss darauf hingewiesen werden, dass generative KI kein „Allheilmittel“ ist. Derzeit steht jede generative KI vor einem unvermeidlichen Problem: der Knappheit der Rechenressourcen. Die jüngste Nachricht, dass die generative KI-Obergrenze GPT-4 „dumm“ geworden ist, hat im Vergleich zu dem Stand, als sie gerade veröffentlicht wurde, große Aufmerksamkeit erregt, und die Benutzer sind sich einig, dass die Qualität des Textcodes von GPT-4 verbessert wurde in jeder Hinsicht zurückgegangen.
Ja, tatsächlich haben nicht nur GPT-4, sondern auch öffentlich zugängliche Produkte wie ChatGPT und Wenxinyiyan ähnliche Situationen erlebt. Der Anstieg der Benutzerzahl hat zu einem Leistungsrückgang bei großen Modellen geführt.
Das Kernproblem im Bereich der generativen KI besteht derzeit darin, dass die Rechenressourcen knapp sind und den Zustrom von Benutzern nicht bewältigen können. Um die Benutzererfahrung sicherzustellen, können solche Produkte nur die Leistung großer Modelle verringern und die Menge des generierten Inhalts Zeit, um die Last auf dem Server zu reduzieren. Im Vergleich dazu ist der bestehende Markt für intelligente Lautsprecher zweifellos größer, so dass es nach dem Zugriff auf generative KI fast unvermeidlich ist, auf ähnliche Probleme zu stoßen.
Was in Zukunft wahrscheinlich passieren wird, ist, dass der Intelligenzgrad intelligenter Lautsprecher eine Parabel zeigen wird. Das anfängliche Benutzererlebnis wird sich sprunghaft verbessern, aber wenn die Anzahl der Benutzer weiter zunimmt, kann die intelligente Leistung steigen „degradieren“ „Rückkehr auf das Niveau von vor ein paar Jahren.“
Das obige ist der detaillierte Inhalt vonKann die angesagte generative KI intelligente Lautsprecher wieder zum Leben erwecken?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Die vom Beraterrat des Präsidenten für Wissenschaft und Technologie eingerichtete Arbeitsgruppe „Generative KI“ soll dazu beitragen, die wichtigsten Chancen und Risiken im Bereich der künstlichen Intelligenz zu bewerten und den Präsidenten zu beraten, um sicherzustellen, dass diese Technologien fair und sicher entwickelt und eingesetzt werden , und zwar verantwortungsvoll wie möglich. AMD-CEO Lisa Su und Google Cloud Chief Information Security Officer Phil Venables sind ebenfalls Mitglieder der Arbeitsgruppe. Der chinesisch-amerikanische Mathematiker und Fields-Medaillengewinner Terence Tao. Am 13. Mai Ortszeit gab der chinesisch-amerikanische Mathematiker und Fields-Medaillengewinner Terence Tao bekannt, dass er und die Physikerin Laura Greene gemeinsam die Arbeitsgruppe „Generative Künstliche Intelligenz“ des U.S. Presidential Council of Advisors on Science and Technology (PCAST) leiten werden.

Bildquelle@visualchinesewen|Wang Jiwei Wie wirkt sich LLM von „Mensch + RPA“ auf „Mensch + generative KI + RPA“ auf die RPA-Mensch-Computer-Interaktion aus? Wie wirkt sich LLM aus einer anderen Perspektive auf RPA aus der Perspektive der Mensch-Computer-Interaktion aus? Wird RPA, das die Mensch-Computer-Interaktion in der Programmentwicklung und Prozessautomatisierung betrifft, nun auch durch LLM verändert? Wie wirkt sich LLM auf die Mensch-Computer-Interaktion aus? Wie verändert generative KI die RPA-Mensch-Computer-Interaktion? Erfahren Sie mehr darüber in einem Artikel: Die Ära der großen Modelle steht vor der Tür und die auf LLM basierende generative KI verändert die RPA-Mensch-Computer-Interaktion rasant. Die generative KI definiert die Mensch-Computer-Interaktion neu und LLM beeinflusst die Veränderungen in der RPA-Softwarearchitektur. Wenn man fragt, welchen Beitrag RPA zur Programmentwicklung und -automatisierung leistet, lautet eine der Antworten, dass es die Mensch-Computer-Interaktion (HCI, h

Generative KI ist eine Art menschlicher künstlicher Intelligenztechnologie, die verschiedene Arten von Inhalten generieren kann, darunter Text, Bilder, Audio und synthetische Daten. Was ist also künstliche Intelligenz? Was ist der Unterschied zwischen künstlicher Intelligenz und maschinellem Lernen? Künstliche Intelligenz ist die Disziplin, ein Zweig der Informatik, die sich mit der Schaffung intelligenter Agenten befasst, bei denen es sich um Systeme handelt, die autonom denken, lernen und Aktionen ausführen können. Im Kern geht es bei der künstlichen Intelligenz um die Theorien und Methoden zum Bau von Maschinen, die wie Menschen denken und handeln. Innerhalb dieser Disziplin ist maschinelles Lernen (ML) ein Bereich der künstlichen Intelligenz. Es handelt sich um ein Programm oder System, das ein Modell auf der Grundlage von Eingabedaten trainiert. Das trainierte Modell kann nützliche Vorhersagen aus neuen oder unbekannten Daten treffen, die aus den einheitlichen Daten abgeleitet werden, auf denen das Modell trainiert wurde.

▲Dieses Bild wurde von Kujiale, Sanweijia, Dongyi Risheng usw. erstellt. Die Dekorations- und Dekorationsindustriekette hat AIGC in großem Umfang eingeführt ? Welche Auswirkungen hat es auf Designer? Ein Artikel zum Verständnis und zum Abschied von verschiedenen Design-Softwares zum Generieren von Renderings in einem Satz. Der Einsatz künstlicher Intelligenz zur Verbesserung der Designeffizienz Welchen Einfluss hat generative KI auf die Dekorations- und Dekorationsbranche? Was sind die zukünftigen Entwicklungstrends? Ein Artikel, um zu verstehen, wie LLM Dekoration und Dekoration revolutioniert. Diese 28 beliebten generativen KI-Dekorationsdesign-Tools sind einen Versuch wert. Artikel/Wang Jiwei Im Bereich Dekoration und Dekoration gab es in letzter Zeit viele Neuigkeiten. Collov bringt generatives KI-gesteuertes Designtool Col auf den Markt

Laut einem neuen Bericht des Marktforschungsunternehmens Omdia wird generative künstliche Intelligenz (GenAI) voraussichtlich bis 2023 zu einem überzeugenden Technologietrend werden und wichtige Anwendungen für Unternehmen und Einzelpersonen, einschließlich Bildung, bringen. Im Telekommunikationsbereich konzentrieren sich die Anwendungsfälle für GenAI hauptsächlich auf die Bereitstellung personalisierter Marketinginhalte oder die Unterstützung komplexerer virtueller Assistenten zur Verbesserung des Kundenerlebnisses. Obwohl die Anwendung generativer KI im Netzwerkbetrieb nicht offensichtlich ist, hat EnterpriseWeb ein interessantes Konzept entwickelt. Demonstration des Potenzials generativer KI in diesem Bereich sowie der Fähigkeiten und Grenzen generativer KI in der Netzwerkautomatisierung. Eine der ersten Anwendungen generativer KI im Netzwerkbetrieb war der Einsatz interaktiver Anleitungen als Ersatz für technische Handbücher, um bei der Installation von Netzwerkelementen zu helfen

Gu Fan, General Manager der Abteilung für strategische Geschäftsentwicklung von Amazon Cloud Technology Greater China Im Jahr 2023 werden große Sprachmodelle und generative KI auf dem Weltmarkt „stark ansteigen“ und nicht nur „eine überwältigende“ Nachfolge in der KI auslösen und Cloud-Computing-Branche, sondern auch energisch, um Produktionsgiganten für den Einstieg in die Branche zu gewinnen. Das Haier Innovation Design Center hat die erste AIGC-Industriedesignlösung des Landes entwickelt, die den Designzyklus erheblich verkürzte und die Konzeptdesignkosten senkte. Sie beschleunigte nicht nur das gesamte Konzeptdesign um 83 %, sondern steigerte auch die integrierte Rendering-Effizienz effektiv um etwa 90 % Zu den Lösungsproblemen gehören hohe Arbeitskosten sowie eine geringe Konzeptausbeute und Genehmigungseffizienz in der Entwurfsphase. Die intelligente Wissensdatenbank und der intelligente Konversationsroboter „Xiaoyu“ von Siemens China basieren auf einem eigenen Modell und verfügen über die Verarbeitung natürlicher Sprache, den Abruf von Wissensdatenbanken und das Training großer Sprachen mithilfe von Daten

Die Implementierung großer Modelle beschleunigt sich und die „industrielle Praktikabilität“ ist zu einem Entwicklungskonsens geworden. Am 17. Mai 2024 fand in Peking der Tencent Cloud Generative AI Industry Application Summit statt, bei dem eine Reihe von Fortschritten bei der Entwicklung großer Modelle und Anwendungsprodukten angekündigt wurden. Die Hunyuan-Großmodellfunktionen von Tencent werden weiterhin über Tencent Cloud für die Außenwelt geöffnet, um die Modellanforderungen von Unternehmenskunden und Entwicklern in verschiedenen Szenarien zu erfüllen und umzusetzen die optimale kostengünstige Modelllösung. Tencent Cloud veröffentlicht drei Haupttools: Wissens-Engine für große Modelle, Bilderstellungs-Engine und Video-Erstellungs-Engine. Damit wird eine native Toolkette für das Zeitalter großer Modelle erstellt und der Datenzugriff, die Feinabstimmung von Modellen und Anwendungsentwicklungsprozesse durch PaaS-Dienste vereinfacht Unternehmen zu helfen

Der Aufstieg der künstlichen Intelligenz treibt die rasante Entwicklung der Softwareentwicklung voran. Diese leistungsstarke Technologie hat das Potenzial, die Art und Weise, wie wir Software erstellen, zu revolutionieren, mit weitreichenden Auswirkungen auf jeden Aspekt von Design, Entwicklung, Tests und Bereitstellung. Für Unternehmen, die in den Bereich der dynamischen Softwareentwicklung einsteigen möchten, bietet das Aufkommen der generativen künstlichen Intelligenz-Technologie beispiellose Entwicklungsmöglichkeiten. Durch die Integration dieser Spitzentechnologie in ihre Entwicklungsprozesse können Unternehmen die Produktionseffizienz erheblich steigern, die Markteinführungszeit von Produkten verkürzen und hochwertige Softwareprodukte auf den Markt bringen, die sich im hart umkämpften digitalen Markt abheben. Laut einem McKinsey-Bericht wird erwartet, dass der Markt für generative künstliche Intelligenz bis 2031 voraussichtlich 4,4 Billionen US-Dollar erreichen wird. Diese Prognose spiegelt nicht nur einen Trend wider, sondern zeigt auch die Technologie- und Geschäftslandschaft.
