注目の生成 AI はスマート スピーカーを復活させることができるでしょうか?
スマート スピーカーなどの製品は、多くの消費者からほとんど忘れ去られていますが、2017 年と 2018 年の「狂気」を経験してからは、ほとんどの消費者の注目を集めなくなって久しいです。スマート スピーカーは一瞬だろうと誰もが思っていたとき、ChatGPT の登場はスマート スピーカーに二度目のチャンスを与え、またこの衰退する業界に新たなチャンスを与えたかに見えました。では、スマート スピーカーと今人気の生成 AI は火花を散らすことができるのでしょうか?
スマート スピーカー業界にとって、生成 AI は長い干ばつの後の雨のようなものかもしれません。関連する市場調査データによると、2023年第1四半期には、製品の均一性の厳しさや消費者需要の低下などの要因が重なり、国内のスマートスピーカーのオンライン監視型小売売上高は157万台となり、さらに40.6%減少した。 , 一方、2022年を通じて、スマートスピーカーの国内オムニチャネル販売台数は2,631万台で、前年比28%減少した。
かつて大手各社から大きな期待を寄せられ、スマートホームの入り口とも目されていたスマートスピーカーが、なぜ近年奈落の底に落ちてしまったのでしょうか?理由は実は 1 つだけです。それは、スマート スピーカーが実際には十分にスマートではないということです。
スマートスピーカーの概念が盛り上がっていた2017年、業界ではスマートスピーカーの焦点を「知能」にするか「音質」にするかという議論がありました。結局、Tencent Listening や Apple HomePod など、音質に重点を置いた一連の製品は、その悲劇的な失敗を利用して、スマート スピーカーのセールスポイントはインテリジェンスのみであることを証明しました。
しかし、残念ながら、ほとんどのスマート スピーカーの知能レベルは「拡張されている」としか言いようがありません。しかし、大手メーカーは、ASR (音声認識)、NLP 自然意味処理、人工知能などの人工知能や人工知能に限定的に注目しています。遠方音場集音 音響技術の進歩は、確かに少々楽観的すぎます。実際、スマート スピーカーは技術的な観点から見ると非常にシンプルであり、その動作モードは、ユーザーの音声を収集し、サーバーに音声を送信し、計算して結果を生成し、最後に結果をスマート スピーカーに送信して回転させることです。たとえば、アプリケーションを開いたり、ユーザーの質問に答えたりするなど、特定の動作に変換します。
はい、スマート スピーカー自体は人工知能とは何の関係もありません。Xiaoai、Xiaodu、Tmall Elf の本体は対応するサーバーに隠されています。これらすべては、スマート スピーカーのエクスペリエンスを決定する鍵は、複雑な音響環境においてユーザーの音声コマンドを正確に捕捉する能力である遠距離音収音技術であるという事実にもつながります。 「冗談」とスマート スピーカーが聞きます。これを「曲の再生」と呼びましょう。
スマート スピーカーの解決策は、大規模なマイク アレイを使用して音を収集することですが、まだ解決されていない問題点が 1 つあります。それは、音声ウェイクアップ (キーワード スポッティング) です。スマート スピーカーを使用する場合は、「Hi, Siri」、「Xiao Ai Classmate」、「Xiaodu Xiaodu」などのウェイクアップ ワードを使用して、あなたが話していることをスマート スピーカーに知らせる必要があります。スピーカー スピーカーには積極的に奉仕する能力がありません。さらに重要なことは、技術的な制限により、スマート スピーカーは長い間、「音量を上げる/下げる」、「誰々の曲を誰々で再生する」などの単純な指示しか理解できず、さらに複雑な指示しか理解できませんでした。文章の認識は難しいことがよくあります。
ChatGPT や Wen Xinyiyan などの生成 AI がスマート スピーカーにとって重要なのは、前者がスマート スピーカーがより複雑な文章を理解し、より自然なコミュニケーションを提供できるようになることです。 Microsoft Bing Chat、Baidu Wenxinyiyan、または ChatGPT を使用したことのある友人なら、このタイプの生成 AI と話すときに、「こんにちは、ChatGPT」などの冒頭の文を使用する必要はなく、直接入力することで開始できることを知っているはずだと思います。コンテンツ、対話プロセス。
生成 AI は大規模言語モデル (LLM、Large Language Model) に基づいているため、手動の注釈データと人間のフィードバックによる強化学習技術が追加され、知識を複数の言語に書き込むナレッジ グラフ技術によって補完されます。 - 構造化されたトリプル (エンティティ、概念、関係を含む) の関係図により、AI は人間の指示の意味を理解し、最終的には巨大な情報データベースから回答するコンテンツを選択できるようになります。
Siri や Xiaoai と比較した ChatGPT のような製品の最大の変更点は、複数ラウンドの会話ができることです。 「魚の記憶」に近い Siri に比べ、ChatGPT は常にユーザーと会話することができ、より明確な感情認識と相まって、ユーザーは本当に生きている人間と話しているように感じます。消費者向け製品の場合、ユーザーは明らかに、その背後にある技術原則がどれほど進んでいるかではなく、問題を解決できるか、ニーズを満たせるかどうかを気にします。
生成AIの魅力は能力の上限の高さにあり、その代表例がMicrosoft Copilotであると同時に、ユーザーの社会的なニーズにもある程度応えることができる、今では海外でもChatGPTを使っているクリエイターがいるは、自身をモデルにした「バーチャルコンパニオン」を立ち上げ、1,000人以上のユーザーを獲得した。一般に、生成 AI とスマート スピーカーを組み合わせることで、後者の欠点をほぼ補うことができ、消費者市場で使用できるレベルのインテリジェンスを実現できます。
実際、一部のスマート スピーカー メーカーはすでに行動を起こしています。たとえば、今年2月にBaiduがWen Xin Yi Yanを準備していたとき、XiaoduはWen Xin Yi Yanを統合してスマートデバイスシナリオ向けのAIモデル「Xiaodu Lingji」を作成するとすでに発表しており、4月にはTmallがGenieが「Niaodu」にアクセス 「鳥が鳥を分ける」モデルによって作成された「AI口置換」も、アリババのTongyi Qianwenへのアクセスを発表した。
しかし、生成 AI は「万能薬」ではないことを指摘する必要があります。今のところ、すべての生成 AI はコンピューティング リソースの不足という避けられない問題に直面しています。最近、生成AIの上限であるGPT-4がバカになったというニュースが注目を集めていますが、リリース当初に比べてGPT-4のテキストコードの品質が低下しているというのがユーザーの共通認識となっています。すべての側面。
はい、実は GPT-4 だけでなく、ChatGPT や Wenxinyiyan などの一般向け製品でも同様の状況が発生しており、ユーザー数の増加により大型モデルのパフォーマンスが低下しています。
現在、生成 AI の分野が直面している中心的な問題は、コンピューティング リソースが不足しており、ユーザーの流入に対応できないことです。ユーザー エクスペリエンスを確保するために、このような製品では大規模モデルのパフォーマンスを低下させ、時間を短縮することしかできません。コンテンツを生成するため、サーバーの「負荷を軽減する」ため。それに比べて、スマート スピーカーの既存の市場規模は間違いなく大きいため、生成 AI にアクセスした後は、同様の問題に遭遇するのはほぼ避けられません。
将来起こる可能性があるのは、スマート スピーカーの知能レベルが放物線を描くことです。初期のユーザー エクスペリエンスは飛躍的に向上しますが、ユーザー数が増加し続けるにつれて、知能のパフォーマンスも低下する可能性があります。劣化」 数年前のレベルに戻りました。
以上が注目の生成 AI はスマート スピーカーを復活させることができるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











大統領の科学技術顧問評議会によって設立された生成 AI ワーキング グループは、人工知能分野における主要な機会とリスクの評価を支援し、これらの技術が公正かつ安全に開発および導入されるようにするためのアドバイスを大統領に提供することを目的としています。 、そして可能な限り責任を持って。 AMD CEOのLisa Su氏とGoogle Cloudの最高情報セキュリティ責任者Phil Venables氏もワーキンググループのメンバーだ。中国系アメリカ人の数学者であり、フィールズ賞受賞者のテレンス・タオ氏。現地時間の5月13日、中国系アメリカ人の数学者でフィールズ賞受賞者のテレンス・タオ氏は、物理学者のローラ・グリーン氏と米国大統領科学技術諮問委員会(PCAST)の生成人工知能作業部会の共同リーダーに就任すると発表した。

画像出典@visualchinesewen|Wang Jiwei 「人間 + RPA」から「人間 + 生成 AI + RPA」へ、LLM は RPA の人間とコンピューターのインタラクションにどのような影響を与えますか?別の観点から見ると、人間とコンピューターの相互作用の観点から、LLM は RPA にどのような影響を与えるのでしょうか?プログラム開発やプロセス自動化における人間とコンピューターの対話に影響を与える RPA も、LLM によって変更される予定ですか? LLM は人間とコンピューターの相互作用にどのような影響を与えますか?生成 AI は RPA と人間とコンピューターのインタラクションをどのように変えるのでしょうか?詳細については、次の記事をご覧ください: 大規模モデルの時代が到来し、LLM に基づく生成 AI が RPA の人間とコンピューターのインタラクションを急速に変革しています。生成 AI は人間とコンピューターのインタラクションを再定義し、LLM は RPA ソフトウェア アーキテクチャの変化に影響を与えています。 RPA がプログラム開発と自動化にどのような貢献をしているかを尋ねると、答えの 1 つは人間とコンピューターの相互作用 (HCI、h) を変えたことです。

生成 AI は、テキスト、画像、音声、合成データなどのさまざまな種類のコンテンツを生成できる人間の人工知能テクノロジーの一種です。では、人工知能とは何でしょうか?人工知能と機械学習の違いは何ですか?人工知能は、コンピューター サイエンスの一分野であり、自律的に推論し、学習し、アクションを実行できるシステムであるインテリジェント エージェントの作成を研究する学問です。人工知能の核心は、人間のように考え、人間のように行動する機械を構築する理論と方法に関係しています。この分野では、機械学習 ML は人工知能の分野です。入力データに基づいてモデルをトレーニングするプログラムまたはシステムです。トレーニングされたモデルは、モデルがトレーニングされた統合データから派生した新しいデータまたは未確認のデータから有用な予測を行うことができます。

▲この写真はAIによって生成されたもので、九家楽、三味家、東宜日生などがすでに行動を起こしており、装飾・装飾業界チェーンはAIGCを大規模に導入している・装飾・装飾分野における生成AIの応用は何なのか?それはデザイナーにどのような影響を与えますか?レンダリングを生成するためのさまざまなデザイン ソフトウェアを 1 つの文で理解して別れを告げるための 1 つの記事です。ジェネレーティブ AI は、装飾と装飾の分野を破壊しています。人工知能を使用して機能を強化し、デザインの効率を向上させます。ジェネレーティブ AI は、装飾と装飾業界に革命をもたらしています。生成 AI は装飾および装飾業界に影響を与えますか?今後の開発動向はどうなるのでしょうか? LLM が装飾と装飾にどのような革命をもたらしているかを理解するための記事 1 つ. これらの 28 の人気の生成 AI 装飾デザイン ツールは試してみる価値があります. 記事/Wang Jiwei 装飾と装飾の分野では、最近 AIGC に関連するニュースがたくさんあります。 Colov が AI を活用した生成デザイン ツール Colov を発表

市場調査会社オムディアの新しいレポートによると、生成人工知能(GenAI)は2023年までに魅力的な技術トレンドとなり、教育を含む企業や個人に重要な応用をもたらすと予想されている。通信分野では、GenAI のユース ケースは主に、パーソナライズされたマーケティング コンテンツの配信や、顧客エクスペリエンスを向上させるためのより洗練された仮想アシスタントのサポートに焦点を当てています。ネットワーク運用における生成 AI の適用は明らかではありませんが、EnterpriseWeb は興味深いコンセプトを開発しました。現場での生成 AI の可能性、ネットワーク オートメーションにおける生成 AI の機能と限界の実証 ネットワーク運用における生成 AI の初期の応用例の 1 つは、ネットワーク要素のインストールを支援するエンジニアリング マニュアルに代わる対話型ガイダンスの使用でした。

Amazon Cloud Technology Greater China 戦略事業開発部ゼネラルマネージャー、Gu Fan 氏 2023 年には、大規模言語モデルと生成 AI が世界市場で「急増」し、AI における「圧倒的な」後続を引き起こすだけでなく、クラウドコンピューティング業界だけでなく、製造大手の業界への参入も精力的に誘致しています。ハイアール イノベーション デザイン センターは、国内初の AIGC 工業デザイン ソリューションを作成し、設計サイクルを大幅に短縮し、概念設計コストを削減しました。全体の概念設計が 83% 高速化されただけでなく、統合レンダリング効率が約 90% 向上しました。問題の解決には、人件費が高く、設計段階でのコンセプトの成果と承認の効率が低いことが含まれます。シーメンス中国のインテリジェント知識ベースと独自モデルに基づくインテリジェント会話ロボット「Xiaoyu」は、自然言語処理、知識ベース検索、データによるビッグ言語トレーニングを備えています

大型モデルの実装が加速しており、「産業上の実用性」が開発のコンセンサスとなっています。 2024 年 5 月 17 日、Tencent Cloud Generative AI Industry Application Summit が北京で開催され、大規模モデル開発とアプリケーション製品における一連の進歩が発表されました。 Tencent の Hunyuan ラージ モデル機能はアップグレードを続けており、モデル hunyuan-pro、hunyuan-standard、および hunyuan-lite の複数のバージョンが Tencent Cloud を通じて外部に公開されており、さまざまなシナリオで企業顧客や開発者のモデル ニーズを満たし、実装されています。最適なコスト効率の高いモデル ソリューション。 Tencent Cloud は、大規模モデル用のナレッジ エンジン、画像作成エンジン、ビデオ作成エンジンの 3 つの主要ツールをリリースし、大規模モデル時代のネイティブ ツール チェーンを作成し、PaaS サービスを通じてデータ アクセス、モデルの微調整、およびアプリケーション開発プロセスを簡素化します。企業を助けるために

人工知能の台頭により、ソフトウェア開発の急速な発展が促進されています。この強力なテクノロジーは、ソフトウェアの構築方法に革命をもたらす可能性があり、設計、開発、テスト、展開のあらゆる側面に広範囲に影響を与えます。動的なソフトウェア開発の分野に参入しようとしている企業にとって、生成人工知能テクノロジーの出現は、前例のない開発の機会を提供します。この最先端のテクノロジーを開発プロセスに組み込むことで、企業は生産効率を大幅に向上させ、製品の市場投入までの時間を短縮し、競争の激しいデジタル市場で目立つ高品質のソフトウェア製品を発売することができます。マッキンゼーのレポートによると、生成人工知能の市場規模は 2031 年までに 4 兆 4,000 億米ドルに達すると予測されています。この予測はトレンドを反映しているだけでなく、テクノロジーとビジネスの状況も示しています。
