「百モデルの戦い」に最近新たな参加者が加わり、先月の文勝文の大型言語モデル「如意」のリリースに続き、快手は最近「文勝図」の分野で自社開発の大型モデルを立ち上げました。フィギュアブル」(カラーズ)。ショートビデオプラットフォームとして、Kuaishou の「Ketu」は当然、独自のアプリで使用されます。Kuaishou は、Ketu の大型モデルを利用して、ショートビデオコメントエリアでの「AI プレイレビュー」機能のテストも開始し、 AIGC ショートビデオ 新しい遊び方。
Kuaishou の「AI Play Review」は、大規模アプリのコア ビジネス シナリオのコメント領域に AIGC 機能を適用した業界初の機能であると報告されており、この機能はユーザーのレビューを強化するように設計されています。コメント領域でのインタラクティブなエクスペリエンス ユーザーはクリエイティブなテキストを入力して、さまざまなスタイルで多数の画像を簡単に生成して、コメントのインタラクションを充実させることができます。ユーザーはショートビデオのコメントエリアに6単語以上のテキストコメントを入力し、コメントボックス右下の「AI」ロゴをクリックするだけで、ワンクリックでコメント画像が生成されます。 「ビューの変更」をクリックして他のスタイルに切り替えることもできます。
Kuaishou AI チームによると、「AI プレイレビュー」機能を通じて、ユーザーは自分の意見や感情をより正確に、より興味深く表現することができ、適切なプレイを探す必要がなく、コメントエリアでより便利で興味深い対話を行うことができます。または絵文字パッケージですが、画像を直接生成できます。 AI ゲーム レビューでは、サイバーパンク、ピクセル、リアルなアニメーションなどの一般的なスタイルから、新海誠、宮崎駿、大友克洋のような強力な個人的なスタイルの画像まで、さまざまな画像を生成できることが理解されています。
ユーザーが入力した内容を解析し、セマンティックな絵を描画する機能は、国内市場ではStable Diffusio、midjourney、ヴィンセント図機能を備えた各種大型AIモデルの標準機能となっています。つまり、Kuaishou の AI レビューは本質的には AI ペイント ツールであり、その背後にあるテクノロジーは主に NLP 自然意味処理に基づいており、ユーザーが表現したいことを正確に識別することが重要な要素です。
AIゲームレビューの効果はプロンプトワード(Prompt)に依存します。ネチズンの経験によれば、テキストコメントに人物、風景、空間、動作などについてのより説明的な内容が含まれている場合、生成される画像は実際の状況とより一致します。逆に、「666」や「なんてことだ!妹はすごい!」など、具体的な指示対象を欠いた曖昧なコメントがコメントに含まれている場合、AIによって生成された結果は表示されません。したがって、この現実は、AI ゲームのレビューがほとんどのユーザーに愛されていない可能性があるという事実に直接つながります
問題は、現段階でショートビデオプラットフォームのコメントエリアはどうなっているのかということです。実際、これは機知に富んだシーン、ジョーク、機知に富んだ発言、その他の感情的な内容に満ちています。魔法のような洗脳BGM、刺激の強い映像、不確実な報酬メカニズムなど、短い動画の特性により、ユーザーは考えることを放棄し、没入してしまいます。したがって、コメント領域のコメントは通常、ユーザーが自分の好き嫌いや意見を明確に表現するために使用する単純な文です。
この現実の結果、短いビデオのコメント領域でユーザーが出力するコンテンツは基本的に感情的なものであり、定性的なコンテンツが欠けています。想像してみてください。それが単なる形容詞の山である場合、AI は主語が欠けているという混乱に直面するでしょう。つまり、AI によって生成される最終的なコンテンツは、ユーザーが表現したいものとは大きく異なる可能性があります。 Stable Diffusio や Midjourney などのツールを使用したことのある友人は、Prompt が主に形容詞である場合、名詞が欠如している結果、AI が自らを解放してしまうことを知っていると思います。
最も先進的な GPT-4 であっても、実際には人間の感情を体験するのに欠陥があり、実際、AI の感情認識能力は、現段階でも依然としてすべての AI 研究者が直面している問題です。現在、大規模な AI モデルの多くは、深刻な生産性シナリオまたは人間との会話のいずれかを指向しており、感情表現を伴う AI はほとんどありません。このように、Kuaishou の AI ゲーム レビュアーが仕事をうまくこなすのは実際には難しいので、ユーザーのコメントを妨げないようにするとよいかもしれません。
では、この場合、なぜ Kuaishou は AI ゲームレビューを立ち上げたのでしょうか?もちろん、ヴィンセントの絵の大きな模型を「絵に描いて」、リアルなシーンにすることが目的です。 Kuaishou アプリ自体は Kuaishou のほぼ唯一の消費者向け製品であるため、「AIGC ショート ビデオ」がほぼ唯一のカードとなっています。実際、ここからは、Kuaishou がモバイルインターネット時代に台頭してきた新たな巨人として、BAT などの伝統的な巨人に比べて背景の点でまだ劣っていることがわかります。
インターネットの水道、石炭、電力会社としての地位をほぼ確立した BAT とは異なり、モバイル インターネット時代に成長した新興巨大企業のグループである Kuaishou は、現在、ほぼすべてが 1 つの事業分野の特徴を示しています。強い幹と弱い枝」のように、Kuaishou の中核事業は基本的に Kuaishou アプリに基づいており、その他のビジネスはほとんど立ち上げられていません。このラウンドの AI コンセプトが勃発する前、かつては外の世界から孤独だと思われていた Baidu は、検索エンジンに加えて入力メソッドも開発したため、Baidu のネイティブ AI アプリケーションは Baidu 入力メソッドで実行できるようになりました。
Kuaishou を振り返って、Kuaishou アプリ以外に、「tutu」大型モデルはどこで使用できますか? Kuaishou が大規模な AI モデル専用のアプリを作成したい場合、Kuaishou は機会を失う可能性があります。国内市場における主要なAIモデルには世代による性能の差は実はなく、各モデルの実際の使用感は基本的に同じであり、有用であればユーザーの選択に委ねられることが多いのが現状である。大規模な AI モデルの魅力を体験したいユーザーでも、先行者利益のある Baidu Wenxinyiyan をダウンロードしている人が多くいます。
実際、ステーション B は、AIGC とビデオを組み合わせた良い例を示したかもしれません。これに先立って、この夏、Station B は「AI Video Assistant」アカウントを立ち上げ、ユーザーは対応する動画のコメント領域で @AI Video Assistant を入力するだけで、後者は動画のテキスト概要を自動的に生成できます。ステーションBの長いビデオの場合、AIビデオアシスタントの要約と構成は、ユーザーが短時間で情報抽出を完了するのに役立つため、当然多くのユーザーに歓迎されるでしょう。
Kuaishou App がより顕著なエンターテイメント属性を備えた製品として AIGC とより適切に統合したい場合、ユーザーのエンターテイメント ニーズを自然に満たす必要があります。たとえば、コメント領域で人々の写真を作成するよりも、コメントに基づいて絵文字をインテリジェントに生成する方が、プラットフォームの雰囲気にはるかに適している可能性があります。
以上がKuaishou 内部ベータ AI プレイ レビュー: 大きなモデルと短いビデオの間の衝突効果は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。