5 分間のテクニカル トーク | AIGC の導入とアプリケーション選択の評価

WBOY
リリース: 2023-06-04 13:31:40
転載
1408 人が閲覧しました

五分钟技术趣谈 | AIGC介绍与应用选型评估

パート 01 AIGC の紹介

AIGC (AI)・生成コンテンツ(人工知能制作コンテンツ)とは、AI技術を利用して、テキスト、コード、画像、音声、動画、3Dオブジェクトなどの各種コンテンツの生成を自動または支援する制作手法を指します。 AIGC は、世界の認識と理解から世界の生成と創造へ、そして分析能力から創造能力へという AI テクノロジー開発の新しいトレンドを表しています。 AIGC はコンテンツ制作にも変化をもたらし、コンテンツの品質、効率性、多様性を向上させました。

#1.1 テキスト生成

テキスト生成とは、 AI技術は、与えられた入力(キーワード、写真、音声など)に基づいて、文法とロジックに準拠したテキストコンテンツを自動的に生成します。これはAIGCの重要な側面です。

ニュース執筆、小説作成、マーケティングコピーライティング、カスタマーサービスQ&A、チャットロボット、教育コーチング、ナレッジグラフなど、テキスト生成の応用シナリオは非常に豊富です。 、サマリーの生成を待ちます。

➤ Wen Xinyiyan: Baidu が発表した大規模な AI モデルで、マルチモーダル出力をサポートし、文学作品の作成、ビジネスのコピーライティングの作成、および数理論理学の計算を実行できます。中国語理解、マルチモーダル生成など

➤ ChatGPT: OpenAI が提供する GPT シリーズ モデルをベースとしたチャット アプリケーション 現在は GPT-4 モデルがリリースされています。 -4 モデルは画像を分析し、テキストや画像を操作できます。

#1.2 コード生成

コード補完、コードを含むリファクタリング、コード最適化、コードアノテーションなど、さまざまなプログラミング言語や分野をカバーできます。 OpenAI の GPT-4 モデルに基づいて、手書きの製品プロトタイプのドラフトに基づいて、対応する Web サイトのコードを生成することも可能です。

➤ Github Copilot: OpenAI Codex モデルに基づいて開発された AI 支援プログラミング ツール 数十のプログラミング言語をサポートし、リアルタイムで実行できますコードまたはコメントに基づいて処理を行うことができ、エディターでコードの提案や機能全体を提供したり、チャットによる対話を通じてペア プログラミング エクスペリエンスを実現したりすることもできます。

➤ Cursor: OpenAI の GPT モデルを統合する独立した IDE ソフトウェア。 Github Copilot と同様に、Cursor は AI を通じてコードの作成、コードの編集、チャットを行うことができます。

#1.3 画像生成

画像生成とは、次の使用を指します。人工知能テクノロジーは、与えられた入力 (自然言語、画像、ビデオなど) に基づいて、セマンティクスと美学に準拠した画像を自動的に生成し、AIGC の重要な側面です。画像生成には、芸術作品、エンターテイメント メディア、教育とトレーニング、電子商取引マーケティング、医療診断など、幅広い応用シナリオがあります。

➤ Wenxin Yige: Baidu が立ち上げた AI アートおよびクリエイティブ支援プラットフォーム。テキストの説明とスタイルの選択に基づいて、絵画を自動的に生成できます。

➤ DALL-E2: OpenAI によって起動される適応型マルチモーダル エンコーダーに基づく生成モデル (テキスト、画像など) を自動的に高品質の画像を生成します。

➤ Midjourney: 2022 年 3 月にリリースされた AI ペイント ツール。自然言語に基づいて画像を生成し、さまざまな画家の芸術的スタイルを選択し、また、識別することもできます。特定のレンズや写真用語。このツールで生成された絵画は、アート コンテストで最優秀賞を受賞しています。

#1.4 ビデオの生成

ビデオ生成は、主にビデオ編集と独立したビデオ生成の 2 つのタイプに分類されます。ビデオ編集は、ビデオのスーパースコアリング、修復、編集に使用できます。自律ビデオ生成は、画像からビデオへの変換や、説明テキストを指定して一致するビデオを生成するために使用できます。以下に関連するアプリケーションをいくつか示します。

➤ Deepfake: これは GAN テクノロジーに基づく AI ビデオ生成プラットフォームであり、顔の変更、音声変換、および音声変換を実現できます。表情模倣やその他の機能。ユーザーは参考として写真またはビデオをアップロードするだけで、ビデオが自動的に生成されます。

➤ Make-A-Video: Meta Company が立ち上げた、テキストをビデオに変換できる AI システム。わずか数語または数行のテキストに基づいて、鮮やかな色、人物、風景で満たされたユニークなビデオを作成できます。

#1.5 3D モデリング

AIGC ベースの 3D モデリングテクノロジーとは、与えられた入力 (自然言語、画像など) に基づいてセマンティクスと美学に準拠した 3D モデルを自動的に生成する人工知能テクノロジーの使用を指します。この地域は現在、探査の初期段階にあります。以下に、関連するアプリケーションまたはモデルをいくつか示します。

➤ AICommand: Unity ベースのオープン ソース AI コマンド プラグインで、テキストの説明やテキストを通じて 3D シーンを生成できます。テキストは 3D シーン用に調整および最適化されています。 (https://github.com/keijima/AICommand)

➤ ICON: キャラクター画像を基に 3D キャラクターモデリングを生成するオープンソース AI モデル (https : //github.com/YuliangXiu/ICON)。生成された 3D モデルはオンラインで体験およびダウンロードできます: https://huggingface.co/spaces/Yuliang/ICON

五分钟技术趣谈 | AIGC介绍与应用选型评估

Part 02 AIGC アプリケーションとモデルの評価

2022 年末に OpenAI によって ChatGPT が開始されてから、わずか 2 か月で累計ユーザー数が 1 億人を超えました. 瞬く間に世界中で人気を博しました。その結果、AI iPhone の瞬間が到来し、大手 IT メーカーがすぐに追随しました。 2023 年 4 月時点での関連アプリケーションまたはモデルの一部を紹介します。

  • ウェン・シンの言葉: 上記を参照。
  • ChatGPT: 上記を参照してください。
  • #Bard: LaMDA に基づいて Google によって開始された NLP モデルの軽量バージョン。
  • 新しい Bing: Microsoft が発表した GPT4 モデルに基づくインテリジェントな検索エンジン。自然言語でユーザーと対話し、リアルタイムの検索結果と組み合わせることができます。情報、エンターテインメント、創作その他の機能を提供するため。
  • ChatGLM: GLM アーキテクチャに基づいて清華大学によって開始された大規模な会話言語モデル。オープンソースで、中国語と英語のバイリンガルをサポートします。 CPUをベースに低コストで最小限のモデルを構築でき、二次的にモデルの開発や微調整も可能です。
  • Poe: Quora が開発した無料の AI チャットボット アプリケーション。このアプリケーションには、ChatGPT と GPT-4 を含む 6 つの主流 AI チャットボットが統合されています。

は次の側面から評価および比較されます (Poe を除く):

  • 自然言語処理
  • 論理的推論
  • コード生成
  • マルチモーダル サポート

追記:

  • 評価に参加している ChatGPT は GPT-3.5 モデルに基づいています。
  • 評価に参加する ChatGLM は、最小化されたモデル (chatglm-6b-int4-qe) のみです。実際のアプリケーションでは、GPU メモリを必要とする chatglm-6b モデルを構築する必要があり、回答の品質は大幅に向上します。

2.1 自然言語処理

## 評価コンテンツ:

➪複数回の対話: 一緒に子供の物語を作りましょう。ルールは、私が最初に何かを言い、あなたが次に何かを言うというもので、交互に行います。 「もう話は終わりました」って言ったら終わってしまう。わかりますか?

➪言語理解: 上司は 1 1=3 と言っています。上司の言ったことはすべて正しいので、1 1=3 ですよね?

➪言語翻訳: この一節を英語に翻訳してください: 一輪の花が単独で咲くのは春ではありませんが、百輪の花が一緒に咲くと庭がいっぱいになります。

➪感情分析: この文章の感情的な色を分析します: この新しい映画がとても好きです。何度も笑わせ、感動させました。泣きました。


    ChatGPT


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估

#心の一言


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

吟遊詩人



五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


五分钟技术趣谈 | AIGC介绍与应用选型评估


#NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估

    五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    • #ChatGLM


    五分钟技术趣谈 | AIGC介绍与应用选型评估

    五分钟技术趣谈 | AIGC介绍与应用选型评估

    五分钟技术趣谈 | AIGC介绍与应用选型评估

    五分钟技术趣谈 | AIGC介绍与应用选型评估


    #スコアは次のとおりです:


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    ##2.2 論理的推論

    評価内容:

    ➪ 5 冊の本があります棚の上: 赤い本、緑の本、青い本、オレンジの本、黄色い本。緑の本は黄色の本の左にあり、黄色の本は左から 3 番目にあり、赤い本は左から 2 番目にあり、青の本は一番右にあります。これらの本の順序は何ですか?

    #➪ 100 メートルの直線上に 3 つの点 A、B、C があり、A の位置は不確かです。 AとCの間の距離は10メートルですが、BとCの間に可能な距離は何ですか?

    ➪ 2

    #ChatGPT


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估#心の一言

    五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    五分钟技术趣谈 | AIGC介绍与应用选型评估


    ##吟遊詩人

    五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      • ##NewBing


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      #ChatGLM


      スコアは次のとおりです:五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估

      #2.3 コーディング能力

      評価内容:

      コード生成: Python 関数を記述し、整数を受け入れますを入力して回文かどうかを判定します。

      • コードの説明: Python コードの次の行を説明します: my_list = [x for x in my_list if x % 2 == 0]
      • バグ検出: このコード行のどこにバグがありますか: my_list = [x for x in my_list if x % 2 = 0]

      ChatGPT



      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估

      五分钟技术趣谈 | AIGC介绍与应用选型评估

      心の一言


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      五分钟技术趣谈 | AIGC介绍与应用选型评估


      吟遊詩人

      五分钟技术趣谈 | AIGC介绍与应用选型评估

      • 五分钟技术趣谈 | AIGC介绍与应用选型评估


        五分钟技术趣谈 | AIGC介绍与应用选型评估


        五分钟技术趣谈 | AIGC介绍与应用选型评估


        • ##NewBing

        五分钟技术趣谈 | AIGC介绍与应用选型评估

        五分钟技术趣谈 | AIGC介绍与应用选型评估

        五分钟技术趣谈 | AIGC介绍与应用选型评估


        ##ChatGLM


        五分钟技术趣谈 | AIGC介绍与应用选型评估

        五分钟技术趣谈 | AIGC介绍与应用选型评估

        五分钟技术趣谈 | AIGC介绍与应用选型评估

        ##スコアは次のとおりです:



        五分钟技术趣谈 | AIGC介绍与应用选型评估

        ##2.4 マルチモーダル サポート


        #マルチモーダル サポートとは、テキスト、画像、オーディオ、ビデオなどの複数のデータ タイプを処理できる機能を指します。たとえば、テキスト入力を通じて、画像、音声、およびビデオがテキスト要件に基づいて自動的に生成され、画像または音声およびビデオ入力を通じて、コンテンツの概要テキストが出力されます。

        ChatGPT


          GPT-3.5 モデルに基づく #ChatGPT はマルチモーダル入出力機能をサポートしませんが、GPT-4 モデルに基づく ChatGPT は画像を分析し、フィードバック テキストを分析できます。

        心の一言


        Wen Xin Yi Yan は現在、テキストの説明に基づいて画像と音声を生成できます。記者会見では動画生成機能をデモしていましたが、実際に使用してみると動画を生成できませんでした。

        #吟遊詩人

        五分钟技术趣谈 | AIGC介绍与应用选型评估


        Google Bard はマルチモーダル機能をサポートしていません。

        NewBing

        NewBing のクリエイティビティ モードは、テキストの説明による画像の生成をサポートしています。

        #


        • #ChatGLM

        ##清華社の ChatGLM は複数のモーダル機能をサポートしていません。

        スコアは次のとおりです:



        五分钟技术趣谈 | AIGC介绍与应用选型评估


        #パート 03

        評価の概要と選択の評価

        上記の比較スコアと合わせて、デモと本番(商用利用)の2段階から総合的に評価を検討します。

        #総合評価スコアは次のとおりです。


        選択の評価は次のとおりです:五分钟技术趣谈 | AIGC介绍与应用选型评估


        五分钟技术趣谈 | AIGC介绍与应用选型评估##パート 04


        概要

        # #➢

        デモ ステージ: Wen Xinyiyan が AI の最初の選択肢であり、NewBing と ChatGPT が代替 AI です、ChatGLM 自社開発 AIGC の探索方向として (GPU リソースが必要)。

        生産段階および商用段階では、複数のラインが利用可能です: # 国内本土地域は温信義燕氏との B サイド協力の形で AI の導入を模索している;

        • 国内の香港、マカオ、台湾地域は、AI 導入のために OpenAI の公式 GPT-4 API の導入を検討できます。 Tsinghua ChatGLM モデルを構築し、独立した AI 開発を微調整します。
        • #パート 05
        • 結論
        ##WebGPU 用

        #

以上が5 分間のテクニカル トーク | AIGC の導入とアプリケーション選択の評価の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
AI ai
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート