[グローバル ネットワーク テクノロジー レポート] 7 月 7 日、2023 年世界人工知能会議で、Alibaba Cloud は、大規模な AI 絵画作成モデルである Tongyi Wanxiang が対象を絞った招待テストを開始したと発表しました。このモデルは、人間の絵画作成を支援でき、アートデザイン、電子商取引、ゲーム、文化創造などのアプリケーションシナリオで使用されます。 Alibaba Cloud Intelligence Groupの最高技術責任者(CTO)であるZhou Jingren氏は、これはAlibaba Cloudの大規模モデルがマルチモーダル機能を完全に習得するための重要なステップであり、段階的に業界顧客に開放されるだろうと述べた。
Alibaba Cloudは、大規模AI絵画作成モデルTongyi Wanxiangが対象を絞った招待テストを開始したと発表しました
レポートによると、Tongyi Wanxiang は意味理解と画像生成の両方で優れたパフォーマンスを備えています。3 つの主要な機能の最初のバッチはオンラインです: 基本的な文勝図機能、水彩、平面イラスト、2 次元イラスト、油絵、中国絵画、3D漫画、スケッチなどのスタイルの画像、類似画像生成機能では、ユーザーが任意の画像をアップロードした後、創造性を多様化し、類似した内容とスタイルのAI絵画を生成できます; このモデルは業界初の画像スタイルの移行にも対応しており、ユーザーがオリジナル画像とスタイル画像をアップロードすると、オリジナル画像を指定したスタイル画像に自動的に加工できます。
Tongyi Wanxiang は、Alibaba が開発した複合生成モデルである Composer をベースにしており、カラー マッチング、レイアウト、スタイルなどの画像デザイン要素を分解および結合して、高度に制御可能かつ極めて自由な画像生成効果を提供します。 1 つのモデルで複数種類の画像生成タスク機能をサポートでき、研究結果は AI のトップ国際会議である ICML 2023 で発表されました。
Alibaba Cloud は、生成された画像に対するモデルの効果を実証しました。「全ページ グレースケール カラーリングの魅力的な世界に浸ってください。曼荼羅の静かな森の中に虎がいて、画像は線とストロークを使用しています」と入力すると、その後、システムは豊富な線の詳細を備えた虎の写真を迅速に生成できます。スタイル転送機能を引き続き使用すると、写真スタイルを自由に切り替えることもできます。
昨年の世界人工知能会議では、Alibaba Cloud の「Tongyi」大型モデル シリーズがデビューし、その後、Tongyi Qianwen、Tongyi Tingwu などのモデルや製品が次々とリリースされ、Tongyi Wanxiang もリリースされました。 Alibaba Cloud には、大規模モデルの分野でテキスト、音声、画像などのモダリティを処理または生成する機能があるということです。現在、Alibaba Cloudの大規模モデルはさまざまな業界で徐々に利用されており、30万社以上の企業がTongyi Qianwenのテストに申請し、Tongyi Tingwuの累計ユーザー数は36万人に達している。
当社は、大規模モデルの開発においてマルチモダリティは避けられない傾向であると考えており、さまざまなモダリティの機能を活用してあらゆる階層にサービスを提供し、企業がインテリジェント時代を完全に受け入れることができるよう支援したいと考えています。周静仁氏はこう語った。
以上がAlibaba Cloud AI絵画作成大型モデルTongyi Wanxiangがリリース、演出招待テストが開始の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。