ChatGPT によって推進される AIGC は垂直産業に対して何ができるでしょうか?
昨年から AIGC ブームが発生し、AIGC とそのアプリケーションの話題が爆発的に増加しましたが、強力な人工知能の時代がそう遠くないことを嘆く人が多くいます。しかし、ブームの裏側では、実際に実装できるシナリオはまだ非常に少ないことがわかります。現在、より成功しているアプリケーションは主に個人消費の分野に集中していますが、AIGC のアプリケーションのほとんどは業界で使用されています。まだ模索段階にあります。
Sequoia Capital は、2022 年 9 月に AIGC について次の予測を立てました。テキストベースの AI 生成は 2023 年に黄金期に入り、画像ベースの AI 生成も黄金期になるでしょう。その時代は2025年頃に到来するでしょう。3DとビデオAIの世代は2023年にドラフト段階にあり、2030年に黄金時代を迎える可能性があります。テキストや画像の AI 生成が確かに時代を先取りしていることは否定できませんが、3D モデル、ビデオ、ゲームの生成はまだ開発段階にあります。
Sequoia Capital の AIGC 関連製品の成熟度予測
##製造や建設などの巨大な垂直事業体など、AIGC の産業用途を考慮すると、AIGC の C/Content コンテンツは単なる写真やテキストの分野にとどまらず、さまざまな分野に参入する必要があります。より豊かな情報を持つ 3 次元の領域。次に、AIGC テクノロジー -> 製品 -> ビジネス アプリケーションと価値の実現という開発パスについて説明し、産業例を使用して AIGC が産業分野でクローズド ループと価値の実現をどのように実現できるかを探ります。1.AIGC テクノロジー: テキストから画像まで
ChatGPT のテスト数の増加からわかるように、ChatGPT はセマンティクスを解析および解析するだけでなく、構造化された NLP 自然言語処理は、これに基づいたデータ分析にも使用できます。
#ChatGPT 構造化コンテンツとデータ分析 - Jiage Data が提供 実際、Stable Diffusion が主導する多数の AI 描画フレームワークまたはプラットフォームは、昨年初めにセンセーションを巻き起こしました。画像はテキストよりも複雑な情報内容を持っているように見えますが、その技術は GPT が主導するテキスト生成よりも早く成熟します。AIGC フレームワークがどのように機能するかを確認するには、主流のオープンソース フレームワークである Stable Diffusion を例として取り上げる必要があります。
安定拡散によって生成された画像は、人間の画家と比較する機能を備えています
安定拡散には主に 3 つのコンポーネントがあり、それぞれの部分には次のような特徴があります。独自のニューラルネットワーク。
1. CLIP はテキスト エンコーダに使用されます:
出力セマンティック情報としてテキストを使用して、77*768 行列を形成します。CLIP は AI をトレーニングし、自然言語理解を実行します。同時にコンピュータービジョン分析も行います。 CLIP は、建物のイメージと「建築」という単語を徐々に一致させるなど、画像とテキスト プロンプトの一致度を判断でき、世界中の 40 億枚以上の画像とテキストの説明を通じてその能力トレーニングが実現されています。
##2. UNET とスケジューラ:
これは有名な拡散モデルのメイン プログラム (2021 年 12 月に CompVis チームと Runway チームによって提案された「潜在拡散モデル」(LDM / 潜在拡散モデル) から) であり、次の目的で使用されます。分析 ノイズを予測して逆ノイズ除去処理を実現し、情報空間での画像生成を実現します。写真に示されているように、染料の拡散のプロセスは、写真からノイズ ポイントに徐々に変化するプロセスのようなもので、研究者が写真にランダムなノイズ ポイントを追加し、AI に全体のプロセスを逆に学習させると、彼らは、情報空間のノイズ マップからの一連の逆学習方法を備えており、画像を生成するモデルです。
拡散モデル逆ノイズ除去プロセス
一般的な例で説明します。ある染料をきれいな水にランダムに落とし、時間の経過とともにそれを押し込むとします。 , 以下に示すように、ゴージャスな形状が得られます。それでは、特定の時間の特定の状態に基づいて、初期の染料の投与量、順序、水タンクへの滴下の初期状態などの情報を逆に推定する方法はあるのでしょうか?明らかに、AI の手法を借りずにこれを達成するのはほぼ不可能です。
さまざまな染料を水に落とし、さまざまな形に広げます。
#3. 情報空間から実際の画像空間へのデコーダ: つまり、情報空間の行列情報を肉眼で見える RGB 画像に変換します。 。他人とのコミュニケーションのプロセスを想像してみてください。私たちが聞いた音声信号は、脳が理解できるテキスト信号に変換され、脳内に保存されます。このプロセスはエンコードと呼ばれます。テキスト信号を特定の言語で表現しようとする場合、このプロセスをデコードと呼ぶことができます。ここでの表現はどの言語でも可能であり、各言語は異なるデコーダに対応します。デコードは単なる表現方法であり、その本質は依然として変わりません。人間に基づいたもので、心の中で何かを説明し、理解すること。
これらの一連の重要な技術的ステップによって、Stable Diffusion はセマンティクスを理解して情報空間内の情報フローに変換できるだけでなく、空間上で擬似的にノイズリダクションを行い、デコーダーを介して肉眼で見える映像に復元するというSF的なプロセスは、AIが存在しない世界では奇跡とも言われています。
2.AIGC テクノロジー: 画像から 3D モデルまで
画像生成は画期的な結果を達成しましたが、これらの結果をさらに最適化し、より多くの分野に適用できれば、より大きな価値を実現することが可能となります。また、いくつかの細分化された分野での探求の結果も見られました。たとえば、シーンを理解し、さまざまなデータセットを追加し、パラメーターを調整することで、テキストの絶え間ない試行錯誤だけでなく、画像生成をより適切に制御できるようになります。結果。
2.1 デザイン インテント マップの生成
2019 年初めに、「この XX は存在しません」シリーズが次の方法で生成されました。 GANsは海外でも注目を集めており、国内でも細分化された分野で企業が成果を上げています。チームはまた、8月22日に携帯電話上で「AIクリエイティブライブラリ」を実験的に開始した。文章を入力するだけで、対話型ロボットは1分以内に意味を素早く理解し、建築コンセプトプランに近い詳細な効果を備えた複数の画像を生成することができる。意図図。さらに、既存の画像を入力し、一部の説明のキーワードを変更することで、「AI クリエイティブ ライブラリ」は一連の派生画像を生成し、デザイナーが日々の創作のインスピレーションを得るのを支援します。
Xiaoku Technology「この建物は存在しません」、GANs モデルで建築イメージ図と反復プロセスを生成
##左の写真: シャオクの「AI クリエイティブ ライブラリ」が生成され、山と川に囲まれた小さな博物館、ルイス カーン スタイルのステートメントがトリガーされます。右の写真: Xiaoku ライブラリ「AI Creative Library」は、左のルイス・カーン風の絵に基づいて生成され、完成したスタイルはル・コルビュジエに切り替わります 「AI クリエイティブ ライブラリ」をより効果的にするために、チームはいくつかの新しい調査を行いました。既存のアルゴリズムとモデルは一般的なインターネット素材、建築関連の写真、説明、スタイルに集中しているため、プロレベルのデータ保存だけでは明らかに十分ではありません。ここでは、建設関連の単語の特別な識別子を使用して、事前に微調整されたデータセットが形成され、そのデータセットが融合およびトレーニングされてモデルの強化が実現されます。建設専門分野に特化した新モデルにより、建設業界に特化したAIクリエイティブライブラリを構築し、短い工事説明文において、テストセットの優良品率が従来モデルと比較して13.6%向上しました。
Google Dreambooth 微調整アルゴリズムの回路図
# #たとえば、美術館の写真と「ザハ・ハディド(亡くなった世界的に有名な女性建築家)」という単語を入力すると、モデルは美術館の建築様式や特徴をザハ・ハディドの作品に近づける必要があることを理解できます。博物館にザハ・ハディドのキャラクターや肖像画を追加したり、AI の世界でザハ・ハディドの漫画の肖像画を作成したりすることではありません。これは、多くの場合、一般的なモデルによって返される結果の 1 つです。
建築モデルを微調整した後、Xiaoku「AI Creative Library」は「ザハ・ハディド氏」を完全に理解できるようになりました「 」 この特別な言葉に隠された意味
2.2 3D モデルの生成
2 次元ですが写真は素晴らしいですが、産業用途においては今のところ「意図ライブラリ」としての役割しかなく、将来的にデザインを正確に表現できる成果物となるためには、3D以上の情報次元への移行が必要です。AIGC が現在ほど成熟していない 2020 年、上記のチームは AI を使用して 3D モデルを生成する方法を模索しており、その研究開発の進捗状況を公開しました。同済大学の DigitalFUTURES ワークショップの教え グラフィックスから画像を生成し、さらにモデルを生成するアルゴリズムでは、当時のモデル効果が理想的ではなかったことがわかりますが、貴重なのはグラフィックス-画像-モデルの連携です。
同済大学の DigitalFUTURES ワークショップで教え始めて 2 年目に、チームは GAN を通じてグラフと実際の 3 次元モデルの間の関係を学習し、グラフを実際の 3 次元モデルに変換するモデル アルゴリズム。このアルゴリズムは、画像上のさまざまなレイヤー要素から特徴を学習することにより、画像に対応する主要オブジェクトの 3 次元伸長形状を大まかに復元し、さまざまなオブジェクトの投影に対応する元のオブジェクトの高さを予測できます。もちろん、この方法にはまだ欠点があり、絵画シーンでしか使用できず、他のシーンの類似した絵画と立体形状との関係を蓄積することが困難であること、第二に、復元された立体形状は大まかにしか得られないことです。高さの予測などの詳細を通過する必要がある アルゴリズムが再生成されるため、実際の 3 次元モデルとの誤差が大きい プロジェクトの初期調査と判断にのみ使用でき、適用シナリオが限定される。
2021 同済大学 DigitalFUTURES ワークショップ Xiaoku 教育チームの結果、GANS グラフに基づく再構築三次元モデル
AIGC アルゴリズムの爆発的な増加と 3D 生成アルゴリズムの成熟度の向上のおかげで、垂直型 AI 企業がモデルを改善するためにより高度なテクノロジーとアイデアを吸収し始め、3D-AIGC ルートを開始することも見られました。試してみるべき新しい方向性がいくつかあります。たとえば、OPENAI は、アルゴリズムを通じて任意の 2 次元画像を点群に予測し、その点群を通じて 3 次元オブジェクトを予測できる Point-E フレームワークを発表しました。
PointE フレームワークのプロセス全体の概略図
ただし、モデル生成の品質には依然として一定の制限があり、モデルの使いにくさは主に次の 3 つの側面に反映されます。
1. 3 次元形状を復元することは、まず 2 次元画像データの方が 3 次元モデルデータよりも古くに存在し、現在では 2 次元画像データの方が多いため、3 次元形状を復元することが困難です。 3 次元モデルのトレーニング教材は一般化能力が低いため、元の 3 次元形状を復元するのが困難です。材料の不足: 3 次元モデルにとって最も重要な部分は材料の充填と選択ですが、AI 生成では、画像から材料を直接推定する方法はまだ成熟していません。同じ材料でも異なる動作をします。形状、環境、光源。これらの変数が 1 枚の画像に集中している場合、マテリアルの再構成はほとんど不可能です。
3. 生成されたモデルの精度は標準に達していません: モデル点群によるリファインは、通常、点群の密度に依存してオブジェクト表面のメッシュを再構築します。点群が少なすぎると、オブジェクトが著しく歪んでしまいます。モデルを再構築することさえできません。
#もちろん、現在の技術的なボトルネックは理解しています。目標をもう少し低く設定する場合は、3D モデリング ソフトウェアから生成された単純な形状を選択し、2D スクリーンショットを撮り、それを点で再構築します。このモデルでは、驚くほどその効果が上記のテストよりも優れていることがわかりますが、それでも「暫定草案」の範囲内です。これはトレーニング セットと密接に関係しており、3D モデリング ソフトウェアを使用して各視点から 2D ビューを生成することは、このモデルのトレーニング データを取得する最も簡単な方法の 1 つです。
#Xiaoku チームは Point-E モデルをテストし、モデリングで単純なモデルを選択しました。ソフトウェア 3D モデルのスクリーンショットを任意の角度で撮影し、3D モデルを再構築すると、多くの場合、非常に良い結果が得られます
要約すると、テキスト -> 画像 -> ポイントクラウド→立体物の技術的なルートは確かにすごいですが、産業分野に応用するにはAI科学者がやるべきことはまだまだたくさんあります。 しかし、これが 3D モデルの生成を実現する唯一の技術的な方法なのでしょうか?
3 垂直分野における AIGC アプリケーションの新しいアイデア
一般分野における大規模モデルの開発では、Nvidia や Google などの大手を含む OpenAI を中心としたメーカーが、私自身のユニバーサル 3D-AIGC フレームワークも残念ながらまだ初期段階にあります。垂直物理産業の場合、実用化までには明らかに長い道のりがあります。
世界的な観点から見ると、3D モデル生成の分野では、大規模なパンフィールド モデルに加えて、一部の垂直産業も AIGC の適用方法を模索しています。たとえば、シーメンスは、エンジンの設計および製造中に、生成されたモデルに対してポリシー シミュレーションとさらなる最適化を実施し、最終的に 3D プリンティング エンティティを通じて、3D モデル結果の配信とクローズド ビジネス ループを実現します。
#シーメンスは、生成アルゴリズムを通じてエンジン設計とシミュレーションを実装します
そのような結果を実現できるかどうかは、産業ロジックに基づいた、基礎となるビジネス コンテンツとそのデータ標準の継続的な反復にかかっています。
ISO/IEC によると、コンテンツのデジタル標準定義は SMART (機械に適用可能、読み取り可能、転送可能な標準) です。L1 レベルは紙のテキストであり、機械との対話は不可能です。L2 レベルはオープンデジタル形式であり、機械の対話性が非常に低い; L3 レベルは機械が読み取り可能な文書であるが、機械は検索結果と内容を理解できない; L4 レベルは機械が読み取り可能なコンテンツであり、セマンティックな対話は可能であるが、機械は理解できないコンテキストの論理関係。L5 レベルでは、マシンはコンテンツと対話し、自動識別や自動生成などのインテリジェントな属性を実現できます。
産業分野では、現在、L3 レベルの情報コンテンツが広く使用されており、L4 レベルのデジタル コンテンツが開発されています。L5 レベルのインテリジェンスは、インダストリー 4.0 とスマートの中心基盤です。製造業。したがって、L4 レベル以上の機械可読コンテンツ、特に L5 レベルのインテリジェント コンテンツを生成することが、AIGC の将来の方向性となります。
#ISO/IEC SMART デジタル規格「中国工学科学」第 23 巻、2021 年第 6 号「標準デジタル開発の現状と動向に関する研究」のLiu Xize、Wang Yiyi、Du Xiaoyan、Li Jia、Che Di
海外では、 AIGCの産業応用分野 国内の探鉱はまだ比較的少ないですが、垂直分野に深く取り組んでいる企業もいくつか見つかりました。たとえば、前述したように、Xiaoku テクノロジー チームは建設業界に深く関わっています。建設業界を例として、垂直産業における AIGC の導入経路について説明します。現在、国内の実体経済は変革の窓期にあり、国家レベルでは「人工知能と実体経済の融合」が重要な課題として提唱されており、主要産業はこれに熱心に取り組んでいます。 AI テクノロジーを真に実装し、産業を支援することで、コンセプトにとどまるデモ製品や夕食後の楽しい議論の対象となるのではなく、デジタル化とインテリジェンスのアップグレードの飛躍を実現します。
建設業界は、年間収益が 30 兆近くある国の基幹産業ですが、デジタル化のレベルは国内の全産業の中で最下位にランクされています。現在、中国はインテリジェント建設政策を提案しており、「中国製」の新たなレベルに到達することを望んでいる。インテリジェント建設は、新世代情報技術と高度な建設技術の深い統合に基づいた新しい建築工業化(工業化/プレハブ、デジタル、インテリジェント)に基づいており、設計、生産、建設、運営などの建設活動のすべての側面を貫いています。自己認識、自己決定、自己実行、自己適応、自己学習の特徴を持ち、品質、効率、品質の最適化を図る先進的な工法です。建設業界のライフサイクル全体における核となる競争力。
建設業界では、基礎となるデータ標準が、CAD 時代の機械可読ドキュメントの L3 から機械可読の L4 に移行しつつあります。 content 先進的なBIMの時代が到来。建設業界における 3D モデルの要件は、コンテンツ オブジェクトが 3 次元空間にモデル、データ、その他の次元を含むフル次元の正確な情報を持っていることです。ルールの次元も含めることができれば、自己認識を持つことができ、自己学習、自己反復など。インテリジェントな機能。現在、海外ではL3レベルのCADやL4レベルのBIMアプリケーションソフトが独占されており、当社の開発スペースとポテンシャルは、低次元を高次元でカバーできるL5レベルに集中する必要があります。
#建築分野のデジタル標準SMARTのコンテンツフォーマット
##Xiaoku チームは、建設業界のデジタル変革に関する洞察に基づいて、業界全体のデータベースを再定義する必要があることに気づきました。 2016年の設立以来、L5レベル3DモデルAIGCの要素技術の研究開発と建設業界への応用に注力してきました。ビジネスフローロジックを含む一連のAIシステムに基づいて、建築情報、多次元データ、3Dモデル、ルール/規範/法律を含む「デジタルモデルスケール」のリンク可能なコンテンツを生成し、建築設計のインテリジェントな生成を実現します。予定。このような基盤となるデータを、チームは、人工知能によって生成された
AI 主導型クラウド上のビルディング情報モデル クラウド ビルディング情報モデル (略して ABC) と呼び、インテリジェントな生成の達成は、4 つの実際的なステップに要約されます: AI は、トレーニングまたは構造化データの再構築のために既存のコンテンツを特定し、データを評価およびシミュレーションし、予備的なデータ結果を最適化し、最終的に一連の AI モデルを生成します。
L5 レベル構築インテリジェント フォーマット ABC インテリジェント クラウド モデル図 #AI 認識の分野で、チームは、さまざまな業種の数千万の CAD 図面データのクリーニングとトレーニングを通じて、100 個の L3 レベルのセマンティック CAD 図面を取得しました。 . % のクラウド復元と 99.8%* の正確なセマンティック解析と補完を実現し、この分野では世界先進レベルに達しています。この実績は同社の多くの製品やソリューションに深く生かされており、例えば建築図面レビューの「インテリジェント図面レビュー」では約96%の条項レビュー精度を実現している。
Xiaoku 建設図面コンポーネントとスペースの識別
AI 分析フィールドは、プロジェクトの効果的な特定に基づいて、チームが物理環境シミュレーション分析、人間行動データのシミュレーションと予測、および一般的な土木建築タイプのプロジェクト関連のビッグデータを実行できるようにします。住宅とショッピングモールの分析とシミュレーション。アプリケーションレベルでは、不動産会社の住宅商品全般を評価することで異なる価値評価係数を取得するなど、顧客のプロジェクト計画の定量的な分析を支援し、不動産会社の商品品質向上を支援します。そのため、Xiaoku Technology は中国住宅協会住宅設計コンペティションの最初の AI 審査員にも選ばれました。この機能は、香港と中国の 10 を超えるショッピング モールの開発と運営にも適用されています。
Xiaoku「製品の能力価値評価」
AI 最適化の分野では、チームは「最適化」は、以前の「識別」と「分析」後のさらなる最適化の反復、つまり、既存のコンテンツに基づいてより良い結果を再生成することに基づいていると考えています。このタイプのテクノロジーは、企業固有の製品やソリューションですでに使用されています。たとえば、Design Cloud 2022 バージョンの「スマート日照最適化」機能では、Xiaoku が日照を通過できないソリューションを自動的に微調整し、元のパターンに大幅な調整を加えることなく日照検証に合格できるようにします。この機能は、カーテン ウォール設計最適化シナリオなどの建築ソリューションの設計開発にも使用されます。四川省商業デザイン研究所と協力した四川省の博物館カーテンウォールプロジェクトでは、Xiaokuアルゴリズムが30,000枚を超えるオリジナルの不規則三角形カーテンウォールパネルを12種類の標準モジュールに最適化したが、これは現在の世界レベルの116種類よりも少ない。 90% 削減され、SKU と金型数量の削減により、カーテン ウォールの構築コストが大幅に削減されます。
Xiaoku「カーテンウォール最適化AIアルゴリズム」
AI 生成の分野は、インテリジェント デザインの中核部分です。建設業界にとって、経済的で適用可能で美しい設計計画を選択し、安全で効率的で高品質な建設結果を提供するには、複数の分野と役割の調整と調整が必要です。マクロスケール、メソスケール、ミクロスケールと一つ一つ細分化するだけでなく、建築、構造、電気機械、配管、景観など複数の専攻を段階的にカバーする必要がある。 . また、住宅、アパート、工業、オフィス、商業などのさまざまなタイプのビジネスタイプもカバーする必要があります。したがって、垂直分野における専門的な結果の生成は、特定のモデルアルゴリズムとデータセットだけでは解決できず、マルチモデル、マルチモーダル、マルチデータセットなどの複数のテクノロジーとビジネスロジックを有機的に統合する必要があります。セグメント化されたシナリオに適合する製品設計を通じて、ユーザーのフィードバックに基づいて継続的に反復することで、最終的にそれを達成できます。
Xiaoku チームは、ビジネス ロジックから始めて、従来のアーキテクチャ設計に必要な 24 のビジネス プロセス ステップを整理し、コア コンテンツを抽出して 6 つのビジネス モジュールに再構築し、AI を使用しました。クラウド アーキテクチャを中核として、新しい一連のアーキテクチャ設計 AIGC ビジネス プロセスが確立されました。 調整 (情報呼び出しと AI 認識)、実行 (完全な AI 生成と人間とコンピュータのコラボレーション生成)、変更 (手動変更可能性と AI 最適化) )、検証 (データ検証と AI レビュー)、コラボレーション (複数人のコラボレーションとクラウドでのビジネス管理)、エクスポート (より多くの形式を自動的に出力 - 3D モデル/2D 図面/画像/PPT/Excel、等。)。
#左の図: 建築設計の元のビジネス プロセスの 24 ステップ、右の図: small ライブラリは、AI によってサポートされる 6 つのビジネス プロセス セクションに再構成されました。
ビジネスの深い理解と再構築されたビジネス ロジックに基づいて、6 つの主要なビジネス モジュールが、 AI認識、AI生成、ビッグデータ、クラウド連携などのテクノロジーと深く統合されており、分析から設計、レビュー、評価に至るまで、建築計画、ユニット設計、コンポーネント生成などのさまざまな深さの建設ビジネスのニーズを実現します。コラボレーションと成果を段階的にカバーし、住宅ビジネスの需要の幅と深さを提供します。
「Xiaoku Design Cloud - Architectural Planning」製品 6 つの主要モジュール
##4.業界における AIGC の価値ほとんどの業界では、AIGC の適用はまだ初期段階にあり、AI テクノロジー全体の継続的な開発により、その後の AIGC の革新的な適用が促進されるでしょう。建設業界の現在の慣行を例に挙げると、AIGC は現在、投資調査、設計、評価など、ユーザーが知覚できる価値を生み出すいくつかの詳細なビジネス シナリオにおいて、効率性に対するより高い要件を伴う特定のビジネス シナリオの改善を支援できます。建設業界の管理と建設。
4.1 最適なソリューションの利益と効率の向上
建設業界の投資調査段階では、2021 年の「二集中」政策(土地の集中供給と土地の集中競売)により、1ヶ月以内に大量の土地を立ち上げることができ、開発会社は短期間で各土地の投資評価を完了する必要があります。土地の探し方、製品価値を最大限に高め、投資収益率を計算するための最適な建築計画ソリューション。当初、住宅計画のコンセプト プランを完成させるには少なくとも 3 ~ 5 日を要し、ビジネス ニーズを満たすことができなかったため、投資前の建築計画計画を極めて効率的に行う必要性が高まりました。
Xiaoku チームは AIGC の建築計画計画を立ち上げましたが、初期計画の出力には当初の時間の約 30% しかかかりませんでした。さらに重要なことは、AI は人々が思いつかなかったソリューションや、手動で徹底的に改良することが難しいソリューションを生成および最適化できるため、パフォーマンスや経済性の面でより良い結果を達成できることです。たとえば、中国金茂の江西省プロジェクトでは、AI が生成した計画は当初の方法の 20% しか時間がかからなかっただけでなく、当初の計画と比較してプロジェクトの総額が 5,600 万元増加しました。 2021 年の 9 か月間で不動産オークション市場において、チームは約 1,000 のプロジェクトと約 1 万の計画を完了し、顧客が数十の土地を無事に取得できるよう支援しました。
「Xiaoku Design Cloud」AIが実際の宅地取得計画を生成
4.2 コスト削減、エネルギー節約、排出削減
実際の建物建設プロセスでは、Xiaoku チームは AI と DFMA (製造および組立のための設計) を組み合わせて組み立てます。 「製造向け設計」の設計手法と組み合わせて、建設大手中国建設グループの子会社である中国建設科技と提携し、ボックス型プレハブ建築とAI設計生成およびL5レベルのABCを深く組み合わせました。 「デジタル・アナログ・スケール」連携を実現導入前に投資・計画・コストのリアルタイム連携を実現し、設計変更やコスト変更を80%削減し、組立部品全体のSKUや型開き量を効果的に削減し、以上の成果を実現します。 50% の省エネと排出削減。より優れたパフォーマンスと経済効果を得るとともに、「ネイティブデータ」を工場の生産ラインやスマート建設現場と効果的に接続して「ツインデータ」にすることができます。深センのホテルプロジェクトでは、設計から建設まで4カ月で完了し、総工期を少なくとも14カ月大幅に短縮し、時間を60%以上節約した。
「Xiaoku Assembly Cloud」は中国建設科学技術と提携し、深センのホテル全体を建設プロセスはインテリジェントな設計とインテリジェントな構築)
##L5 インテリジェント構築モードと従来のモードの比較
上記の事例からわかるように、L5 レベルの AIGC はデータ生成のソースから開始し、それぞれの細分化されたシナリオを通じて業界チェーンが特定のアプリケーションを取得できるように効果的に支援します。産業チェーンのリンクにより、ライフサイクルの品質、効率性、核となる競争力が向上します。将来的には、AIGC がテキストや画像から、より高次元の 3D および L5 コンテンツの結果に移行するのが一般的な傾向であり、これは建設業界における人工知能に対する将来の期待だけでなく、あらゆる業界の共通の期待でもあります。産業。
注: *レイヤーに明らかなエラーがないことに基づいて、現在の Xiaoku AI 認識は標準コンポーネント (ドア、窓、壁、階段、エレベーター) を対象としています。認識精度は 99.8% です (テスト セットは数千の建築 CAD 図面であり、図面のソースは複数の大手開発者の内部標準ライブラリです)
以上がChatGPT によって推進される AIGC は垂直産業に対して何ができるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









StableDiffusion3 の論文がついに登場しました!このモデルは2週間前にリリースされ、Soraと同じDiT(DiffusionTransformer)アーキテクチャを採用しており、リリースされると大きな話題を呼びました。前バージョンと比較して、StableDiffusion3で生成される画像の品質が大幅に向上し、マルチテーマプロンプトに対応したほか、テキスト書き込み効果も向上し、文字化けが発生しなくなりました。 StabilityAI は、StableDiffusion3 はパラメータ サイズが 800M から 8B までの一連のモデルであると指摘しました。このパラメーター範囲は、モデルを多くのポータブル デバイス上で直接実行できることを意味し、AI の使用を大幅に削減します。

自動運転では軌道予測が重要な役割を果たしており、自動運転軌道予測とは、車両の走行過程におけるさまざまなデータを分析し、将来の車両の走行軌跡を予測することを指します。自動運転のコアモジュールとして、軌道予測の品質は下流の計画制御にとって非常に重要です。軌道予測タスクには豊富な技術スタックがあり、自動運転の動的/静的知覚、高精度地図、車線境界線、ニューラル ネットワーク アーキテクチャ (CNN&GNN&Transformer) スキルなどに精通している必要があります。始めるのは非常に困難です。多くのファンは、できるだけ早く軌道予測を始めて、落とし穴を避けたいと考えています。今日は、軌道予測に関するよくある問題と入門的な学習方法を取り上げます。関連知識の紹介 1. プレビュー用紙は整っていますか? A: まずアンケートを見てください。

この論文では、自動運転においてさまざまな視野角 (遠近法や鳥瞰図など) から物体を正確に検出するという問題、特に、特徴を遠近法 (PV) 空間から鳥瞰図 (BEV) 空間に効果的に変換する方法について検討します。 Visual Transformation (VT) モジュールを介して実装されます。既存の手法は、2D から 3D への変換と 3D から 2D への変換という 2 つの戦略に大別されます。 2D から 3D への手法は、深さの確率を予測することで高密度の 2D フィーチャを改善しますが、特に遠方の領域では、深さ予測に固有の不確実性により不正確さが生じる可能性があります。 3D から 2D への方法では通常、3D クエリを使用して 2D フィーチャをサンプリングし、Transformer を通じて 3D と 2D フィーチャ間の対応のアテンション ウェイトを学習します。これにより、計算時間と展開時間が増加します。

この四角い男性は、目の前にいる「招かれざる客」の正体について考えながら眉をひそめていることに注意してください。彼女が危険な状況にあることが判明し、これに気づくと、彼女は問題を解決するための戦略を見つけるためにすぐに頭の中で探索を始めました。最終的に、彼女は現場から逃走し、できるだけ早く助けを求め、直ちに行動を起こすことにしました。同時に、反対側の人も彼女と同じことを考えていた……『マインクラフト』では、登場人物全員が人工知能によって制御されている、そんなシーンがありました。それぞれに個性的な設定があり、例えば先ほどの女の子は17歳ながら賢くて勇敢な配達員です。彼らは記憶力と思考力を持ち、Minecraft の舞台となるこの小さな町で人間と同じように暮らしています。彼らを動かすのはまったく新しいものであり、

上記と著者の個人的な理解は、画像ベースの 3D 再構成は、一連の入力画像からオブジェクトまたはシーンの 3D 形状を推測することを含む困難なタスクであるということです。学習ベースの手法は、3D形状を直接推定できることから注目を集めています。このレビュー ペーパーは、これまでにない新しいビューの生成など、最先端の 3D 再構成技術に焦点を当てています。入力タイプ、モデル構造、出力表現、トレーニング戦略など、ガウス スプラッシュ メソッドの最近の開発の概要が提供されます。未解決の課題と今後の方向性についても議論します。この分野の急速な進歩と 3D 再構成手法を強化する数多くの機会を考慮すると、アルゴリズムを徹底的に調査することが重要であると思われます。したがって、この研究は、ガウス散乱の最近の進歩の包括的な概要を提供します。 (親指を上にスワイプしてください

9 月 23 日、論文「DeepModelFusion:ASurvey」が国立国防技術大学、JD.com、北京理工大学によって発表されました。ディープ モデルの融合/マージは、複数のディープ ラーニング モデルのパラメーターまたは予測を 1 つのモデルに結合する新しいテクノロジーです。さまざまなモデルの機能を組み合わせて、個々のモデルのバイアスとエラーを補償し、パフォーマンスを向上させます。大規模な深層学習モデル (LLM や基本モデルなど) での深層モデルの融合は、高い計算コスト、高次元のパラメーター空間、異なる異種モデル間の干渉など、いくつかの課題に直面しています。この記事では、既存のディープ モデル フュージョン手法を 4 つのカテゴリに分類します。 (1) 「パターン接続」。損失低減パスを介して重み空間内の解を接続し、より適切な初期モデル フュージョンを取得します。

OpenAI によってリリースされた GPT-4o モデルは、特に複数の入力メディア (テキスト、オーディオ、画像) を処理し、対応する出力を生成する機能において、間違いなく大きな進歩です。この機能により、人間とコンピューターの対話がより自然かつ直観的になり、AI の実用性と使いやすさが大幅に向上します。 GPT-4o の主なハイライトには、高いスケーラビリティ、マルチメディア入出力、自然言語理解機能のさらなる向上などが含まれます。 1. クロスメディア入出力: GPT-4o+ は、テキスト、オーディオ、画像の任意の組み合わせを入力として受け入れ、これらのメディアから出力を直接生成できます。これにより、単一の入力タイプのみを処理する従来の AI モデルの制限が打ち破られ、人間とコンピューターの対話がより柔軟かつ多様になります。このイノベーションはスマート アシスタントの強化に役立ちます

Golang とフロントエンド テクノロジーの組み合わせ: Golang がフロントエンド分野でどのような役割を果たしているかを調べるには、具体的なコード例が必要です。インターネットとモバイル アプリケーションの急速な発展に伴い、フロントエンド テクノロジーの重要性がますます高まっています。この分野では、強力なバックエンド プログラミング言語としての Golang も重要な役割を果たします。この記事では、Golang がどのようにフロントエンド テクノロジーと組み合わされるかを検討し、具体的なコード例を通じてフロントエンド分野での可能性を実証します。フロントエンド分野における Golang の役割は、効率的で簡潔かつ学びやすいものとしてです。
