人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計-AI-php.cn

はじめに

人工知能プラットフォームソリューションの核となる必要性: 継続的なテスト

AIaaS ソリューション内のデータを確実に抽出できるようにする

AIaaS ソリューションにおける人工知能アルゴリズムの確保

AIaaS ソリューションでの統合とインターフェイスの確保

AIaaS ソリューションでのユーザーエクスペリエンスの確保

結論

翻訳者紹介

ホームページ

テクノロジー周辺機器

人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

PHPz

Apr 09, 2023 pm 03:41 PM

AI テスト人工知能プラットフォーム

翻訳者 | Zhu Xianzhong

査読者 | Sun Shujuan

はじめに

人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

私たちは人工知能の黄金時代にいます。人工知能ソリューションの導入により、企業の創造性、競争力、応答性が向上します。 Software-as-a-Service (SaaS) モデルは、クラウドテクノロジーの進歩と相まって、ソフトウェアの生産と使用のプロセスをますます成熟させてきました。

ほとんどの組織が、独自の AI テクノロジーを「構築」するよりも、既製の AI テクノロジーを「購入」することを好むのは共通の事実です。したがって、Salesforce、SAP、Oracle などの SaaS プロバイダーは、人工知能プラットフォーム機能を次々に導入し、サービスとしての人工知能 (AI-as-a-Service、AIaaS) モデルを構築しています。実際、この開発傾向により、企業は人工知能ソリューションを採用しやすくなります。

テストテクノロジーは、品質保証 (QA) 全般、特に人工知能プラットフォームの導入において重要な役割を果たします。さらに、AI プラットフォームを採用すると、次の理由からテストが非常に複雑になります。

AI のテストには、スマートなテストプロセス、仮想化されたクラウドリソース、専門的なスキル、および AI ツールが必要です。
人工知能プラットフォームプロバイダーはさまざまなバージョンを頻繁にリリースしますが、テストの速度はできるだけ速くなければなりません。
人工知能製品は透明性に欠け、説明できないことが多いため、納得することが困難です。
人工知能製品だけでなく、トレーニングモデルの品質とデータの品質も同様に重要です。ただし、クラウドリソース、アルゴリズム、インターフェイス、ユーザー構成を検証するための従来のテスト方法の一部は、一般に非効率的です。このようにして、学習、推論、知覚、操作などのテストも同様に重要になります。

たとえば、プラグアンドプレイ AI ソリューションモデルでは、AI ロジックはソフトウェアベンダーによって提供されます。消費者としてのプログラマーは、インターフェイスの構築、ロジックをトレーニングするためのデータの提供、ソリューションのコンテキストでのロジックのトレーニング、およびエクスペリエンスをエンドユーザーに拡張する責任を負います。

まず、従来のテストと同様に、データ、アルゴリズム、統合、ユーザーエクスペリエンスをテストする必要があります。次に、ソリューションの機能的適合性をテストするには、トレーニングされたモデルを検証する必要があります。これにより、テストが推論、計画、学習などに拡張されます。第三に、AI アルゴリズム自体を検証する方法を開発する必要があります。最後に、検索、最適化、確率など、AI ロジックで使用される可能性のあるツールも機能検証に含める必要があります。この記事では、人工知能テストフレームワークに関する実践的な観点を紹介します。

人工知能プラットフォームソリューションの核となる必要性: 継続的なテスト

AI プラットフォームの導入には、高度な自動化を通じて達成される QA の成熟度が不可欠です。企業がインフラストラクチャとエンジニアリング手法を最新化するにつれて、リリースサイクルはますます短縮され、高度に自動化される可能性があります。継続的インテグレーション (CI) 技術が効果的であることが証明されています。コードが 1 日に数回ログインされて再コンパイルされると、複数の QA フィードバックループが生成されます。したがって、CI を適切に適用するには、ビルドとデプロイのプロセスを自動化することが重要です。自動化は CI の基礎であり、テストの自動化により継続的デリバリー (CD) が可能になります。つまり、CD は CI によって駆動されます。アジャイルおよび DevOps モデルの開発により、開発とテストの間のフィードバックループが加速し、継続的テスト (CT)、継続的開発、継続的デリバリーが制度化されました。

企業では、データ、アプリケーション、インフラストラクチャなどが絶えず変化しています。同時に、SaaS プロバイダーは、ユーザーエクスペリエンスと開発効率を向上させるために AI 製品のアップグレードを続けています。この動的な状況では、継続的なテストエコシステムを確立することが重要です。このような完全に自動化されたテスト環境は、変化する企業 IT 資産を検証するだけでなく、AI 製品のバージョンの変化も検証できます。

要約すると、優れた CT エコシステムを確立するには、次の要素を考慮する必要があります:

自動テストスクリプトをエンタープライズバージョン管理ツールに移行します。オートメーションコードベースは、アプリケーションコードベースと同様に、バージョン管理リポジトリに存在する必要があります。このようにして、テスト資産をアプリケーションおよびデータ資産と組み合わせることが効率的になります。
自動化スイートをコード/データビルド展開ツールと統合して、一元的な実行とレポートをサポートする計画。コード/データのビルドをそれぞれの自動化スイートと調整することが重要です。もちろん、人間の介入を避けるために、すべてのビルド中にツールベースの自動展開が絶対に必要です。
自動化スイートを複数のテスト層に分割して、各チェックポイントでのフィードバックを高速化します。たとえば、AI ヘルスチェックでは、インターフェイスやデータ構造に変更が導入された後、サービスが適切に機能していることを検証できます。 AI 煙テストは、重要なシステム機能が適切に機能しており、詰まり欠陥がないことを検証できます。
テスト範囲はトレーニングモデルもカバーする必要があります。 AI テストでは、ソリューションが教師ありと教師なしの両方で与えられた命令を学習するかどうかを実証するトレーニング済みモデルもテストする必要があります。同じシナリオを複数回再現して、応答が所定のトレーニングと一致するかどうかを確認することが重要です。同様に、テストの一環として、障害、例外、エラーなどに対する解決策をトレーニングするプロセスを整備することが重要です。例外処理を注意深く考慮すれば、フォールトトレランスを組み込むことができます。
AI ソリューションサイクル全体を通じて、人工知能のトレーニング/学習を管理する計画を立てます。 CT 関連の設定は、テストから本番環境まで学習を継続するのに役立ち、転移学習に関する懸念を軽減します。
インテリジェントな回帰による最適化。アンサンブル回帰の実行サイクル時間が大幅に長い場合、CT は、深刻な影響を受ける領域に基づいて実行時にサブセットを分割し、妥当な時間枠内でフィードバックを提供する必要があります。 ML アルゴリズムを効果的に使用して確率モデルを作成し、特定のコードやデータの構築と一致する回帰テストを選択します。これにより、クラウドリソースの使用を効率的に最適化し、テストを高速化できます。
包括的な回帰テストを定期的に必ずスケジュールしてください。この作業は、定期的なビルド頻度との整合性に応じて、夜間または週末にスケジュールできます。これは CT エコシステムからの究極のフィードバックであり、その目標は、並列実行するスレッドまたはマシンを実行することでフィードバック時間を最小限に抑えることです。

人間の介入なしにテストが行われる場合、不具合、エラー、およびアルゴリズムの異常が AI ソリューションの発見の源となります。同様に、テスト中の実際の使用状況やユーザーの好みもトレーニングのソースとなり、運用環境でも継続する必要があります。

AIaaS ソリューション内のデータを確実に抽出できるようにする

データ品質は、人工知能ソリューションにおける最も重要な成功基準です。有用なデータは企業の内外に存在します。有用なデータを抽出して AI エンジンに供給する機能は、高品質な開発の要件の 1 つです。抽出、変換、ロード (ETL) は、さまざまなソースからデータを収集し、ビジネスルールに基づいて変換し、ターゲットデータストアにロードするデータパイプラインを指す伝統的な用語です。 ETL 分野は、エンタープライズ情報統合 (EII)、エンタープライズアプリケーション統合 (EAI)、およびサービスとしてのエンタープライズクラウド統合プラットフォーム (iPaaS) に発展しました。技術の進歩に関係なく、データ保証の必要性はますます重要になるでしょう。データ保証では、Map Reduce プロセス検証、変換ロジック検証、データ検証、データストレージ検証などの機能テスト活動に取り組む必要があります。さらに、データ保証では、パフォーマンス、フェイルオーバー、データセキュリティの非機能的な側面にも対処する必要があります。

構造化データは管理が容易ですが、企業の外部から発信された非構造化データは注意して扱う必要があります。ストリーム処理の原則は、移動中のデータを早期に準備するのに役立ちます。つまり、イベント駆動型の処理を通じて、Web サイト、外部アプリケーション、モバイルデバイス、センサー、その他のソースからデータが生成または受信されるとすぐにデータが処理されます。また、クオリティゲートを設けて品質をチェックすることも絶対に必要です。

Twitter、Instagram、WhatsApp などのメッセージングプラットフォームは、一般的なデータソースです。このようなデータを使用する場合、クラウドベースのメッセージングフレームワークを介して、さまざまなテクノロジー間でアプリケーション、サービス、デバイスが接続されます。深層学習技術により、コンピューターはこれらのデータ負荷から学習することができます。このデータの一部には、音声からテキストの転写、手書き認識から顔認識など、複雑な信号処理やパターン認識の問題を解決するためにニューラルネットワークソリューションの助けが必要です。したがって、これらのプラットフォームからのデータをテストするには、必要な品質ゲートを確立する必要があります。

人工知能主導の QA プロジェクトを設計する際に注意すべき点をいくつか示します。

自動化された品質ゲート: ML アルゴリズムを実装して、履歴的および知覚的な基準に基づいてデータが「合格」するかどうかを判断できます。
ソース原因の予測: データ欠陥のソース原因を分類または特定することは、将来のエラーを回避するだけでなく、データ品質を継続的に向上させるのにも役立ちます。パターンと相関関係を通じて、テストチームは ML アルゴリズムを実装して、欠陥を原因まで追跡できます。これは、データが自己テストと自己修復の次の段階に進む前に、修復テストと修復を自動化するのに役立ちます。
事前認識型モニタリングの活用: ML アルゴリズムは、メモリ使用率の高さ、機能停止を引き起こす可能性のある潜在的な脅威など、データパターンの症状や関連するコーディングエラーを検索できるため、チームが自動的に修正手順を実装できるようになります。。たとえば、AI エンジンは並列プロセスを自動的に加速して、サーバーの消費を最適化できます。
フェイルオーバー: ML アルゴリズムは障害を検出し、自動的に回復して処理を継続でき、学習のために障害を登録できます。

AIaaS ソリューションにおける人工知能アルゴリズムの確保

ソフトウェアシステムの内部構造がわかっていれば、開発テストは簡単です。ただし、AI プラットフォームソリューションでは、AI と ML は「説明可能」ではありません。つまり、入出力マッピングが唯一の既知の要素であり、開発者は基盤となる AI 機能 (予測など) の仕組みを確認または理解できないことがよくあります。従来のブラックボックステストは入出力マッピングの問題の解決に役立ちますが、透明性が欠如している場合、人間はテストモデルを信頼することが困難になります。もちろん、AI プラットフォームソリューションはブラックボックスです。AI プログラムの機能を検証するのに役立つ独自の AI テクニックが存在します。このように、テストは単に入力と出力のマッピングの問題ではありません。設計を考慮するために、人工知能によって駆動されるいくつかのブラックボックステスト手法には次のようなものがあります。

事後予測チェック (PPC) は、適合モデルに基づいて複製されたデータをシミュレートし、それを観測データと比較して比較します。したがって、テストでは事後予測を使用して、「実際のデータとシミュレートされたデータの間の体系的な違いを探す」ことができます。
テストケースを最適化するための遺伝的アルゴリズム。テストケースを生成する際の課題の 1 つは、テスト対象のソフトウェアへの入力として使用したときに最大のカバレッジが得られるデータセットを見つけることです。この問題が解決されれば、テストケースを最適化できます。選択、交叉、突然変異など、自然の進化プロセスで実行される基本的な動作をシミュレートする適応ヒューリスティック検索アルゴリズムがあります。ヒューリスティック検索を使用してテストケースを生成する場合、テストアプリケーションに関するフィードバック情報を使用して、テストデータがテスト要件を満たしているかどうかを判断します。フィードバックメカニズムにより、テスト要件が満たされるまでテストデータを徐々に調整できます。
テストケースを自動生成するニューラルネットワーク。これらは、経験的な知識を取得、保存、処理できる物理的な細胞システムです。彼らは人間の脳を模倣して学習タスクを実行します。ニューラルネットワーク学習技術を利用してテストケースを自動生成します。このモデルでは、ニューラルネットワークは、AI プラットフォーム製品のオリジナルバージョンに適用された一連のテストケースでトレーニングされます。ネットワークトレーニングは、システムの入力と出力のみを対象としています。トレーニングされたネットワークは、AI プラットフォーム製品の新しい、潜在的にバグのあるバージョンによって生成された出力の正確さを評価するための人工のオラクルとして使用できます。
モデルベースの回帰テスト選択のためのファジーロジック。これらの方法は、すでにモデル駆動型開発方法を使用しているプロジェクトでは役立ちますが、主な障害は、モデルが高い抽象レベルで作成されることが多いことです。モデル内のカバレッジ関連の実行トレースとコードレベルのテストケースの間のトレーサビリティリンクを確立するために必要な情報が不足しています。ファジーロジックベースの手法を使用すると、抽象モデルを自動的に洗練して、トレーサビリティリンクの識別を可能にする詳細なモデルを生成できます。このプロセスでは、ある程度の不確実性が生じます。この不確実性は、改良ベースのファジーロジックを適用することで解決できます。このアプローチのロジックは、使用される改良アルゴリズムに関連付けられた確率的な正確さに基づいて、テストケースを再テスト可能なものに分類することです。

この部分の知識の詳細については、「機械学習モデルのブラックボックステスト」を参照してください。

AIaaS ソリューションでの統合とインターフェイスの確保

AIaaS ソリューションを含むすべての SaaS ソリューションには、事前定義された Web サービスのセットが付属します。エンタープライズアプリケーションやその他のインテリジェントリソースは、これらのサービスと対話して、約束された結果を達成できます。現在、Web サービスはプラットフォームの独立性、つまり相互運用性を提供するレベルまで進化しました。この柔軟性の向上により、ほとんどの Web サービスをさまざまなシステムで使用できるようになります。もちろん、これらのインターフェイスが複雑なため、それに応じてテストレベルも高める必要があります。たとえば、CI/CD 環境では、構築されたすべてのアプリケーションパッケージでこれらのインターフェイスの互換性を確認することが重要なタスクになります。

現在のこの分野の主な課題は、仮想化 Web サービスを実装し、AI プラットフォームソリューションとアプリケーションまたは IoT インターフェイス間のデータフローを検証することです。要約すると、インターフェイス/Web サービスのテストが複雑になる主な理由は次のとおりです。

テストの準備ができていない可能性のある別のソースと既に統合されていない限り、テスト可能なユーザーインターフェイスはありません。
これらのサービスで定義されたすべての要素は、どのアプリケーションで使用されるか、または使用される頻度に関係なく、検証が必要です。
サービスの基本的なセキュリティパラメータを検証する必要があります。
さまざまな通信プロトコルを介してサービスに接続します。
サービスの複数のチャネルを同時に呼び出すと、パフォーマンスとスケーラビリティの問題が発生する可能性があります。

したがって、インターフェイス層のテストが特に必要です。

コンポーネントまたはアプリケーションの動作をシミュレートします。 AI アプリケーションと人間、機械、ソフトウェアとのインターフェイスの複雑さは、正確性、完全性、一貫性、速度を確保するために AI テストでシミュレートされる必要があります。
非標準コードの使用を確認してください。オープンソースライブラリを使用し、現実世界のアプリケーションを採用すると、企業の IT 環境に非標準のコードやデータが持ち込まれる可能性があります。したがって、これらはすべて検証する必要があります。

AIaaS ソリューションでのユーザーエクスペリエンスの確保

人々が主にリモートで働き、リモートで生活するという新しい社会現実において、カスタマーエクスペリエンスはビジネスの成功に必要不可欠なものとなっています。これは、人工知能計画におけるより大きな目標です。非機能テストは、パフォーマンス、セキュリティ、アクセシビリティなどのプロパティを検証することにより、有意義な顧客エクスペリエンスを提供することが証明されている現象です。一般に、次世代テクノロジーはエクスペリエンス保証の複雑さを増大させます。

AI テストフレームワーク全体でユーザーエクスペリエンスを確保するための重要な設計上の考慮事項を以下に示します。

経験のためのテストではなく、経験のための設計。エンタープライズ AI 戦略はエンドユーザーの視点から始める必要があります。テストチームが実際の顧客を代表していることを確認することが重要です。設計の早い段階でクライアントを関与させることは、設計に役立つだけでなく、早い段階でクライアントの信頼を得るのにも役立ちます。
テスト最適化モデルを構築することで、俊敏性と自動化を実現します。ユーザーエクスペリエンスの問題は、テストサイクルの「スウォーム」段階から考慮する必要があります。ユーザーエクスペリエンスを早期にテストすることが、ビルド、テストに最適化された開発サイクルの達成に役立つからです。
アジャイルな手法による継続的なセキュリティは重要です。エンタープライズセキュリティチームを、1) テストの「群」期間中に組織の脅威モデルを所有および検証する、2) SaaS AI ソリューションアーキテクチャが持つ可能性のあるすべてのマルチチャネルインターフェイスにわたる構造的脆弱性を評価する、アジャイルチームの一部にさせます。仮想ハッカーの視点から)。
スピードが重要です。量、速度、多様性、変動性などの AI データの特性には、前処理、並列/分散処理、および/またはストリーム処理が必要です。パフォーマンステストは、ユーザーがシステムに期待する速度に必要な分散処理の設計を最適化するのに役立ちます。
テキストと音声のテストのニュアンスも重要です。多くの調査結果は、会話型 AI が依然として企業の議題の最上位にあることを示しています。拡張現実、仮想現実、エッジ人工知能などの新しいテクノロジーが次々と登場するにつれ、テキスト、音声、自然言語処理のテストなどの要件はすべて満たされる必要があります。
シミュレーションは限界をテストするのに役立ちます。ユーザーシナリオの検討はエクスペリエンス保証の基礎です。 AI に関して言えば、異常、エラー、違反をテストすることはシステムの動作を予測するのに役立ち、ひいては AI アプリケーションのエラー/フォールトトレランスレベルを検証するのに役立ちます。
信頼、透明性、多様性。 AI の結果に対する企業ユーザーの信頼を検証し、データソースとアルゴリズムの透明性を検証し、リスク軽減を目標にして AI への信頼を高めるための透明性を要求し、AI の倫理とその精度を検査するためにデータソースとユーザー/テスターの多様性を確保する。これらはすべてです。致命的。これを行うには、テスターはドメイン知識を向上させるだけでなく、大企業 IT におけるデータ、アルゴリズム、統合プロセスの技術的ノウハウを理解する必要があります。

結論

つまり、継続的なテストは、すべての企業が人工知能プラットフォームソリューションを導入するための基本要件です。したがって、データ、アルゴリズム、統合、およびエクスペリエンス保証アクティビティの設計を改善するには、モジュール式のアプローチを採用する必要があります。これにより、継続的なテストエコシステムを構築し、企業の IT 部門が内部および外部の AI コンポーネントの頻繁な変更を受け入れる準備ができるようになります。

翻訳者紹介

Zhu Xianzhong 氏、51CTO コミュニティ編集者、51CTO エキスパートブロガー、講師、濰坊市の大学のコンピューター教師、フリーランスプログラミング業界のベテラン。初期の頃は、さまざまな Microsoft テクノロジ (ASP.NET AJX および Cocos 2d-X に関連する 3 冊の技術書を編集) に焦点を当てていましたが、過去 10 年間は、オープンソースの世界に専念してきました (人気のある完全なソースに精通しています)。スタックWeb開発技術）を学び、OneNet/AliOS Arduino/ESP32/Raspberry PiなどのIoT開発技術やScala Hadoop Spark Flinkなどのビッグデータ開発技術について学びました。

原題: AI プラットフォーム導入のための品質エンジニアリング設計 、著者: Anbu Muppidathi

以上が人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7467

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Bytedance Cutting が SVIP スーパーメンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティングシステム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元（当サイト注：月額49.9元に相当）、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元（月額41.6元に相当）です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディングアシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティックメモリを AI コーディングアシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミングアシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディングアシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データサイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキストデータベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマンアノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データセットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データセットがありますが、これらのデータセットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンションメカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。「S」で始まる関連研究

AIなどの市場を開拓するグローバルファウンドリーズがタゴール・テクノロジーの窒化ガリウム技術と関連チームを買収 Jul 15, 2024 pm 12:21 PM

7月5日のこのウェブサイトのニュースによると、グローバルファウンドリーズは今年7月1日にプレスリリースを発行し、自動車とインターネットでの市場シェア拡大を目指してタゴール・テクノロジーのパワー窒化ガリウム（GaN）技術と知的財産ポートフォリオを買収したことを発表した。モノと人工知能データセンターのアプリケーション分野で、より高い効率とより優れたパフォーマンスを探求します。生成 AI などのテクノロジーがデジタル世界で発展を続ける中、窒化ガリウム (GaN) は、特にデータセンターにおいて、持続可能で効率的な電力管理のための重要なソリューションとなっています。このウェブサイトは、この買収中にタゴール・テクノロジーのエンジニアリングチームがGLOBALFOUNDRIESに加わり、窒化ガリウム技術をさらに開発するという公式発表を引用した。 G

See all articles

人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

はじめに

人工知能プラットフォーム ソリューションの核となる必要性: 継続的なテスト

AIaaS ソリューション内のデータを確実に抽出できるようにする

AIaaS ソリューションにおける人工知能アルゴリズムの確保

AIaaS ソリューションでの統合とインターフェイスの確保

AIaaS ソリューションでのユーザー エクスペリエンスの確保

結論

翻訳者紹介

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

人工知能プラットフォームソリューションの核となる必要性: 継続的なテスト

AIaaS ソリューションでのユーザーエクスペリエンスの確保