目次
はじめに
人工知能プラットフォーム ソリューションの核となる必要性: 継続的なテスト
AIaaS ソリューション内のデータを確実に抽出できるようにする
AIaaS ソリューションにおける人工知能アルゴリズムの確保
AIaaS ソリューションでの統合とインターフェイスの確保
AIaaS ソリューションでのユーザー エクスペリエンスの確保
結論
翻訳者紹介
ホームページ テクノロジー周辺機器 AI 人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

Apr 09, 2023 pm 03:41 PM
AI テスト 人工知能プラットフォーム

翻訳者 | Zhu Xianzhong

査読者 | Sun Shujuan

はじめに

人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計

私たちは人工知能の黄金時代にいます。人工知能ソリューションの導入により、企業の創造性、競争力、応答性が向上します。 Software-as-a-Service (SaaS) モデルは、クラウド テクノロジーの進歩と相まって、ソフトウェアの生産と使用のプロセスをますます成熟させてきました。

ほとんどの組織が、独自の AI テクノロジーを「構築」するよりも、既製の AI テクノロジーを「購入」することを好むのは共通の事実です。したがって、Salesforce、SAP、Oracle などの SaaS プロバイダーは、人工知能プラットフォーム機能を次々に導入し、サービスとしての人工知能 (AI-as-a-Service、AIaaS) モデルを構築しています。実際、この開発傾向により、企業は人工知能ソリューションを採用しやすくなります。

テスト テクノロジーは、品質保証 (QA) 全般、特に人工知能プラットフォームの導入において重要な役割を果たします。さらに、AI プラットフォームを採用すると、次の理由からテストが非常に複雑になります。

  1. AI のテストには、スマートなテスト プロセス、仮想化されたクラウド リソース、専門的なスキル、および AI ツールが必要です。
  2. 人工知能プラットフォームプロバイダーはさまざまなバージョンを頻繁にリリースしますが、テストの速度はできるだけ速くなければなりません。
  3. 人工知能製品は透明性に欠け、説明できないことが多いため、納得することが困難です。
  4. 人工知能製品だけでなく、トレーニング モデルの品質とデータの品質も同様に重要です。ただし、クラウド リソース、アルゴリズム、インターフェイス、ユーザー構成を検証するための従来のテスト方法の一部は、一般に非効率的です。このようにして、学習、推論、知覚、操作などのテストも同様に重要になります。

たとえば、プラグ アンド プレイ AI ソリューション モデルでは、AI ロジックはソフトウェア ベンダーによって提供されます。消費者としてのプログラマーは、インターフェイスの構築、ロジックをトレーニングするためのデータの提供、ソリューションのコンテキストでのロジックのトレーニング、およびエクスペリエンスをエンド ユーザーに拡張する責任を負います。

まず、従来のテストと同様に、データ、アルゴリズム、統合、ユーザー エクスペリエンスをテストする必要があります。次に、ソリューションの機能的適合性をテストするには、トレーニングされたモデルを検証する必要があります。これにより、テストが推論、計画、学習などに拡張されます。第三に、AI アルゴリズム自体を検証する方法を開発する必要があります。最後に、検索、最適化、確率など、AI ロジックで使用される可能性のあるツールも機能検証に含める必要があります。この記事では、人工知能テスト フレームワークに関する実践的な観点を紹介します。

人工知能プラットフォーム ソリューションの核となる必要性: 継続的なテスト

AI プラットフォームの導入には、高度な自動化を通じて達成される QA の成熟度が不可欠です。企業がインフラストラクチャとエンジニアリング手法を最新化するにつれて、リリース サイクルはますます短縮され、高度に自動化される可能性があります。継続的インテグレーション (CI) 技術が効果的であることが証明されています。コードが 1 日に数回ログインされて再コンパイルされると、複数の QA フィードバック ループが生成されます。したがって、CI を適切に適用するには、ビルドとデプロイのプロセスを自動化することが重要です。自動化は CI の基礎であり、テストの自動化により継続的デリバリー (CD) が可能になります。つまり、CD は CI によって駆動されます。アジャイルおよび DevOps モデルの開発により、開発とテストの間のフィードバック ループが加速し、継続的テスト (CT)、継続的開発、継続的デリバリーが制度化されました。

企業では、データ、アプリケーション、インフラストラクチャなどが絶えず変化しています。同時に、SaaS プロバイダーは、ユーザー エクスペリエンスと開発効率を向上させるために AI 製品のアップグレードを続けています。この動的な状況では、継続的なテスト エコシステムを確立することが重要です。このような完全に自動化されたテスト環境は、変化する企業 IT 資産を検証するだけでなく、AI 製品のバージョンの変化も検証できます。

要約すると、優れた CT エコシステムを確立するには、次の要素を考慮する必要があります:

  1. 自動テスト スクリプトをエンタープライズ バージョン管理ツールに移行します。オートメーション コードベースは、アプリケーション コードベースと同様に、バージョン管理リポジトリに存在する必要があります。このようにして、テスト資産をアプリケーションおよびデータ資産と組み合わせることが効率的になります。
  2. 自動化スイートをコード/データ ビルド展開ツールと統合して、一元的な実行とレポートをサポートする計画。コード/データのビルドをそれぞれの自動化スイートと調整することが重要です。もちろん、人間の介入を避けるために、すべてのビルド中にツールベースの自動展開が絶対に必要です。
  3. 自動化スイートを複数のテスト層に分割して、各チェックポイントでのフィードバックを高速化します。たとえば、AI ヘルスチェックでは、インターフェイスやデータ構造に変更が導入された後、サービスが適切に機能していることを検証できます。 AI 煙テストは、重要なシステム機能が適切に機能しており、詰まり欠陥がないことを検証できます。
  4. テスト範囲はトレーニング モデルもカバーする必要があります。 AI テストでは、ソリューションが教師ありと教師なしの両方で与えられた命令を学習するかどうかを実証するトレーニング済みモデルもテストする必要があります。同じシナリオを複数回再現して、応答が所定のトレーニングと一致するかどうかを確認することが重要です。同様に、テストの一環として、障害、例外、エラーなどに対する解決策をトレーニングするプロセスを整備することが重要です。例外処理を注意深く考慮すれば、フォールト トレランスを組み込むことができます。
  5. AI ソリューション サイクル全体を通じて、人工知能のトレーニング/学習を管理する計画を立てます。 CT 関連の設定は、テストから本番環境まで学習を継続するのに役立ち、転移学習に関する懸念を軽減します。
  6. インテリジェントな回帰による最適化。アンサンブル回帰の実行サイクル時間が大幅に長い場合、CT は、深刻な影響を受ける領域に基づいて実行時にサブセットを分割し、妥当な時間枠内でフィードバックを提供する必要があります。 ML アルゴリズムを効果的に使用して確率モデルを作成し、特定のコードやデータの構築と一致する回帰テストを選択します。これにより、クラウド リソースの使用を効率的に最適化し、テストを高速化できます。
  7. 包括的な回帰テストを定期的に必ずスケジュールしてください。この作業は、定期的なビルド頻度との整合性に応じて、夜間または週末にスケジュールできます。これは CT エコシステムからの究極のフィードバックであり、その目標は、並列実行するスレッドまたはマシンを実行することでフィードバック時間を最小限に抑えることです。

人間の介入なしにテストが行​​われる場合、不具合、エラー、およびアルゴリズムの異常が AI ソリューションの発見の源となります。同様に、テスト中の実際の使用状況やユーザーの好みもトレーニングのソースとなり、運用環境でも継続する必要があります。

AIaaS ソリューション内のデータを確実に抽出できるようにする

データ品質は、人工知能ソリューションにおける最も重要な成功基準です。有用なデータは企業の内外に存在します。有用なデータを抽出して AI エンジンに供給する機能は、高品質な開発の要件の 1 つです。抽出、変換、ロード (ETL) は、さまざまなソースからデータを収集し、ビジネス ルールに基づいて変換し、ターゲット データ ストアにロードするデータ パイプラインを指す伝統的な用語です。 ETL 分野は、エンタープライズ情報統合 (EII)、エンタープライズ アプリケーション統合 ​​(EAI)、およびサービスとしてのエンタープライズ クラウド統合プラットフォーム (iPaaS) に発展しました。技術の進歩に関係なく、データ保証の必要性はますます重要になるでしょう。データ保証では、Map Reduce プロセス検証、変換ロジック検証、データ検証、データ ストレージ検証などの機能テスト活動に取り組む必要があります。さらに、データ保証では、パフォーマンス、フェイルオーバー、データ セキュリティの非機能的な側面にも対処する必要があります。

構造化データは管理が容易ですが、企業の外部から発信された非構造化データは注意して扱う必要があります。ストリーム処理の原則は、移動中のデータを早期に準備するのに役立ちます。つまり、イベント駆動型の処理を通じて、Web サイト、外部アプリケーション、モバイル デバイス、センサー、その他のソースからデータが生成または受信されるとすぐにデータが処理されます。また、クオリティゲートを設けて品質をチェックすることも絶対に必要です。

Twitter、Instagram、WhatsApp などのメッセージング プラットフォームは、一般的なデータ ソースです。このようなデータを使用する場合、クラウドベースのメッセージング フレームワークを介して、さまざまなテクノロジー間でアプリケーション、サービス、デバイスが接続されます。深層学習技術により、コンピューターはこれらのデータ負荷から学習することができます。このデータの一部には、音声からテキストの転写、手書き認識から顔認識など、複雑な信号処理やパターン認識の問題を解決するためにニューラル ネットワーク ソリューションの助けが必要です。したがって、これらのプラットフォームからのデータをテストするには、必要な品質ゲートを確立する必要があります。

人工知能主導の QA プロジェクトを設計する際に注意すべき点をいくつか示します。

  1. 自動化された品質ゲート: ML アルゴリズムを実装して、履歴的および知覚的な基準に基づいてデータが「合格」するかどうかを判断できます。
  2. ソース原因の予測: データ欠陥のソース原因を分類または特定することは、将来のエラーを回避するだけでなく、データ品質を継続的に向上させるのにも役立ちます。パターンと相関関係を通じて、テスト チームは ML アルゴリズムを実装して、欠陥を原因まで追跡できます。これは、データが自己テストと自己修復の次の段階に進む前に、修復テストと修復を自動化するのに役立ちます。
  3. 事前認識型モニタリングの活用: ML アルゴリズムは、メモリ使用率の高さ、機能停止を引き起こす可能性のある潜在的な脅威など、データ パターンの症状や関連するコーディング エラーを検索できるため、チームが自動的に修正手順を実装できるようになります。 。たとえば、AI エンジンは並列プロセスを自動的に加速して、サーバーの消費を最適化できます。
  4. フェイルオーバー: ML アルゴリズムは障害を検出し、自動的に回復して処理を継続でき、学習のために障害を登録できます。

AIaaS ソリューションにおける人工知能アルゴリズムの確保

ソフトウェア システムの内部構造がわかっていれば、開発テストは簡単です。ただし、AI プラットフォーム ソリューションでは、AI と ML は「説明可能」ではありません。つまり、入出力マッピングが唯一の既知の要素であり、開発者は基盤となる AI 機能 (予測など) の仕組みを確認または理解できないことがよくあります。従来のブラックボックス テストは入出力マッピングの問題の解決に役立ちますが、透明性が欠如している場合、人間はテスト モデルを信頼することが困難になります。もちろん、AI プラットフォーム ソリューションはブラック ボックスです。AI プログラムの機能を検証するのに役立つ独自の AI テクニックが存在します。このように、テストは単に入力と出力のマッピングの問題ではありません。設計を考慮するために、人工知能によって駆動されるいくつかのブラックボックス テスト手法には次のようなものがあります。

  1. 事後予測チェック (PPC) は、適合モデルに基づいて複製されたデータをシミュレートし、それを観測データと比較して比較します。したがって、テストでは事後予測を使用して、「実際のデータとシミュレートされたデータの間の体系的な違いを探す」ことができます。
  2. テストケースを最適化するための遺伝的アルゴリズム。テスト ケースを生成する際の課題の 1 つは、テスト対象のソフトウェアへの入力として使用したときに最大のカバレッジが得られるデータ セットを見つけることです。この問題が解決されれば、テスト ケースを最適化できます。選択、交叉、突然変異など、自然の進化プロセスで実行される基本的な動作をシミュレートする適応ヒューリスティック検索アルゴリズムがあります。ヒューリスティック検索を使用してテスト ケースを生成する場合、テスト アプリケーションに関するフィードバック情報を使用して、テスト データがテスト要件を満たしているかどうかを判断します。フィードバック メカニズムにより、テスト要件が満たされるまでテスト データを徐々に調整できます。
  3. テストケースを自動生成するニューラルネットワーク。これらは、経験的な知識を取得、保存、処理できる物理的な細胞システムです。彼らは人間の脳を模倣して学習タスクを実行します。ニューラルネットワーク学習技術を利用してテストケースを自動生成します。このモデルでは、ニューラル ネットワークは、AI プラットフォーム製品のオリジナル バージョンに適用された一連のテスト ケースでトレーニングされます。ネットワーク トレーニングは、システムの入力と出力のみを対象としています。トレーニングされたネットワークは、AI プラットフォーム製品の新しい、潜在的にバグのあるバージョンによって生成された出力の正確さを評価するための人工のオラクルとして使用できます。
  4. モデルベースの回帰テスト選択のためのファジー ロジック。これらの方法は、すでにモデル駆動型開発方法を使用しているプロジェクトでは役立ちますが、主な障害は、モデルが高い抽象レベルで作成されることが多いことです。モデル内のカバレッジ関連の実行トレースとコードレベルのテストケースの間のトレーサビリティリンクを確立するために必要な情報が不足しています。ファジー ロジック ベースの手法を使用すると、抽象モデルを自動的に洗練して、トレーサビリティ リンクの識別を可能にする詳細なモデルを生成できます。このプロセスでは、ある程度の不確実性が生じます。この不確実性は、改良ベースのファジー ロジックを適用することで解決できます。このアプローチのロジックは、使用される改良アルゴリズムに関連付けられた確率的な正確さに基づいて、テスト ケースを再テスト可能なものに分類することです。

この部分の知識の詳細については、「機械学習モデルのブラック ボックス テスト」を参照してください。

AIaaS ソリューションでの統合とインターフェイスの確保

AIaaS ソリューションを含むすべての SaaS ソリューションには、事前定義された Web サービスのセットが付属します。エンタープライズ アプリケーションやその他のインテリジェント リソースは、これらのサービスと対話して、約束された結果を達成できます。現在、Web サービスはプラットフォームの独立性、つまり相互運用性を提供するレベルまで進化しました。この柔軟性の向上により、ほとんどの Web サービスをさまざまなシステムで使用できるようになります。もちろん、これらのインターフェイスが複雑なため、それに応じてテスト レベルも高める必要があります。たとえば、CI/CD 環境では、構築されたすべてのアプリケーション パッケージでこれらのインターフェイスの互換性を確認することが重要なタスクになります。

現在のこの分野の主な課題は、仮想化 Web サービスを実装し、AI プラットフォーム ソリューションとアプリケーションまたは IoT インターフェイス間のデータ フローを検証することです。要約すると、インターフェイス/Web サービスのテストが複雑になる主な理由は次のとおりです。

  1. テストの準備ができていない可能性のある別のソースと既に統合されていない限り、テスト可能なユーザー インターフェイスはありません。
  2. これらのサービスで定義されたすべての要素は、どのアプリケーションで使用されるか、または使用される頻度に関係なく、検証が必要です。
  3. サービスの基本的なセキュリティ パラメータを検証する必要があります。
  4. さまざまな通信プロトコルを介してサービスに接続します。
  5. サービスの複数のチャネルを同時に呼び出すと、パフォーマンスとスケーラビリティの問題が発生する可能性があります。

したがって、インターフェイス層のテストが特に必要です。

  1. コンポーネントまたはアプリケーションの動作をシミュレートします。 AI アプリケーションと人間、機械、ソフトウェアとのインターフェイスの複雑さは、正確性、完全性、一貫性、速度を確保するために AI テストでシミュレートされる必要があります。
  2. 非標準コードの使用を確認してください。オープンソース ライブラリを使用し、現実世界のアプリケーションを採用すると、企業の IT 環境に非標準のコードやデータが持ち込まれる可能性があります。したがって、これらはすべて検証する必要があります。

AIaaS ソリューションでのユーザー エクスペリエンスの確保

人々が主にリモートで働き、リモートで生活するという新しい社会現実において、カスタマー エクスペリエンスはビジネスの成功に必要不可欠なものとなっています。これは、人工知能計画におけるより大きな目標です。非機能テストは、パフォーマンス、セキュリティ、アクセシビリティなどのプロパティを検証することにより、有意義な顧客エクスペリエンスを提供することが証明されている現象です。一般に、次世代テクノロジーはエクスペリエンス保証の複雑さを増大させます。

AI テスト フレームワーク全体でユーザー エクスペリエンスを確保するための重要な設計上の考慮事項を以下に示します。

  1. 経験のためのテストではなく、経験のための設計。エンタープライズ AI 戦略はエンドユーザーの視点から始める必要があります。テスト チームが実際の顧客を代表していることを確認することが重要です。設計の早い段階でクライアントを関与させることは、設計に役立つだけでなく、早い段階でクライアントの信頼を得るのにも役立ちます。
  2. テスト最適化モデルを構築することで、俊敏性と自動化を実現します。ユーザー エクスペリエンスの問題は、テスト サイクルの「スウォーム」段階から考慮する必要があります。ユーザー エクスペリエンスを早期にテストすることが、ビルド、テストに最適化された開発サイクルの達成に役立つからです。
  3. アジャイルな手法による継続的なセキュリティは重要です。エンタープライズ セキュリティ チームを、1) テストの「群」期間中に組織の脅威モデルを所有および検証する、2) SaaS AI ソリューション アーキテクチャが持つ可能性のあるすべてのマルチチャネル インターフェイスにわたる構造的脆弱性を評価する、アジャイル チームの一部にさせます。仮想ハッカーの視点から)。
  4. スピードが重要です。量、速度、多様性、変動性などの AI データの特性には、前処理、並列/分散処理、および/またはストリーム処理が必要です。パフォーマンス テストは、ユーザーがシステムに期待する速度に必要な分散処理の設計を最適化するのに役立ちます。
  5. テキストと音声のテストのニュアンスも重要です。多くの調査結果は、会話型 AI が依然として企業の議題の最上位にあることを示しています。拡張現実、仮想現実、エッジ人工知能などの新しいテクノロジーが次々と登場するにつれ、テキスト、音声、自然言語処理のテストなどの要件はすべて満たされる必要があります。
  6. シミュレーションは限界をテストするのに役立ちます。ユーザー シナリオの検討はエクスペリエンス保証の基礎です。 AI に関して言えば、異常、エラー、違反をテストすることはシステムの動作を予測するのに役立ち、ひいては AI アプリケーションのエラー/フォールト トレランス レベルを検証するのに役立ちます。
  7. 信頼、透明性、多様性。 AI の結果に対する企業ユーザーの信頼を検証し、データ ソースとアルゴリズムの透明性を検証し、リスク軽減を目標にして AI への信頼を高めるための透明性を要求し、AI の倫理とその精度を検査するためにデータ ソースとユーザー/テスターの多様性を確保する。これらはすべてです。致命的。これを行うには、テスターはドメイン知識を向上させるだけでなく、大企業 IT におけるデータ、アルゴリズム、統合プロセスの技術的ノウハウを理解する必要があります。

結論

つまり、継続的なテストは、すべての企業が人工知能プラットフォーム ソリューションを導入するための基本要件です。したがって、データ、アルゴリズム、統合、およびエクスペリエンス保証アクティビティの設計を改善するには、モジュール式のアプローチを採用する必要があります。これにより、継続的なテスト エコシステムを構築し、企業の IT 部門が内部および外部の AI コンポーネントの頻繁な変更を受け入れる準備ができるようになります。

翻訳者紹介

Zhu Xianzhong 氏、51CTO コミュニティ編集者、51CTO エキスパートブロガー、講師、濰坊市の大学のコンピューター教師、フリーランスプログラミング業界のベテラン。初期の頃は、さまざまな Microsoft テクノロジ (ASP.NET AJX および Cocos 2d-X に関連する 3 冊の技術書を編集) に焦点を当てていましたが、過去 10 年間は、オープンソースの世界に専念してきました (人気のある完全なソースに精通しています)。スタックWeb開発技術)を学び、OneNet/AliOS Arduino/ESP32/Raspberry PiなどのIoT開発技術やScala Hadoop Spark Flinkなどのビッグデータ開発技術について学びました。

原題: AI プラットフォーム導入のための品質エンジニアリング設計 、著者: Anbu Muppidathi

以上が人工知能プラットフォームソリューションにおける高品質のエンジニアリング設計の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります 微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性​​を実証しています。 「S」で始まる関連研究

あなたが知らない機械学習の 5 つの流派 あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

VSCode フロントエンド開発の新時代: 強く推奨される 12 の AI コード アシスタント VSCode フロントエンド開発の新時代: 強く推奨される 12 の AI コード アシスタント Jun 11, 2024 pm 07:47 PM

フロントエンド開発の世界では、VSCode はその強力な機能と豊富なプラグイン エコシステムにより、数多くの開発者に選ばれるツールとなっています。近年、人工知能技術の急速な発展に伴い、VSCode 上の AI コード アシスタントが登場し、開発者のコ​​ーディング効率が大幅に向上しました。 VSCode 上の AI コード アシスタントは雨後のキノコのように出現し、開発者のコ​​ーディング効率を大幅に向上させました。人工知能テクノロジーを使用してコードをインテリジェントに分析し、正確なコード補完、自動エラー修正、文法チェックなどの機能を提供することで、コーディング プロセス中の開発者のエラーや退屈な手作業を大幅に削減します。今日は、プログラミングの旅に役立つ 12 個の VSCode フロントエンド開発 AI コード アシスタントをお勧めします。

See all articles