何が人工知能の進歩を妨げているのでしょうか?それともデータの問題でしょうか?
Capital One に代わって Forrester Consulting が実施した新しい調査では、強固なデータ基盤と強固なデータ ワークフローの欠如が、企業が機械学習と人工知能においてより良い結果を達成することを妨げていることを示しています。
Capital One が最近発表した新しいレポート「実用的な機械学習で主要なビジネス成果を達成する」によると、企業による機械学習 (ML) の統合はますます進んでいます。 AI を本番環境に導入することにある程度の成功はありましたが、データ管理の問題が邪魔をしなければ、さらに大きな進歩を遂げていたでしょう。
このレポートは、今年 7 月に北米のデータ管理意思決定者 150 人を対象とした Forrester の調査に一部基づいています。この調査では、意思決定者の 73% がデータの透明性、追跡可能性、説明可能性が重要であると信じていることがわかりました。フローは機械学習と AI への障壁であり、アプリケーションの運用化における主要な問題です。この調査では、回答者の 57% が、データ サイエンティストと事業者との間の内部サイロ化が機械学習の導入を妨げていると回答したことも判明しました。
Capital One の上級副社長兼データ分析責任者の David Kang 氏は、「私たちはまだ、機械学習アルゴリズム自体が人々の成功を妨げるものではない段階にいます。」「鍵はデータです。 "
Capital One がこの調査を依頼したとき、最大の課題は機械学習の実行可能性に焦点が当てられるだろうと考えました。機械学習および人工知能アプリケーションの開発により、MLOps (機械学習オペレーション) は独立した分野となり、Capital One が投資している分野でもあります。
しかし、このレポートが発表されたとき、データに関する意思決定者が最も懸念していたのは、データ エンジニアリングやデータ インフラストラクチャを含む強固なデータ基盤の構築が進んでいないことだとカン氏は述べました。
「ある意味、これは残念なことです。しかし、別の意味では驚くべきことではありません。なぜなら、データを大規模に活用するには、データ エコシステムを考え、再考することに継続的に焦点を当てる必要があるからです。システム内のすべての機能 – それがどのようになっているか「生産と消費、データの監視方法、さまざまな方法でデータを管理する方法。データ エコシステムの変革の旅はまだ進行中です。一度やったら忘れてしまうものではありません。継続的な注意が必要です。」
Capital One の調査は、他の最近の研究結果と似ています。これらの研究では、データ管理の問題が機械学習と人工知能の導入のペースと範囲を遅らせていることが判明しました。これらには、人工知能に関する不適切なデータ管理の危険性を強調した、Databricks の委託による 9 月の MIT Technology Review レポートや、Collibra の委託による 8 月の IDC 調査で、データのカタログ化、継承、品質管理とガバナンス、市場での成功などです。
これらの研究に共通のテーマがあるとすれば、それは、既存の機械学習および人工知能テクノロジーの高度化が急速に進んでいる一方で、企業は一部の中核となるデータ管理作業を十分に行っていないことに気づきつつあるということです。そしてこれらのタスクは、これらの技術的進歩を達成するために必要です。
企業は、ML または AI アプリケーションが限定的な概念実証 (POC) にプラスの影響を与えていることに気づいても、より広範な現実の運用環境へのスムーズな展開を確実にするために必要な措置を講じていない可能性があります。
拡張したいテクノロジーが市場に影響を与え始めるまでには、しばらく時間がかかる場合があります。これらのコンセプトには、結果が見え始めても、突然、大量のデータ サイロやその他のデータ エンジニアリング インフラストラクチャの課題がどこかにあることに気づくという誘惑が常にあります。
データ サイエンスはまだかなり新しい分野であり、多くの企業が求人を埋めるのに苦労しています。 Capital One のレポートによると、回答者の 57% が、データ サイエンスの専門家間のギャップを埋めるためにパートナーシップを利用するつもりだと答えています。 Kang 氏は、社内に専門知識が不足しているため、企業にとってコアとなるデータ インフラストラクチャを確立することがより重要になり、その上により高度な ML や AI のユースケースを構築し、繰り返しやすくなる、と述べました。
Capital One の調査では、機械学習と人工知能の導入を遅らせている他の問題も明らかになりました。同社によると、回答者の36%が「大規模で多様で混乱を招くデータセット」を主要な障害として挙げ、38%がAIリスクを最大の課題として挙げた。 38% が、機械学習の成熟度に対する課題として、組織および外部データ パートナー全体にわたるデータ サイロを挙げました。
データ管理の「問題」によって、人工知能と機械学習への投資が減速することはないようです (少なくともまだ)。 Capital One の調査によると、意思決定者の 61% が今後 3 年間に新しい機械学習機能とアプリケーションを追加する予定であることがわかりました。回答者の半数以上 (53%) が現在、ビジネス効率を向上させるために機械学習を活用することを優先しています。
それでは、企業は何に機械学習を使用しているのでしょうか? 調査のもう 1 つの興味深い情報は、自動異常検出が機械学習の最大の使用例であり、回答者の 40% がそれを最大の使用例として報告していることです。これは、Capital One による機械学習ベースの異常検出システムの構築を支援した Kang 氏の共感を呼びました。
ML と AI のその他の主な使用例には、アプリケーションとインフラストラクチャの自動更新 (39%)、責任ある倫理的な AI のための新しい規制要件とプライバシー要件への対応 (39%) が含まれます。
以上が何が人工知能の進歩を妨げているのでしょうか?それともデータの問題でしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

70B モデルでは、数秒で 1,000 個のトークンを生成でき、これはほぼ 4,000 文字に相当します。研究者らは Llama3 を微調整し、高速化アルゴリズムを導入しました。ネイティブ バージョンと比較して、速度は 13 倍高速になりました。速いだけでなく、コード書き換えタスクのパフォーマンスは GPT-4o をも上回ります。この成果は、人気の AI プログラミング成果物 Cursor を開発したチーム、anysphere によるもので、OpenAI も投資に参加しました。有名な高速推論アクセラレーション フレームワークである Groq では、70BLlama3 の推論速度は 1 秒あたり 300 トークンを超える程度であることを知っておく必要があります。 Cursor の速度により、ほぼ瞬時に完全なコード ファイル編集を実現すると言えます。カースと言うと良い奴だと言う人もいる
