2022 年下半期のデータおよび人工知能テクノロジーの予測
2022 年にこれまでに見てきたことに基づいて、Datanami は今年の残りの期間についてこれら 5 つの予測を立てることができると確信しています。
データの可観測性は継続
今年上半期はデータの可観測性にとって非常に大きな成果を上げ、お客様はデータ フローの状況をより深く理解し、関連する指標を開発できるようになりました。意思決定にとってデータの重要性が高まるにつれて、そのデータの健全性と可用性も重要になります。
私たちは、Cribl (シリーズ D 1 億 5,000 万ドル)、Monte Carlo (シリーズ D 1 億 3,500 万ドル) 、Coralogix (シリーズ D 1 億 4,200 万ドル) など、多くのデータ可観測性スタートアップがベンチャーキャピタルで数億ドルを調達するのを見てきました。 ); その他。ニュースになっている他の企業としては、メタデータ メトリクスを開始した Bigeye、Software AG に 5 億 8,000 万ドルで買収された StreamSets、先月可観測性スタートアップの Databand を買収した IBM などがあります。
この勢いは、より多くのデータ可観測性スタートアップが森の中から現れ、既存のスタートアップがこの新興市場での地位を固めようとするため、2022 年下半期も続くでしょう。
リアルタイム データ ポップアップ
リアルタイム データは長年後回しにされ、ニッチなユースケースに対応していましたが、実際には一般の企業では広く使用されていませんでした。しかし、新型コロナウイルス感染症(COVID-19)のパンデミックと、過去数年間にわたるそれに伴う事業計画の再構築のおかげで、リアルタイムデータが主流のテクノロジーシーンに参入する条件が整いました。
「ストリーミングがついに実現しつつあると思います」と Databricks の CEO、Ali Ghodsi 氏は最近の Data AI Summit で述べ、同社のクラウドベースのデータ プラットフォームにおけるストリーミング ワークロードが 2.5 倍に増加していることを指摘しました。 「リアルタイムを必要とする AI のユースケースがますます増えています。」
インメモリ データベースとインメモリ データ グリッドも、リアルタイム ルネッサンスの恩恵を受ける準備ができています。 Kafka のようなイベントベースのシステムを強化する高速分析データベースである RocksDB には、Speedb と呼ばれる代替データベースが登場しました。 SingleStore は、OLTP 機能と OLAP 機能を単一のリレーショナル フレームワークに組み合わせたもので、先月の資金調達ラウンドで評価額が 13 億ドルに達しました。
最近、Apache Doris ベースの新しい高速 OLAP データベースの資金調達を受けた StarRocks や、Apache Druid ベースのリアルタイム分析ビジネスを継続するために、Imply が 5 月に 1 億ドルのシリーズ D 資金調達を完了した、DataStax もあります。は、Apache Cassandra ツールキットに Apache Pulsar を追加し、リアルタイム アプリケーション開発を進めるために 1 億 1,500 万ドルを調達しました。 Datanami は、リアルタイム データ分析への注力が今後も続くと予想しています。
規制の拡大
GDPR が発効してから 4 年が経過し、ビッグデータ ユーザーに注目が集まり、責任あるデータへの取り組みに必要な要素としてデータ ガバナンスの台頭が加速しています。米国では、データ アクセスを規制する任務は各州に委ねられており、カリフォルニア州が多くの点で GPDR をモデルにした CCPA を主導しています。しかし、さらに多くの州がこれに追随する可能性が高く、米国企業にとってのデータプライバシーの方程式は複雑化することになる。
しかし、GDPR と CCPA は規制の始まりにすぎません。また、企業がユーザーのオンライン行動を追跡することが困難になるサードパーティ Cookie も廃止されようとしています。プラットフォーム上でのサードパーティ Cookie の終了を 2023 年 1 月 1 日まで延期するという Google の決定により、マーケティング担当者は適応するための時間的余裕が得られますが、Cookie からの情報を複製するのは困難になります。
データ規制に加えて、人工知能の使用に関する新しい規制も目前にあります。 EUは2021年に人工知能法案を提出しており、専門家らは2022年末か2023年初めまでに成立する可能性があると予測している。
データシート形式戦争
古典的なテクノロジー戦争により、データがビッグ データ システムにどのように保存されるか、誰がアクセスできるか、誰が使用できるかを決定する新しいデータシート形式が形成されています。それと。
ここ数か月で、Apache Iceberg がデータ テーブル形式の新しい標準となる可能性があるとして勢いを増しています。クラウドデータウェアハウス大手のスノーフレークとAWSは今年初め、トランザクションなどのデータ管理を提供し、ネットフリックスとアップルから出てきたアイスバーグを支援することを表明した。元HadoopディストリビュータのClouderaも6月にIcebergを支援した。
しかし、Databricks の担当者は、Iceberg と同様の機能を提供する Delta Lake 表形式の代替案を提供しています。 Apache Spark の支援者は当初、Delta Lake の表形式を独自の方法で開発していたため、Databricks が顧客を囲い込んでいるとの非難につながりました。しかし、6月のData AI Summitで同社は、フォーマット全体をオープンソース化し、誰でも使用できるようにすると発表した。
この問題に紛れたのは Apache Hudi です。Apache Hudi はビッグ データ リポジトリに常駐し、さまざまなコンピューティング エンジンからアクセスできるため、データの一貫性も提供します。 Apache Hudi の作成者が支援するビジネスである Onehouse は、今年初めに Hudi ベースの Lakehouse プラットフォームを立ち上げました。
ビッグデータ エコシステムは競争を好むため、2022 年の残りの期間を通じてこれらのフォーマットが進化し、競争するのを見るのは興味深いでしょう。
言語 AI は驚異を続けています
人工知能の最前線は毎月先鋭化しています。今日、AI の先鋒となっているのは大きな言語モデルであり、ますます優れています。実際、大規模な言語モデルは非常に優れているため、6 月には Google のエンジニアが、同社の LaMDA 会話システムに知覚力が備わったと主張しました。
人工知能はまだ知覚力を持っていませんが、それは企業にとって役に立たないという意味ではありません。念のために言っておきますが、Salesforce には CodeGen と呼ばれる大規模言語モデリング (LLM) プロジェクトがあり、ソース コードを理解し、さまざまなプログラミング言語で独自のコードを生成するように設計されています。
先月、Meta (Facebook の親会社) は、200 の言語に翻訳できる大規模な言語モデルを発表しました。また、BigScience Large Open Science Open Access Multilingual Language Model (BLOOM) などのプロジェクトを通じて AI を民主化する取り組みも見てきました。
以上が2022 年下半期のデータおよび人工知能テクノロジーの予測の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

Apple の最新リリースの iOS18、iPadOS18、および macOS Sequoia システムでは、さまざまな理由で紛失または破損した写真やビデオをユーザーが簡単に回復できるように設計された重要な機能が写真アプリケーションに追加されました。この新機能では、写真アプリのツール セクションに「Recovered」というアルバムが導入され、ユーザーがデバイス上に写真ライブラリに含まれていない写真やビデオがある場合に自動的に表示されます。 「Recovered」アルバムの登場により、データベースの破損、カメラ アプリケーションが写真ライブラリに正しく保存されない、または写真ライブラリを管理するサードパーティ アプリケーションによって失われた写真やビデオに対する解決策が提供されます。ユーザーはいくつかの簡単な手順を実行するだけで済みます

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス
