圧倒的な大型モデルの出現を経て、コンピュータサイエンスはついに「自然科学」となった
現在の人工知能(AI)は素晴らしい時代になっていて、驚くべき暗黙知が頻繁に登場しています(ポランニーの復讐と人工知能の新たなロマンと暗黙知) 知識、https:// bit.ly/3qYrAOY)、しかし、将来的にはコンピューターがこのタスクを長期間にわたって完了できないことは確かです。最近発表された興味深い研究は、大規模なネットワーク規模のマルチモーダル コーパスとトレーニング用の数十億のパラメータに基づく、Transformer アーキテクチャに基づく大規模な学習システムに関するものです。典型的な例としては、任意のテキスト プロンプトに応答する大規模な言語モデル、GPT3 および PALM、テキストを画像に変換する言語/画像モデル DALL-E および Imagen (GATO のような一般的な動作を持つモデルも) があります。
大規模学習モデルの出現により、人工知能研究の性質が根本的に変わりました。最近、研究者らが DALL-E を使用したとき、DALL-E は独自の言語を開発したようであり、人間がそれを使いこなすことができれば、DALL-E とより適切に対話できるようになるかもしれないと考えました。一部の研究者は、プロンプトに特定の魔法の呪文 (「段階的に考えてみましょう」など) を追加することで、推論問題における GPT3 のパフォーマンスを向上できることを発見しました。現在、GPT3 や DALL-E のような大規模な学習モデルは「外来種」のようなものであり、その動作を解読する必要があります。
これは間違いなく、人工知能にとって奇妙な転換点です。人工知能はその出現以来、工学 (特定の機能を持つシステム) と科学 (自然現象の法則の発見) の間の「無人地帯」でした。 AI の科学的部分は、人間の知性の性質についての洞察である当初の主張に由来していますが、工学的部分は、人間の知性についての洞察ではなく、インテリジェントな機能 (コンピューターが知的な動作を示すことを可能にする) に焦点を当てたことに由来しています。
現在の状況は急速に変化しており、特に人工知能が大規模学習モデルの代名詞になりつつあります。現状では、トレーニングされたモデルが特定の機能をどのように持つか、あるいはモデルが持つ可能性のある他の機能 (PALM のいわゆる「ジョークを説明する」機能など) についても、誰も何も知りません。多くの場合、その作成者でさえ、これらのシステムで何ができるのかわかりません。これらのシステムを調査してその「機能」範囲を理解することが、人工知能研究の最近のトレンドになっています。
人工知能の一部がエンジニアリングのルーツから逸脱していることがますます明らかになってきています。今日では、大規模な学習システムを、従来の意味での特定の目標を持ったエンジニアリング設計として考えることは困難です。結局のところ、自分の子供が「デザインされている」とは言えません。工学分野では通常、設計したシステムの予期せぬ新特性を祝うことはありません(土木技術者がカテゴリー 5 のハリケーンに耐えるように設計した橋が浮遊することが判明したときに興奮して祝わないのと同じです)。
これらの大規模で訓練された (ただし設計されていない) システムの研究が自然科学になる運命にあるという証拠が増えています: システムの機能の観察、アブレーション研究の実施、ベスト プラクティスの定性分析の実施。
現在、中身ではなく外観が研究されているという事実を考慮すると、これは、実際の証拠なしに「解明」しようとする生物学における野心的な目標に似ています。機械学習は、システムがそのように設計されたことを証明することよりも、システムがその動作を行う理由(大規模な学習システムの「MRI」研究を行うことを考えてください)に焦点を当てた研究活動です。これらの研究から得られた知識は、(医学と同様に) システムを微調整する能力を向上させることができます。もちろん、表面設定の研究により、内部設定よりもターゲットを絞った介入が可能になります。
人工知能がほぼすべてのコンピューティング分野に大きな影響を与えることを考えると、人工知能は自然科学となり、コンピューターサイエンス全体にも影響を与えるでしょう。コンピューターサイエンスの「サイエンス」という言葉も疑問視され、嘲笑されてきました。しかし、人工知能が大規模な人工学習システムを研究する自然科学になったため、それは変わりました。もちろん、コンピュータ サイエンスは長い間「構築による修正」の聖杯であったため、この移行には多くの抵抗や意見があるかもしれません。コンピュータ サイエンスは最初から、インセンティブに満ちたシステムの中で生きているのと同等でした。それは人間と同じように、よく訓練された犬のように正しいです。
2003 年に遡り、チューリング賞受賞者のレスリー ランポートは、コンピューティングの未来が論理ではなく生物学になる可能性について警鐘を鳴らし、コンピューター サイエンスによって私たちはホメオパシーと信仰治癒の世界に住めるようになるだろうと述べました。当時、彼の不安は主に、今日のより神秘的な大規模学習モデルではなく、人間によってプログラムされた複雑なソフトウェア システムについてでした。
意図的な設計と「構築による正確さ」に主に関係する分野から、既存の (設計されていない) 成果物を探索または理解しようとする分野に移行する場合、それがもたらす方法論の変化については、検討する価値があります。生物学における野生生物の研究とは異なり、人工知能は人間が作った「デザインセンス」のない人工物を研究するものであり、理解されていない人工物を作成・導入する場合には倫理的な問題が必ず生じます。大規模な学習モデルは、精度、透明性、公平性のいずれに関しても、証明可能な機能をサポートすることが保証される可能性は高くありませんが、これらはこれらのシステムを展開および実践する上で重要な問題です。人間もまた、自分自身の決定や行動の正しさに関する証拠を提供することはできませんが、人間を罰金、戒告、さらには懲役などの刑罰にさらすための法制度は存在します。大規模な学習システムの場合、同等のシステムは何ですか?
計算研究の美学も変化するでしょう。現在の研究者は、論文に定理や定義が含まれる割合によって論文を評価できます。しかし、コンピュータ サイエンスの目標が生物学などの自然科学の目標にますます似てくるにつれて、新しい計算上の美的方法論を開発する必要があります (ゼロ定理はゼロ定義比とそれほど変わらないため)。計算複雑さの分析が AI 研究において後回しになっている兆候があります。
以上が圧倒的な大型モデルの出現を経て、コンピュータサイエンスはついに「自然科学」となったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス
