目次
Inflection-2.5 と GPT-4
ホームページ テクノロジー周辺機器 AI OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

Mar 08, 2024 pm 03:46 PM
ai モデル

木曜日、アメリカの AI スタートアップ Inflection AI は、新世代の大規模言語モデル Inflection-2.5 を正式にリリースしました。

レポートによると、Inflection-2.5 は、強力な LLM テクノロジーと Inflection 独自の「共感微調整」機能を組み合わせ、高い心の知能指数と高い IQ の特性を統合します。インターネットを通じて事実情報を入手でき、その性能はGPT-4やGeminiなどの主要大型機種に匹敵する。

Inflection-2.5 は、すべての Pi ユーザーが PC、iOS、Android アプリで無料で利用できるようになりました。 Heart of the Machine による簡単なテストの結果、GPT-4 と比較するとまだ一定のギャップがあることがわかりましたが、それでも試してみる価値はあります。興味のあるユーザーは実際に体験してみることができます。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

リンク: https://pi.ai/talk

語形変化に注目する価値があります。 -2.5 は GPT-4 に近いパフォーマンスを実現しますが、トレーニング プロセスでは GPT-4 の計算能力の 40% しか使用しません。

屈折 AI は、新世代の大規模モデルがインテリジェント コーディングや数学などの分野で大きな進歩を遂げたことを指摘しています。これらの進歩は、主要な業界ベンチマークの具体的な改善につながり、Pi がテクノロジーの最前線であり続けることを保証します。さらに、Pi は世界クラスのリアルタイム Web 検索機能も統合しており、ユーザーが高品質のニュース速報や最新情報に確実にアクセスできるようにします。

Inflection-2.5 と GPT-4

Inflection-1 トレーニングで使用される FLOP は、さまざまな形式で GPT-4 の約 4% です。 「IQ 指向」のタスクでは、平均パフォーマンスは GPT-4 レベルの約 72% です。現在、Inflection-2.5 は、トレーニングに GPT-4 の FLOP の 40% のみを使用しているにもかかわらず、GPT-4 の 94% 以上の平均パフォーマンスを達成しています。以下の図に示すように、Inflection-2.5 のパフォーマンスは全面的に大幅な向上を達成しており、STEM ドメインの知識が大幅に向上しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

2 つの異なる STEM 試験 (ハンガリー数学試験と物理学大学院記録試験 (GRE)) における Inflection-2.5 の結果は次のとおりです。 :

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

以下の表に示すように、この調査では、MMLU ベンチマークと GPQA Diamond ベンチマークで Inflection-2.5 も評価しました。 MMLU ベンチマークは、STEM、人文科学、社会科学などの 57 分野をカバーし、LLM の包括的な知識能力を効果的にテストします。一方、GPQA ダイヤモンド ベンチマークは、非常に難しい専門家レベルのベンチマークです。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

BIG-Bench-Hard ベンチマークでは、Inflection-2.5 は Inflection-1 よりも 10% 以上パフォーマンスが向上し、GPT と同等です。 4 比較可能。 BIG-Bench-Hard ベンチマークは、大規模な言語モデルでは解決が難しい問題を主にカバーします。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

この調査は、MT-Bench ベンチマークでも評価されました。しかし、研究チームは、このベンチマークには、推論、数学、コーディング カテゴリのサンプル例の大部分 (約 25%) に、間違った参照ソリューションや前提条件に欠陥があることに気づきました。そこで、研究ではこれらの例を修正し、再度評価実験を行った結果を次の表に示します。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

#GSM8k と MATH の評価ベンチマーク 結果は、Inflection-2.5 が数学およびコーディング機能の点で Inflection-1 に比べて大幅に改善されていることを示しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

コーディングをさらにテストするにはInflection-2.5 能力の評価に向けて、この研究では 2 つのコーディング ベンチマーク、MBPP と HumanEval で評価実験を実施しました。その結果を次の表に示します。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

#

研究チームは、HellaSwag と ARC-C で Inflection-2.5 を評価したほか、常識と科学のベンチマークに基づいてさまざまなモデルを評価しました。以下の結果から判断すると、Inflection-2.5 はこれらのベンチマークで優れたパフォーマンスを達成しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

さらに、上記の評価はすべて、Pi をサポートするモデルを使用して行われました。ただし、ネットワーク取得 (上記のベンチマークはネットワーク取得を使用していません)、数ショット プロンプトの構造、およびその他の運用上の側面により、ユーザー エクスペリエンスが若干異なる可能性があることに注意することも重要です。

一般的に、Inflection-2.5 は Pi の「中心的な」機能と非常に高いセキュリティ基準を維持し、より包括的で有用なモデルになります。

最近、大規模言語モデルをめぐる技術競争は熾烈な段階に入っており、数あるテクノロジー企業の中でも、Mistral AI (Mistral Large##) が注目を集めています。 #)、Anthropic (Claude 3) が際立っており、提案された新技術は GPT-4 および Gemini Ultra に近い機能を実現します。昨日登場した Inflection-2.5 が第一階層に加わるようです。

シリコンバレーのスタースタートアップとして、Inflection AI は長い歴史を持ち、2022 年に設立されました。 Linkedln の共同創設者であるリード・ホフマン氏と、元 DeepMind の主任科学者カレン・シモニアン氏です。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

昨年 6 月、Inflection AI は、Microsoft、Nvidia、Reid Hoffman、Bill Gates、およびその他の企業から 13 億米ドルの資金提供を受けたと発表しました。元Google CEOのエリック・シュミット氏が投資を主導した。現在、Inflection AI は世界で 4 番目に大きな生成 AI スタートアップ企業となっています。

以上がOpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Webページにローカルにインストールされている「Jingnan Mai Round Body」を正しく表示するにはどうすればよいですか? Webページにローカルにインストールされている「Jingnan Mai Round Body」を正しく表示するにはどうすればよいですか? Apr 05, 2025 pm 10:33 PM

最近、Webページにローカルにインストールされたフォントファイルを使用して、インターネットから無料のフォントをダウンロードし、システムに正常にインストールしました。今...

H5ページの生産には継続的なメンテナンスが必要ですか? H5ページの生産には継続的なメンテナンスが必要ですか? Apr 05, 2025 pm 11:27 PM

H5ページは、コードの脆弱性、ブラウザー互換性、パフォーマンスの最適化、セキュリティの更新、ユーザーエクスペリエンスの改善などの要因のため、継続的に維持する必要があります。効果的なメンテナンス方法には、完全なテストシステムの確立、バージョン制御ツールの使用、定期的にページのパフォーマンスの監視、ユーザーフィードバックの収集、メンテナンス計画の策定が含まれます。

H5ページの生産用の材料を入手する場所 H5ページの生産用の材料を入手する場所 Apr 05, 2025 pm 11:33 PM

H5ページ資料の主なソースは次のとおりです。1。プロの素材Webサイト(有料、高品質、明確な著作権)。 2。自家製の材料(高いユニーク性、しかし時間がかかる); 3。オープンソースの材料ライブラリ(無料、慎重にスクリーニングする必要があります); 4。写真/ビデオWebサイト(著作権確認が必要です)。さらに、統一された材料スタイル、サイズの適応、圧縮処理、著作権保護は、注意が必要な重要なポイントです。

CSSを介してファーストクラスの名前アイテムを使用して子要素を選択する方法は? CSSを介してファーストクラスの名前アイテムを使用して子要素を選択する方法は? Apr 05, 2025 pm 11:24 PM

要素の数が固定されていない場合、CSSを介して指定されたクラス名の最初の子要素を選択する方法。 HTML構造を処理するとき、あなたはしばしば異なる要素に遭遇します...

ネガティブマージンが場合によっては効果がないのはなぜですか?この問題を解決する方法は? ネガティブマージンが場合によっては効果がないのはなぜですか?この問題を解決する方法は? Apr 05, 2025 pm 10:18 PM

なぜマイナスマージンが場合によっては有効にならないのですか?プログラミング中、CSSの負のマージン(負...

H5ページの生産に適したアプリケーションシナリオ H5ページの生産に適したアプリケーションシナリオ Apr 05, 2025 pm 11:36 PM

H5(HTML5)は、マーケティングキャンペーンページ、製品ディスプレイページ、企業プロモーションマイクロウェブサイトなどの軽量アプリケーションに適しています。その利点は、クロスプラットフォームと豊富な対話性にありますが、その制限は複雑な相互作用とアニメーション、ローカルリソースアクセス、オフライン機能にあります。

CSSのShape-Outside属性を使用して、テキストを徐々に短縮するディスプレイ効果を実現する方法は? CSSのShape-Outside属性を使用して、テキストを徐々に短縮するディスプレイ効果を実現する方法は? Apr 05, 2025 pm 10:54 PM

Webデザインでテキストを徐々に短縮するディスプレイ効果を実装する、テキストの長さを徐々に短縮するために特別なテキスト表示効果を実現する方法は?この効果...

PSが開始されたときにロードの問題を解決する方法は? PSが開始されたときにロードの問題を解決する方法は? Apr 06, 2025 pm 06:36 PM

ブートがさまざまな理由によって引き起こされる可能性がある場合、「読み込み」に巻き込まれたPS:腐敗したプラグインまたは競合するプラグインを無効にします。破損した構成ファイルの削除または名前変更。不十分なプログラムを閉じたり、メモリをアップグレードしたりして、メモリが不十分であることを避けます。ソリッドステートドライブにアップグレードして、ハードドライブの読み取りをスピードアップします。 PSを再インストールして、破損したシステムファイルまたはインストールパッケージの問題を修復します。エラーログ分析の起動プロセス中にエラー情報を表示します。

See all articles