現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン
- 最近、Yuncong Technology の大型モデルは、権威ある総合評価プラットフォームである OpenCompass のマルチモーダル評価分野で大きな進歩を遂げました。最新の評価結果によると、このシステムにおけるYuncong TechnologyのCongrong大型モデルの平均スコアは65.5であり、この結果はCongrong大型モデルをGoogleのGemini-1.5-ProとGPT-4vを上回り、世界のトップ3に入れています。 GPT-4o (69.9) および Claude3.5-Sonnet (67.9) で 2 位にランクされています。国内市場でも大型モデルの性能がInternVL-Chat(61.7)、GLM-4V(60.8)を上回り1位となった。 1.OpenCompass マルチモーダル リスト OpenCom
- AI 1053 2024-06-29 00:25:01
-
- Bengio チームは、Claude 3.5 と GPT-4o の弱点をターゲットにした、新しいマルチモーダル ベンチマークを提案します
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この記事の著者、Zhang Tianyu はカナダのミラ人工知能研究所で学び、チューリング賞受賞者のヨシュア ベンジオ教授に師事しました。博士課程の主な研究は、マルチモダリティ、GFlowNet、マルチエージェント強化学習、AI、気候変動に焦点を当てました。
- AI 852 2024-06-29 00:06:53
-
- Byteda Model Team の Depth Anything V2 モデルが Apple の最新 CoreML モデルとして選ばれました
- 最近、Apple は 20 の新しい CoreML モデルと 4 つのデータセットを HuggingFace でリリースしましたが、その中には Byte Model Team の単眼深度推定モデル DepthAnythingV2 が選ばれました。 CoreML Apple の機械学習フレームワークは、機械学習モデルを iOS や MacOS などのデバイスに統合して効率的に実行するために使用されます。インターネット接続を必要とせずに複雑な AI タスクを実行し、ユーザーのプライバシーを強化し、遅延を削減します。 Apple 開発者は、これらのモデルを使用して、インテリジェントで安全な AI アプリケーションを構築できます。 DepthAnythingV2 バイトラージモデルチームによって開発された単眼奥行き推定モデル。 V2 バージョンでは、より詳細な処理が行われ、堅牢性が強化され、速度が大幅に向上しました。 25Mから
- AI 528 2024-06-28 22:40:06
-
- 画像を自動的にテキストに変換し、画像の説明がより高品質で正確になります。
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Pi Renjie: 香港科技大学博士課程 3 年生、Zhang Tong 教授と Zhou Xiaofang 教授に師事。 2024年にApple Scholarshipを受賞。現在の主な研究方向は、マルチモーダル大規模言語モデルとデータ中心の AI です。 Zhang Jianshu:武漢大学学部3年生、
- AI 971 2024-06-28 21:41:35
-
- カンブリア紀 1 号の誕生: Xie Saining と Yann LeCun チームが最も強力なオープンソース マルチモーダル LLM をリリース
- 動物に目があるのと同じように、Yann LeCun チームの Cambrian-1 により、AI は強力な視覚表現学習機能を獲得できるようになります。時代を通じて、多くの哲学者がこの問いを探求してきました。言語の意味の理解は感覚に基づく必要があるのでしょうか?哲学者たちは同意しませんが、1 つ明らかなことは、確実で効果的な感覚のグラウンディングが少なくとも役立つということです。たとえば、科学者は一般に、カンブリア紀の爆発における視覚の出現は、初期の動物の進化における重要なステップであったと信じています。これは、動物が食物を見つけて捕食者を回避するのに役立つだけでなく、動物自体の進化にも役立ちました。実際、人間(そしてほぼすべての動物)のほとんどの知識は、物理的なものと相互作用する感覚経験を通じて獲得されます。
- AI 1304 2024-06-28 21:28:07
-
- 国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランク
- 国産大型モデルの実力は新たなレベルに到達! 6月27日、iFlytekはiFlytek SparkモデルV4.0と、医療、教育、ビジネスなど多くの分野における人工知能アプリケーションを正式にリリースした。新バージョンのリリースにより、iFlytek Spark V4.0の7つのコア機能が完全にアップグレードされ、8つの国際主流テストセットで第1位にランクされ、総合的にGPT-4Turboを上回り、国内の大型モデルをリードしました。 Liu Qingfeng 氏は、現在、Xinghuo APP のダウンロード数は 1 億 3,100 万件に達し、ユーザーのお気に入りのアプリケーション アシスタントが多数登場していると述べました。 Spark モデルのサポートにより、一部のシナリオにおけるスマート ハードウェアの売上は前年比 70% 以上増加し、月間平均使用量は 4,000 万を超えました。さらに、Xinghuo V4.0大型モデルは、国内初の国産Wankaをベースとしています。
- AI 1135 2024-06-28 20:52:47
-
- 史上初のリアルタイムAI動画生成技術:DiTユニバーサル、10.6倍高速
- DiT を使用すると、品質を損なうことなく、トレーニングも必要なくビデオを生成できます。リアルタイム AI ビデオ生成が登場!水曜日、シンガポール国立大学のYou Yangチームは、リアルタイムで出力できる業界初のDiTベースのビデオ生成方法を提案した。このテクノロジーは PyramidAttendanceBroadcast (PAB) と呼ばれます。冗長なアテンション計算を削減することで、PAB は、Open-Sora、Open-Sora-Plan、Latte 品質などの一般的な DiT ベースのビデオ生成モデルの利点を犠牲にすることなく、最大 21.6FPS のフレーム レートと 10.6 倍の高速化を実現します。トレーニングを必要としない方法として、PAB は将来の DiT ベースのあらゆる用途に使用できることは注目に値します。
- AI 1437 2024-06-28 19:14:46
-
- 清華航空などは、アミノ酸から原子スケールまでの初のタンパク質言語モデルである ESM-AA を提案しました
- 清華大学AIR、北京大学、南京大学の研究チームはESM-AAモデルを提案した。このモデルはタンパク質言語モデリングの分野で重要な進歩を遂げ、マルチスケール情報を統合する統合モデリング ソリューションを提供します。これは、アミノ酸情報と原子情報の両方を処理できる初めてのタンパク質の事前トレーニング済み言語モデルです。モデルの優れたパフォーマンスは、既存の制限を克服し、新しい機能を解放するマルチスケール統合モデリングの大きな可能性を示しています。基本モデルとして、ESM-AA は多くの学者から注目され、広範な議論を受けています (以下のスクリーンショットを参照)。ESM-AA に基づいて、AlphaFold3 や RoseTTAFoldAll-Atom と競合できるモデルを開発して、さまざまな研究を行う可能性があると考えられています。生物間の相。
- AI 1323 2024-06-28 18:10:06
-
- 鄭州大学チームが効率的かつ正確に薬物標的相互作用を特定する新しい AI ツールを開発
- Editor | Dry Leaf Butterfly 薬物標的相互作用 (DTI) の正確な同定は、創薬および薬物再配置プロセスにおける重要なステップの 1 つです。現在、DTI を予測するために多くの計算ベースのモデルが提案されており、いくつかの重要な進歩が達成されています。しかし、これらの手法は、薬物とターゲットに関連する複数の視点からの類似性ネットワークを適切な方法で融合する方法に焦点を当てていることはほとんどありません。さらに、既知の相互作用関係を完全に組み込んで薬物と標的を正確に表現する方法は十分に研究されていません。したがって、DTI 予測モデルの精度を向上させることが依然として必要です。最新の研究では、中国の鄭州大学と電子科学技術大学のチームが新しい手法「MIDTI」を提案した。この方法では、マルチビュー類似性ネットワーク融合戦略と深いインタラクティブな注意メカニズムを使用して薬剤を予測します
- AI 1210 2024-06-28 02:31:25
-
- 5 つの主要な科学分野向けに特別にカスタマイズされた、NASA と IBM が協力して大規模な言語モデル INDUS を開発
- 南の星座にちなんで名付けられた INDUS は、5 つの科学分野をサポートする大規模な言語モデルの包括的なセットです。 (出典: NASA) Editor | KX の大規模言語モデル (LLM) は、大量のデータでトレーニングされ、自然言語の理解と生成のタスクで優れたパフォーマンスを発揮します。最も一般的な LLM は、Wikipedia などの一般的なコーパスを使用してトレーニングされますが、語彙の分布が変化すると、特定のドメインでのパフォーマンスが低下します。これに触発されて、NASA は IBM と協力して、地球科学、生物学、物理学、太陽物理学、惑星科学、天体物理学の分野に合わせて調整された包括的な LLM セットである INDUS を開発しました。また、さまざまなデータ ソースの厳選された科学コーパスからのデータを使用しています。トレーニングに使用されます。 INDUSにはエンコーダとセンテンスの2種類のモデルが含まれています
- AI 928 2024-06-27 20:28:32
-
- OpenAIが突然中国への供給を停止! SenseTime、費用ゼロの「引越しサービス」を開始、豪華ギフトパッケージも付属
- SenseTime Technologyは6月25日、大容量モデル向けの0元購入プランの開始を発表した。今後、SenseTimeの「SenseNova」の企業ユーザーに新規登録すると、通話、移行、トレーニングなどのサービスパッケージが無料で受けられるようになる。 、0元GO! 「RiRiXin SenseNova」プラットフォームは、相談言語モデル、相談グラフィックおよびテキストのマルチモーダル モデル、苗花テキストベースの画像モデル、音声モデル、ベクトル モデルなどを含む多くのタイプのモデル API インターフェイスをカバーし、さまざまなニーズを満たすことができます。企業ユーザー。 SenseTime は、AI の独自性、技術的安全性、独立した制御性、およびコンピューティング能力が保証された SenseCore などの独自の先進的で低コストの大規模な新世代 AI インフラストラクチャを常に主張してきました。上唐江
- AI 576 2024-06-27 00:23:50
-
- 5億年にわたる進化の情報をシミュレートし、タンパク質の配列、構造、機能を同時に推測する初めての大規模な生物学的モデルです。
- 編集者 | **30 億年の**長い**自然進化の中で、**既存**タンパク質の**形**が形成され、長い自然選択プロセスを経ました。進化は、ランダムな突然変異と選択メカニズムを通じて、タンパク質の配列、構造、機能に従って選別する、地質学的時間スケールで行われる並行実験のようなものです。 、ここでEevolutionaryScaleの研究者らは、進化によって生成されたマーカーで訓練された言語モデルが、既知のタンパク質配列とは異なる機能的なタンパク質を生成するための進化シミュレーターとして機能できることを示しています。 、研究者らは、タンパク質について推論できる **最先端** マルチモーダル生成言語モデルである **最先端** ESM3 を提案しています
- AI 1092 2024-06-26 20:40:11
-
- 私の耳は正しい、音がリアルすぎる、Byte Beanbao音声合成のSeed-TTS技術が明らかに
- Seed-TTS は、ByteDance Doubao 大規模モデル チームによって最近リリースされた大規模音声生成モデルです。生成される音声は実際の人間とほとんど**変わりません**、特に人間の音声を模倣する学習に関しては**忠実度**と**流暢さの両方で、発音**欠陥**さえも生成される可能性があります。 ** **優れたパフォーマンス。たとえば、Seed-TTS に音声を提供すると、そのテキストに基づいて新しい音声が生成され、元の素材の音声特性が得られます。元の素材 (プロンプト): Seed-TTS によって生成された中国語の音声: 突然、私の周りで笑い声が聞こえました。私は彼らを見て、意気揚々と胸を張り、少し肉付きの良い腕を振り、笑いました。「私の体の肉は、私の圧倒的な魅力を隠すためのものです、そうでなければ
- AI 1188 2024-06-26 20:37:12
-
- NetEase Fuxi は革新的な成果を携えて WAIC 2024 に登場します。ハイライトを覗いてみましょう!
- 2024年世界人工知能会議および人工知能グローバルガバナンスに関するハイレベル会議(「WAIC 2024」と呼ばれる)が7月4日に上海で開幕する。中国の人工知能分野のリーダーとして、NetEase Fuxi はそのコア製品である NetEase Yaotai、NetEase Smart、Youling Platform、Danqingyue、Game AI を WAIC 2024 に出展し、この分野での最先端テクノロジーを十分に実証します。人工知能とその応用結果。 1. NetEase Yaotai VR 大空間: 業界デビュー、没入型体験のための新しい空間を再構築 WAIC 2024 の NetEase Fuxi ブースで、NetEase Yaotai は業界初の大規模エンタープライズ VR 空間を展示し、「**無限*」を衝撃的に提示します。エンタープライズVR ※「展示ホールコンセプト」わずか20平方メートルのスペースで、高層展示場の拡張を実現。
- AI 510 2024-06-26 18:42:22
-
- Meitu Imaging Research Institute (MT Lab) が国際人工知能カンファレンスのトップ 3 賞を受賞
- 5月30日、人工知能のトップ国際カンファレンスであるCVPR2024が開催した第3回Pixel-level Video Understanding in the Wild、PVUW(以下、PVUW)で、Meitu Imaging Research Institute(MTLab)が再び優勝したと発表した。ビデオ セマンティック セグメンテーション (VSS) および複雑なシーン ビデオ オブジェクト セグメンテーション (MOSE) トラックで 2 位、ビデオ パノラマ セグメンテーション チャレンジ (VPS) トラックで 3 位を獲得しました。これも Meitu Imaging Research Institute の 3 回目の受賞です。 (MTLab) は CVPR カンファレンスで賞を受賞し、金 1 個、銀 3 個、銅 3 個の優れた成績を収めました。コンピュータビジョン分野における世界最高峰のイベントとして、
- AI 886 2024-06-26 17:13:20