現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI

  • Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン
    Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン
    最近、Yuncong Technology の大型モデルは、権威ある総合評価プラットフォームである OpenCompass のマルチモーダル評価分野で大きな進歩を遂げました。最新の評価結果によると、このシステムにおけるYuncong TechnologyのCongrong大型モデルの平均スコアは65.5であり、この結果はCongrong大型モデルをGoogleのGemini-1.5-ProとGPT-4vを上回り、世界のトップ3に入れています。 GPT-4o (69.9) および Claude3.5-Sonnet (67.9) で 2 位にランクされています。国内市場でも大型モデルの性能がInternVL-Chat(61.7)、GLM-4V(60.8)を上回り1位となった。 1.OpenCompass マルチモーダル リスト OpenCom
    AI 1053 2024-06-29 00:25:01
  • Bengio チームは、Claude 3.5 と GPT-4o の弱点をターゲットにした、新しいマルチモーダル ベンチマークを提案します
    Bengio チームは、Claude 3.5 と GPT-4o の弱点をターゲットにした、新しいマルチモーダル ベンチマークを提案します
    AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この記事の著者、Zhang Tianyu はカナダのミラ人工知能研究所で学び、チューリング賞受賞者のヨシュア ベンジオ教授に師事しました。博士課程の主な研究は、マルチモダリティ、GFlowNet、マルチエージェント強化学習、AI、気候変動に焦点を当てました。
    AI 852 2024-06-29 00:06:53
  • Byteda Model Team の Depth Anything V2 モデルが Apple の最新 CoreML モデルとして選ばれました
    Byteda Model Team の Depth Anything V2 モデルが Apple の最新 CoreML モデルとして選ばれました
    最近、Apple は 20 の新しい CoreML モデルと 4 つのデータセットを HuggingFace でリリースしましたが、その中には Byte Model Team の単眼深度推定モデル DepthAnythingV2 が選ばれました。 CoreML Apple の機械学習フレームワークは、機械学習モデルを iOS や MacOS などのデバイスに統合して効率的に実行するために使用されます。インターネット接続を必要とせずに複雑な AI タスクを実行し、ユーザーのプライバシーを強化し、遅延を削減します。 Apple 開発者は、これらのモデルを使用して、インテリジェントで安全な AI アプリケーションを構築できます。 DepthAnythingV2 バイトラージモデルチームによって開発された単眼奥行き推定モデル。 V2 バージョンでは、より詳細な処理が行われ、堅牢性が強化され、速度が大幅に向上しました。 25Mから
    AI 528 2024-06-28 22:40:06
  • 画像を自動的にテキストに変換し、画像の説明がより高品質で正確になります。
    画像を自動的にテキストに変換し、画像の説明がより高品質で正確になります。
    AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Pi Renjie: 香港科技大学博士課程 3 年生、Zhang Tong 教授と Zhou Xiaofang 教授に師事。 2024年にApple Scholarshipを受賞。現在の主な研究方向は、マルチモーダル大規模言語モデルとデータ中心の AI です。 Zhang Jianshu:武漢大学学部3年生、
    AI 971 2024-06-28 21:41:35
  • カンブリア紀 1 号の誕生: Xie Saining と Yann LeCun チームが最も強力なオープンソース マルチモーダル LLM をリリース
    カンブリア紀 1 号の誕生: Xie Saining と Yann LeCun チームが最も強力なオープンソース マルチモーダル LLM をリリース
    動物に目があるのと同じように、Yann LeCun チームの Cambrian-1 により、AI は強力な視覚表現学習機能を獲得できるようになります。時代を通じて、多くの哲学者がこの問いを探求してきました。言語の意味の理解は感覚に基づく必要があるのでしょうか?哲学者たちは同意しませんが、1 つ明らかなことは、確実で効果的な感覚のグラウンディングが少なくとも役立つということです。たとえば、科学者は一般に、カンブリア紀の爆発における視覚の出現は、初期の動物の進化における重要なステップであったと信じています。これは、動物が食物を見つけて捕食者を回避するのに役立つだけでなく、動物自体の進化にも役立ちました。実際、人間(そしてほぼすべての動物)のほとんどの知識は、物理的なものと相互作用する感覚経験を通じて獲得されます。
    AI 1304 2024-06-28 21:28:07
  • 国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランク
    国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランク
    国産大型モデルの実力は新たなレベルに到達! 6月27日、iFlytekはiFlytek SparkモデルV4.0と、医療、教育、ビジネスなど多くの分野における人工知能アプリケーションを正式にリリースした。新バージョンのリリースにより、iFlytek Spark V4.0の7つのコア機能が完全にアップグレードされ、8つの国際主流テストセットで第1位にランクされ、総合的にGPT-4Turboを上回り、国内の大型モデルをリードしました。 Liu Qingfeng 氏は、現在、Xinghuo APP のダウンロード数は 1 億 3,100 万件に達し、ユーザーのお気に入りのアプリケーション アシスタントが多数登場していると述べました。 Spark モデルのサポートにより、一部のシナリオにおけるスマート ハードウェアの売上は前年比 70% 以上増加し、月間平均使用量は 4,000 万を超えました。さらに、Xinghuo V4.0大型モデルは、国内初の国産Wankaをベースとしています。
    AI 1135 2024-06-28 20:52:47
  • 史上初のリアルタイムAI動画生成技術:DiTユニバーサル、10.6倍高速
    史上初のリアルタイムAI動画生成技術:DiTユニバーサル、10.6倍高速
    DiT を使用すると、品質を損なうことなく、トレーニングも必要なくビデオを生成できます。リアルタイム AI ビデオ生成が登場!水曜日、シンガポール国立大学のYou Yangチームは、リアルタイムで出力できる業界初のDiTベースのビデオ生成方法を提案した。このテクノロジーは PyramidAttendanceBroadcast (PAB) と呼ばれます。冗長なアテンション計算を削減することで、PAB は、Open-Sora、Open-Sora-Plan、Latte 品質などの一般的な DiT ベースのビデオ生成モデルの利点を犠牲にすることなく、最大 21.6FPS のフレーム レートと 10.6 倍の高速化を実現します。トレーニングを必要としない方法として、PAB は将来の DiT ベースのあらゆる用途に使用できることは注目に値します。
    AI 1437 2024-06-28 19:14:46
  • 清華航空などは、アミノ酸から原子スケールまでの初のタンパク質言語モデルである ESM-AA を提案しました
    清華航空などは、アミノ酸から原子スケールまでの初のタンパク質言語モデルである ESM-AA を提案しました
    清華大学AIR、北京大学、南京大学の研究チームはESM-AAモデルを提案した。このモデルはタンパク質言語モデリングの分野で重要な進歩を遂げ、マルチスケール情報を統合する統合モデリング ソリューションを提供します。これは、アミノ酸情報と原子情報の両方を処理できる初めてのタンパク質の事前トレーニング済み言語モデルです。モデルの優れたパフォーマンスは、既存の制限を克服し、新しい機能を解放するマルチスケール統合モデリングの大きな可能性を示しています。基本モデルとして、ESM-AA は多くの学者から注目され、広範な議論を受けています (以下のスクリーンショットを参照)。ESM-AA に基づいて、AlphaFold3 や RoseTTAFoldAll-Atom と競合できるモデルを開発して、さまざまな研究を行う可能性があると考えられています。生物間の相。
    AI 1323 2024-06-28 18:10:06
  • 鄭州大学チームが効率的かつ正確に薬物標的相互作用を特定する新しい AI ツールを開発
    鄭州大学チームが効率的かつ正確に薬物標的相互作用を特定する新しい AI ツールを開発
    Editor | Dry Leaf Butterfly 薬物標的相互作用 (DTI) の正確な同定は、創薬および薬物再配置プロセスにおける重要なステップの 1 つです。現在、DTI を予測するために多くの計算ベースのモデルが提案されており、いくつかの重要な進歩が達成されています。しかし、これらの手法は、薬物とターゲットに関連する複数の視点からの類似性ネットワークを適切な方法で融合する方法に焦点を当てていることはほとんどありません。さらに、既知の相互作用関係を完全に組み込んで薬物と標的を正確に表現する方法は十分に研究されていません。したがって、DTI 予測モデルの精度を向上させることが依然として必要です。最新の研究では、中国の鄭州大学と電子科学技術大学のチームが新しい手法「MIDTI」を提案した。この方法では、マルチビュー類似性ネットワーク融合戦略と深いインタラクティブな注意メカニズムを使用して薬剤を予測します
    AI 1210 2024-06-28 02:31:25
  • 5 つの主要な科学分野向けに特別にカスタマイズされた、NASA と IBM が協力して大規模な言語モデル INDUS を開発
    5 つの主要な科学分野向けに特別にカスタマイズされた、NASA と IBM が協力して大規模な言語モデル INDUS を開発
    南の星座にちなんで名付けられた INDUS は、5 つの科学分野をサポートする大規模な言語モデルの包括的なセットです。 (出典: NASA) Editor | KX の大規模言語モデル (LLM) は、大量のデータでトレーニングされ、自然言語の理解と生成のタスクで優れたパフォーマンスを発揮します。最も一般的な LLM は、Wikipedia などの一般的なコーパスを使用してトレーニングされますが、語彙の分布が変化すると、特定のドメインでのパフォーマンスが低下します。これに触発されて、NASA は IBM と協力して、地球科学、生物学、物理学、太陽物理学、惑星科学、天体物理学の分野に合わせて調整された包括的な LLM セットである INDUS を開発しました。また、さまざまなデータ ソースの厳選された科学コーパスからのデータを使用しています。トレーニングに使用されます。 INDUSにはエンコーダとセンテンスの2種類のモデルが含まれています
    AI 928 2024-06-27 20:28:32
  • OpenAIが突然中国への供給を停止! SenseTime、費用ゼロの「引越しサービス」を開始、豪華ギフトパッケージも付属
    OpenAIが突然中国への供給を停止! SenseTime、費用ゼロの「引越しサービス」を開始、豪華ギフトパッケージも付属
    SenseTime Technologyは6月25日、大容量モデル向けの0元購入プランの開始を発表した。今後、SenseTimeの「SenseNova」の企業ユーザーに新規登録すると、通話、移行、トレーニングなどのサービスパッケージが無料で受けられるようになる。 、0元GO! 「RiRiXin SenseNova」プラットフォームは、相談言語モデル、相談グラフィックおよびテキストのマルチモーダル モデル、苗花テキストベースの画像モデル、音声モデル、ベクトル モデルなどを含む多くのタイプのモデル API インターフェイスをカバーし、さまざまなニーズを満たすことができます。企業ユーザー。 SenseTime は、AI の独自性、技術的安全性、独立した制御性、およびコンピューティング能力が保証された SenseCore などの独自の先進的で低コストの大規模な新世代 AI インフラストラクチャを常に主張してきました。上唐江
    AI 576 2024-06-27 00:23:50
  • 5億年にわたる進化の情報をシミュレートし、タンパク質の配列、構造、機能を同時に推測する初めての大規模な生物学的モデルです。
    5億年にわたる進化の情報をシミュレートし、タンパク質の配列、構造、機能を同時に推測する初めての大規模な生物学的モデルです。
    編集者 | **30 億年の**長い**自然進化の中で、**既存**タンパク質の**形**が形成され、長い自然選択プロセスを経ました。進化は、ランダムな突然変異と選択メカニズムを通じて、タンパク質の配列、構造、機能に従って選別する、地質学的時間スケールで行われる並行実験のようなものです。 、ここでEevolutionaryScaleの研究者らは、進化によって生成されたマーカーで訓練された言語モデルが、既知のタンパク質配列とは異なる機能的なタンパク質を生成するための進化シミュレーターとして機能できることを示しています。 、研究者らは、タンパク質について推論できる **最先端** マルチモーダル生成言語モデルである **最先端** ESM3 を提案しています
    AI 1092 2024-06-26 20:40:11
  • 私の耳は正しい、音がリアルすぎる、Byte Beanbao音声合成のSeed-TTS技術が明らかに
    私の耳は正しい、音がリアルすぎる、Byte Beanbao音声合成のSeed-TTS技術が明らかに
    Seed-TTS は、ByteDance Doubao 大規模モデル チームによって最近リリースされた大規模音声生成モデルです。生成される音声は実際の人間とほとんど**変わりません**、特に人間の音声を模倣する学習に関しては**忠実度**と**流暢さの両方で、発音**欠陥**さえも生成される可能性があります。 ** **優れたパフォーマンス。たとえば、Seed-TTS に音声を提供すると、そのテキストに基づいて新しい音声が生成され、元の素材の音声特性が得られます。元の素材 (プロンプト): Seed-TTS によって生成された中国語の音声: 突然、私の周りで笑い声が聞こえました。私は彼らを見て、意気揚々と胸を張り、少し肉付きの良い腕を振り、笑いました。「私の体の肉は、私の圧倒的な魅力を隠すためのものです、そうでなければ
    AI 1188 2024-06-26 20:37:12
  • NetEase Fuxi は革新的な成果を携えて WAIC 2024 に登場します。ハイライトを覗いてみましょう!
    NetEase Fuxi は革新的な成果を携えて WAIC 2024 に登場します。ハイライトを覗いてみましょう!
    2024年世界人工知能会議および人工知能グローバルガバナンスに関するハイレベル会議(「WAIC 2024」と呼ばれる)が7月4日に上海で開幕する。中国の人工知能分野のリーダーとして、NetEase Fuxi はそのコア製品である NetEase Yaotai、NetEase Smart、Youling Platform、Danqingyue、Game AI を WAIC 2024 に出展し、この分野での最先端テクノロジーを十分に実証します。人工知能とその応用結果。 1. NetEase Yaotai VR 大空間: 業界デビュー、没入型体験のための新しい空間を再構築 WAIC 2024 の NetEase Fuxi ブースで、NetEase Yaotai は業界初の大規模エンタープライズ VR 空間を展示し、「**無限*」を衝撃的に提示します。エンタープライズVR ※「展示ホールコンセプト」わずか20平方メートルのスペースで、高層展示場の拡張を実現。
    AI 510 2024-06-26 18:42:22
  • Meitu Imaging Research Institute (MT Lab) が国際人工知能カンファレンスのトップ 3 賞を受賞
    Meitu Imaging Research Institute (MT Lab) が国際人工知能カンファレンスのトップ 3 賞を受賞
    5月30日、人工知能のトップ国際カンファレンスであるCVPR2024が開催した第3回Pixel-level Video Understanding in the Wild、PVUW(以下、PVUW)で、Meitu Imaging Research Institute(MTLab)が再び優勝したと発表した。ビデオ セマンティック セグメンテーション (VSS) および複雑なシーン ビデオ オブジェクト セグメンテーション (MOSE) トラックで 2 位、ビデオ パノラマ セグメンテーション チャレンジ (VPS) トラックで 3 位を獲得しました。これも Meitu Imaging Research Institute の 3 回目の受賞です。 (MTLab) は CVPR カンファレンスで賞を受賞し、金 1 個、銀 3 個、銅 3 個の優れた成績を収めました。コンピュータビジョン分野における世界最高峰のイベントとして、
    AI 886 2024-06-26 17:13:20

ツールの推奨事項

jQuery エンタープライズ メッセージ フォームの連絡先コード

jQuery エンタープライズ メッセージ フォーム連絡先コードは、シンプルで実用的なエンタープライズ メッセージ フォームおよび連絡先紹介ページ コードです。

HTML5 MP3 オルゴール再生効果

HTML5 MP3 オルゴール再生特殊効果は、HTML5 + css3 に基づく MP3 音楽プレーヤーで、かわいいオルゴールの絵文字を作成し、スイッチ ボタンをクリックします。

HTML5 クールなパーティクル アニメーション ナビゲーション メニューの特殊効果

HTML5 クールなパーティクル アニメーションのナビゲーション メニュー特殊効果は、ナビゲーション メニューにマウスを置くと色が変化する特殊効果です。

jQuery ビジュアル フォームのドラッグ アンド ドロップ編集コード

jQuery ビジュアル フォームのドラッグ アンド ドロップ編集コードは、jQuery およびブートストラップ フレームワークに基づいたビジュアル フォームです。

有機果物と野菜のサプライヤー Web テンプレート Bootstrap5

有機果物と野菜のサプライヤー Web テンプレート-Bootstrap5

Bootstrap3 多機能データ情報バックグラウンド管理レスポンシブ Web ページ テンプレート-Novus

Bootstrap3 多機能データ情報バックグラウンド管理レスポンシブ Web ページ テンプレート-Novus

不動産リソース サービス プラットフォーム Web ページ テンプレート Bootstrap5

不動産リソース サービス プラットフォーム Web ページ テンプレート Bootstrap5

シンプルな履歴書情報 Web テンプレート Bootstrap4

シンプルな履歴書情報 Web テンプレート Bootstrap4

かわいい夏の要素のベクター素材 (EPS+PNG)

これは、太陽、日よけ帽子、ココナッツの木、ビキニ、飛行機、スイカ、アイスクリーム、アイスクリーム、冷たい飲み物、浮き輪、ビーチサンダル、パイナップル、巻貝、貝殻、ヒトデ、カニを含む、かわいい夏の要素のベクター素材です。 、レモン、日焼け止め、サングラスなど、素材は JPG プレビューを含む EPS および PNG 形式で提供されています。
PNG素材
2024-05-09

4 つの赤い 2023 卒業バッジ ベクター素材 (AI+EPS+PNG)

これは、2023 年卒業バッジの赤いベクター素材で、合計 4 つがあり、JPG プレビューを含む AI、EPS、PNG 形式で利用できます。
PNG素材
2024-02-29

歌う鳥と花がいっぱいのカートデザイン春のバナーベクター素材(AI+EPS)

これは、さえずる鳥と​​花でいっぱいのカートをデザインした春のバナー ベクター素材で、JPG プレビューを含む AI および EPS 形式で利用できます。
バナー画像
2024-02-29

金色の卒業帽ベクター素材(EPS+PNG)

これは、JPG プレビューを含む EPS および PNG 形式で利用できる、金色の卒業帽のベクター素材です。
PNG素材
2024-02-27

室内装飾クリーニングおよび修理サービス会社のウェブサイトのテンプレート

家の装飾のクリーニングとメンテナンス サービス会社の Web サイト テンプレートは、家の装飾、クリーニング、メンテナンス、その他のサービス組織を提供するプロモーション Web サイトに適した Web サイト テンプレートのダウンロードです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

フレッシュカラーの個人履歴書ガイドページテンプレート

フレッシュカラーマッチング個人求人応募履歴書ガイドページテンプレートは、フレッシュカラーマッチングスタイルに適した個人求人検索履歴書仕事表示ガイドページWebテンプレートのダウンロードです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

デザイナーのクリエイティブな仕事の履歴書 Web テンプレート

デザイナー クリエイティブ ジョブ履歴書 Web テンプレートは、さまざまなデザイナーのポジションに適した個人の職務履歴書表示用のダウンロード可能な Web テンプレートです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

現代のエンジニアリング建設会社のウェブサイトのテンプレート

最新のエンジニアリングおよび建設会社の Web サイト テンプレートは、エンジニアリングおよび建設サービス業界の宣伝に適したダウンロード可能な Web サイト テンプレートです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。