現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- 清華大学が引き継ぎ、YOLOv10 が登場しました。パフォーマンスが大幅に向上し、GitHub のホット リストに掲載されました。
- ターゲット検出システムのベンチマークである YOLO シリーズが再び大幅にアップグレードされました。今年 2 月の YOLOv9 のリリース以来、YOLO (YouOnlyLookOnce) シリーズのバトンは清華大学の研究者の手に渡されました。先週末、YOLOv10 のリリースのニュースが AI コミュニティの注目を集めました。これは、コンピュータ ビジョンの分野における画期的なフレームワークと考えられており、リアルタイムのエンドツーエンドの物体検出機能で知られており、効率と精度を組み合わせた強力なソリューションを提供することで YOLO シリーズの伝統を継承しています。論文アドレス: https://arxiv.org/pdf/2405.14458 プロジェクトアドレス: https://github.com/THU-MIG/yo
- AI 1604 2024-06-06 12:20:45
-
- 光学データセットの利用を改善するために、Tianda チームはスペクトル予測効果を強化する AI モデルを提案しました。
- 編集者 | Dead Leaf Butterfly 最近、天津大学レーザー・オプトエレクトロニクス研究所のウー・リャン准教授とヤオ・ジャンクアン会員のチーム、および自然言語処理研究所のシオン・デイ教授のチームが深層学習モデルを使用したソリューションを報告しました。スペクトル予測効果を高めるためのマルチ周波数補助入力を備えています。この方式では、複数周波数の入力データを使用することでスペクトル予測の精度を向上させることができます。さらに、このソリューションはスペクトル予測プロセスにおけるノイズ干渉も軽減できるため、予測効果が向上します。このソリューションは、トレーニング コストを増やすことなく、既存の光学データ セットの利用を改善し、メタ表面構造に対応するスペクトル応答の予測効果を高めることができます。関連する研究結果は、「ディープを使用した拡張スペクトル予測」というタイトルです。
- AI 737 2024-06-06 12:09:28
-
- 単一の 4090 推論可能、2000 億のスパース大規模モデル「Tiangong MoE」がオープンソース
- 大規模モデルの波の中で、最先端の高密度セット LLM のトレーニングとデプロイは、特に数百億または数千億のパラメーターのスケールにおいて、計算要件と関連コストの点で大きな課題を引き起こします。これらの課題に対処するために、専門家混合 (MoE) モデルなどのスパース モデルがますます重要になっています。これらのモデルは、さまざまな特殊なサブモデル、つまり「エキスパート」に計算を分散することで経済的に実行可能な代替手段を提供し、リソース要件が非常に低い高密度セット モデルのパフォーマンスに匹敵する、またはそれを超える可能性があります。 6 月 3 日、オープンソースの大規模モデル分野からもう 1 つの重要なニュースが届きました。Kunlun Wanwei は、強力なパフォーマンスを維持しながら推論コストを大幅に削減する、オープンソースの 2,000 億のスパース大規模モデル Skywork-MoE を発表しました。以前の Kunlun Wanwei オープンソース Skywo に基づく
- AI 1024 2024-06-05 22:14:46
-
- HuggingFace が SOTA ビジュアル モデルの作り方を教えます
- 以前には OpenAI の GPT-4o があり、その後 Google の一連の先進的なマルチモーダル大型モデルが次々と市場に登場しました。他の実践者たちはショックを受け、これらのスーパーモデルに再び追いつく方法を考え始めました。 HuggingFace とフランスのソルボンヌ大学によるこの論文では、大規模なビジュアル モデルを構築する際の重要な経験を要約し、開発者向けの方法を指摘しています。これらの写真のエクスペリエンスは、モデル アーキテクチャの選択、トレーニング方法、トレーニング データなどの多くの側面をカバーしています。著者は、複数の比較を行った後、次のような重要な点を詳細にまとめています。 大規模なビジュアル モデルで適切な作業を行いたい場合は、アーキテクチャの選択が非常に重要です。言語モデルは、ビジュアル モジュールよりも全体的なパフォーマンスに大きな影響を与えます。段階的な事前トレーニング戦略を採用すると、モデルの機能を構築しやすくなります。トレーニング データには以下を含める必要があります。
- AI 1006 2024-06-05 21:39:58
-
- あなたが知らない機械学習の 5 つの流派
- 機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。
- AI 980 2024-06-05 20:51:22
-
- Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援
- Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。
- AI 1240 2024-06-05 19:59:21
-
- NVIDIA の新しい調査: コンテキストの長さは重大な誤りであり、多くの 32K パフォーマンスが認定されていない
- 「長いコンテキスト」大規模モデルの誤った標準現象を容赦なく暴露 - NVIDIA の新しい調査により、GPT-4 を含む 10 の大規模モデルが 128k、さらには 1M のコンテキスト長を生成することが判明しました。しかし、いくつかのテストの後、新しい指標「有効なコンテキスト」は大幅に縮小しており、32K に到達できる人はほとんどいません。新しいベンチマークは RULER と呼ばれ、検索、マルチホップ追跡、集約、質問と回答の 4 つのカテゴリの合計 13 のタスクが含まれています。 RULER は「有効コンテキスト長」を定義します。これは、モデルが 4K 長さの Llama-7B ベースラインと同じパフォーマンスを維持できる最大長です。この研究は学者らから「非常に洞察力に富む」と評価された。この新しい研究を見た後、多くのネチズンもコンテキスト長キングプレイヤーのクロードとジェミニを見たいと考えました。
- AI 1199 2024-06-05 16:22:47
-
- yolov を iPhone または端末に導入するプロセス全体の実践
- 待望の古典的な検出に、新たな攻撃の波が到来しました - YOLOv5。その中で、YOLOv5 には完全なファイルがありません。現時点で最も重要なことは、ターゲット検出の分野で大きなメリットがあり、特定のシナリオで大幅に改善できる YOLOv4 を理解することです。今日は YOLOv4 を分析します。次号では、Apple 携帯電話への YOLOv5 の導入、または端末のカメラを介したリアルタイムの検出を練習します。 1. テクノロジーのレビュー 畳み込みニューラル ネットワーク (CNN) の精度を向上させると考えられる機能が多数あります。これらの機能の組み合わせは、大規模なデータセットで実際にテストし、結果を理論的に検証する必要があります。特定のモデルでのみ動作する関数、特定のモデルでのみ動作する質問、または小規模な問題のみが動作するものがあります。
- AI 600 2024-06-05 16:17:14
-
- 身体化された知能の三次元認識の新たな連鎖、TeleAIと上海AIラボは多視点融合身体化モデル「SAM-E」を提案
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 機械式時計を手に取ると、正面からは文字盤と針が見え、横からはリューズとブレスレットが見え、時計の裏蓋を開けると、 、複雑な歯車と動きを見ていきます。各パースペクティブは異なる情報を提供し、それらを組み合わせることで操作オブジェクト全体を理解できます。
- AI 608 2024-06-05 16:09:27
-
- 国家データ標準化技術委員会が正式に設立を承認
- 2024年5月24日午後、第7回デジタル中国建設サミットのメインフォーラムが福州で開催された。会議には、党指導グループ書記兼国家データ管理局長の劉烈紅氏、党指導グループ委員で国家市場規制総局副局長の田世紅氏、国家標準局局長などが出席した。会議では、デジタルチャイナ構築の重要性と戦略的計画について徹底的な議論が行われました。参加者は、デジタル変革が国家発展の重要な推進力となっていると認識しました。同時に、彼らは経済、社会、統治におけるデジタル技術の広範な応用を強調した。田世紅氏は「国家データ標準化技術委員会の設立準備に関する通知」を読み上げた。国家データ標準化技術委員会は、データリソース、データテクノロジー、データ流通、スマートシティ、デジタルトランスフォーメーションなどを担当します。
- AI 621 2024-06-05 13:51:45
-
- 強化学習戦略による特徴選択
- 特徴の選択は、機械学習モデルを構築するプロセスにおける重要なステップです。モデルと達成したいタスクに適した特徴を選択すると、パフォーマンスが向上します。高次元のデータセットを扱う場合、特徴の選択が特に重要です。これにより、モデルはより速く、より適切に学習できるようになります。目的は、最適な数の特徴と最も意味のある特徴を見つけることです。この記事では、強化学習戦略による新しい特徴選択を紹介し、実装します。まず、強化学習、特にマルコフ決定プロセスについて説明します。これはデータ サイエンスの分野における非常に新しい手法であり、特に特徴の選択に適しています。次に、その実装と Python ライブラリ (FSRLearning) のインストールと使用方法を紹介します。最後に、これを説明するために簡単な例を使用します。
- AI 598 2024-06-05 13:00:43
-
- HPE Aruba Networking の将来を見据えた視点: AI を活用したセキュアなコンバージド ネットワークの構築
- デジタル時代において、ネットワークは世界を繋ぐリンクであるだけでなく、ビジネスと社会の進歩を促進する重要な力でもあります。モバイル デバイス、モノのインターネット (IoT)、クラウド サービスの爆発的な成長に伴い、ユーザーのネットワークへの依存度は前例のないレベルに達しています。いつでもどこでも安全かつ効率的なアクセスを提供できるネットワーク環境は、個人と企業の両方にとって必要なものとなっています。ただし、この需要の増加は、特にサイバーセキュリティとネットワーク アーキテクチャの複雑さの点で、独自の一連の課題ももたらします。 Gartner が今年発表した有線および無線介入に関する最新のマジック クアドラントでは、HPE Aruba Networking が自動ネットワーク オーケストレーション、高度なソフトウェア アップグレード テクノロジー、統合人工知能 (AI) 機能におけるソリューションで再び評価されました。
- AI 828 2024-06-05 11:12:47
-
- ECCV 2024 ワークショップ 自動運転のマルチモーダル理解とビデオ生成 難しいシナリオの論文募集とチャレンジが開始されました!
- ワークショップのホームページ: https://coda-dataset.github.io/w-coda2024/ 概要 このワークショップは、現在の最先端の自動運転技術と、包括的で信頼性の高いインテリジェント自動運転エージェントとの間のギャップを探ることを目的としています。近年、大規模なマルチモーダル モデル (GPT-4V など) は、マルチモーダルの認識と理解において前例のない進歩を示しています。 MLLM を使用して自動運転の複雑なシナリオ、特に稀ではあるが重大なハードケース シナリオに対処することは、未解決の課題です。このワークショップは、マルチモーダル大規模モデルの認識と理解、自動運転システムにおける高度な AIGC テクノロジーの応用、およびエンドツーエンドの自動運転における革新的な研究を促進することを目的としています。仕事
- AI 1039 2024-06-04 20:47:35
-
- 基礎ゼロでも畳み込みニューラルネットワークの原理が理解できる!超詳しい!
- 著者と同じようにテクノロジーが好きでAIに強い関心を持っている友人は、畳み込みニューラルネットワークには馴染みがあり、そのような「先進的な」名前に長い間戸惑っていたはずだと思います。著者は今日から畳み込みニューラルネットワークの世界にゼロから入ります〜それをみんなと共有しましょう!畳み込みニューラル ネットワークについて説明する前に、画像がどのように機能するかを見てみましょう。画像の原理 コンピューターでは画像は数値 (0 ~ 255) で表され、各数値は画像内のピクセルの明るさまたは色の情報を表します。その中には次のものがあります: 白黒画像: 各ピクセルは値を 1 つだけ持ち、この値は 0 (黒) から 255 (白) の間で変化します。カラー画像: 各ピクセルには 3 つの値が含まれます。最も一般的なのは、赤、緑、青の RGB (赤-緑-青) モデルです。
- AI 573 2024-06-04 20:19:27
-
- 回折限界を 1.5 倍超え、イメージング条件は 10 分の 1 に低くなります。清華大学と中国科学院は AI 手法を使用して顕微鏡の解像度を向上させています
- 図: ZS-DeconvNet を介した高速感光性生物学的プロセスの長期 SR イメージング。 (出典: 論文) Editor | キャロットスキンの計算による超解像手法は、従来の解析アルゴリズムや深層学習モデルを含めて、光学顕微鏡法を大幅に改善しました。中でも教師ありディープニューラルネットワークは優れた性能を示していますが、生細胞の高度なダイナミクスのため、大量の高品質な学習データが必要であり、そのデータを取得するのは非常に手間がかかり現実的ではありません。最新の研究では、清華大学と中国科学院の研究者が、回折極を超えて顕微鏡画像の解像度を瞬時に向上できるゼロショット デコンボリューション ネットワーク (ZS-DeconvNet) を開発しました。
- AI 697 2024-06-04 19:26:15