現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- Karpathy の新しいチュートリアルが急速に広まり、ネチズンは彼に H100 を与えようと殺到します: GPT-2 トレーニングをゼロから再作成する
- マスター Karpathy は、C 言語を使用して Llama を作成することにもう満足していません。彼が自分自身に課した最新の課題は、GPT-2 の基本バージョンから始まる OpenAI の古典的な結果を再現することです。チャレンジの成功自体は予想外ではありませんが、トレーニングを完了するのにかかる費用はわずか 20 ドルと 90 分で、損失と評価はオリジナル バージョンを上回りました。持っている!ポイント!合格!ポイント!わかった! 。それだけでなく、彼は複製プロセスに関する完全なチュートリアルを書き、案の定、それは再び人気を集めました。 Karpathy は A100 クラウド サービスをレンタルしたため、1 億 2400 万バージョンのトレーニングには 20 米ドルかかりました。しかし、ある人がチュートリアルに従って H100 を使用したところ、トレーニング時間が短縮されただけでなく、費用も節約されました。43 分で完了し、費用はわずか 14 ドルでした。さらに、カルパシーも自腹で2を支払いました
- AI 615 2024-06-07 10:29:25
-
- GenAI および LLM の技術面接に関する 7 つのクールな質問
- AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。
- AI 946 2024-06-07 10:06:29
-
- OpenHarmony で大規模な言語モデルをローカルにデプロイする
- この記事は、第 2 回 OpenHarmony テクノロジー カンファレンスで実証された「OpenHarmony での大規模言語モデルのローカル デプロイメント」の結果をオープンソース化します。オープンソースのアドレス: https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty。 /InferLLM/docs/hap_integrate.md。実装のアイデアと手順は、軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmony 標準システムに移植し、OpenHarmony 上で実行できるバイナリ製品をコンパイルすることです。 InferLLM はシンプルで効率的な L
- AI 1227 2024-06-07 10:02:23
-
- イノベーションに焦点を当て、インテルが新しい Xeon® ブランド戦略を開始
- ブランドは企業の使命と発展の象徴であり、製品の特性と市場での認知度も伴います。本日、インテル GTC テクノロジー・エクスペリエンス・センターでのインテル® Xeon® 6 エネルギー効率の高いコア・プロセッサーの発表会で、インテル コーポレーションのグローバル副社長兼最高マーケティング責任者のブレット・ハンナス氏が、新しいインテル® Xeon® ブランドの立ち上げを発表しました。 。ブレット・ハンナス氏は、新しいインテル® Xeon® ブランド戦略はイノベーションに焦点を当て、より簡潔なネーミングと深い意味を持つ製品ブランド属性を与え、市場での Xeon ブランドの認知度を高めると述べました。革新的なテクノロジーを統合することで、当社は高性能、高効率、高品質、高安全機能を備えた新しいエクスペリエンスを業界パートナーとユーザーに創出します。 1998 年の導入以来、インテル® Xeon® ブランドは
- AI 1059 2024-06-07 09:29:48
-
- 高光沢反射ターミネーター? Google NeRF-Casting: レイ トレーシングならそれができます!
- NeRF は、鏡面反射に近いものを「恐れる」ことはなくなりました。初期の NeRF バリアントでは、3D 座標から体積密度および視点依存の色へのマッピングに多層パーセプトロン (MLP) が使用されていましたが、詳細な 3D ジオメトリと色の表現には大規模な MLP のトレーニングが必要でした。非常に遅い。最近の研究は、大規模な MLP をボクセル グリッドのようなデータ構造、またはグリッドと小規模な MLP の組み合わせに置き換えることによって、NeRF をより効率的にすることに焦点を当てています。詳細な大規模シーンを表現できるように拡張可能ですが、その利点は 3 次元ジオメトリと主に拡散カラーに限定されます。視点に依存した現実の外観をモデル化する NeRF の機能を拡張することは、依然として課題です。光沢のあるオブジェクトのビュー合成のための現在の高度なモデルには、2 つの側面で制限があります。合成できるのは遠くの環境光のみです。
- AI 1310 2024-06-07 09:27:53
-
- LLM | 元 2.0-M32: アテンション ルーティングを備えたエキスパート混合モデル
- 写真 1. 結論は上に書かれています。Yuan+2.0-M32 は、Yuan-2.0+2B と同様のインフラストラクチャで、32 人の専門家を含むエキスパート ハイブリッド アーキテクチャを使用しています。これらの専門家のうち 2 名が活動中です。 32 人のエキスパートを含むエキスパート ハイブリッド アーキテクチャが提案され、採用され、従来のルーティング ネットワークを使用したモデルと比較して精度が 3.8% 向上しました。 Yuan+2.0-M32 は、2000B トークンを使用して最初からトレーニングされ、そのトレーニング消費量は、同じパラメーター サイズの高密度アンサンブル モデルのわずか 9.25% です。専門家をより適切に選択するために、迅速に感知する機能を備えたアテンション ルーターが導入され、専門家のより適切な選択が可能になります。元2.0-
- AI 706 2024-06-07 09:06:30
-
- 80 のモデルからスケーリング則を構築: 中国人博士課程学生による新作。思考の連鎖の著者が強く推奨
- AI の分野では、スケーリング則 (Scalinglaws) は、LM スケーリングの傾向を理解するための強力なツールです。この則は、言語モデルのパフォーマンスがスケールに応じてどのように変化するかを理解するための重要なガイドとなります。しかし、残念なことに、ほとんどの研究者にはスケーリング則をゼロから構築するための計算リソースがなく、オープン モデルのトレーニングが信頼できるスケーリング予測を行うには少なすぎるため、多くのベンチマークやトレーニング後の研究ではスケーリング分析は一般的ではありません。スタンフォード大学、トロント大学などの研究者らは、言語モデル(LM)の機能とクロスマルチモデルを組み合わせた代替観察法「観察尺度法則(Observational Scaling Laws)」を提案した。
- AI 667 2024-06-06 20:40:36
-
- 生成 AI 時代におけるクラウドの「構築」エクスペリエンスの再構築
- 生成 AI の時代において、クラウド コンピューティング業界の変化は全面的に加速しています。開発者として、どのようにすれば技術革新に容易に適応できるでしょうか。新しいテクノロジーの機会を素早く捉え、迅速に事業を開始して成長させるにはどうすればよいでしょうか?開発者必見の 2024 Amazon Cloud Technology China Summit に参加して、質問に答えて特典を獲得しましょう! Amazon クラウドテクノロジーは、クラウド上の生成 AI 時代の開発、運用、メンテナンス、最適化のワンスタック構築エクスペリエンスを再構築しています。このサミットでは、没入型のスター製品エクスペリエンスを含む、開発者の新しい生成 AI 探索の旅をお届けします。 、実践的な特別トレーニングとピークチャレンジ、スキル認定と無料学習、テクノロジーの将来を見据えた共有、グローバルコミュニティリーダーとの対話、開発者のクリエイティブマーケットなど、開発者が無制限に楽しむのに役立ちます
- AI 908 2024-06-06 18:48:01
-
- 人間の好みが支配者です! SPPO アライメント技術により、大規模な言語モデル同士の競合や、それ自体との競合が可能になります。
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com リチャード・サットンは「TheBitterLesson」で次のように評価しました。が最も効果的であり、利点がある
- AI 689 2024-06-06 18:32:31
-
- 物理的な熱伝達にヒントを得た視覚表現モデル vHeat が登場しました。これは、注意メカニズムの突破を試みており、低複雑性とグローバルな受容野を備えています。
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。投稿メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この記事の著者は VMamba のオリジナルメンバーであり、その中で筆頭著者の Wang Zhaozhi は中国科学院大学と共同で訓練を受けた 2022 年の博士課程の学生です。 Pengcheng Laboratory、および共著者の Liu Yuesi は、2021 年に中国科学院大学から直接博士号取得候補者です。彼らの主な研究方向は視覚的なものです
- AI 700 2024-06-06 17:28:46
-
- DenserRadar: 高密度 LiDAR 点群に基づく 4D ミリ波レーダー点群検出器
- 原題: DenserRadar: A4Dmillimeter-waveradarpointclouddetectorbasedondenseLiDARpointclouds 論文リンク: https://arxiv.org/pdf/2405.05131 著者の所属: 清華大学 論文のアイデア: 4D ミリ波 (mmWave) レーダーは、極限環境での堅牢性と広い検出範囲で知られており、速度と高度を測定する機能は、自動運転システムが困難な状況に直面した場合の認識を向上させる大きな可能性を示しています。ただし、4D ミリ波レーダー点群には固有のスパース性とノイズの制限があります。
- AI 885 2024-06-06 14:10:54
-
- 先代「すかいらーく」比19%アップのお手玉大型モデルの評価結果が判明
- 最近、ボルケーノ エンジン パワー カンファレンスでラージ ビーン バッグ モデルが正式にリリースされました。大型モデルの超低価格化が進む中、Doubaoのモデル性能も業界の注目を集めています。 Volcano Engine の製品情報の中で、Doubao モデル チームは第 1 段階の内部テスト結果の一部を公開しました。MMLU、BBH、GSM8K、HumanEval などの 11 の主流業界の公開評価セットで、 Doubao-pro-4k 76.8ポイントを獲得し、前世代モデル「Skylark 2」の64.5ポイントと比べて19%増加した。これは、同時期にテストした他の国内モデルよりも優れています。この評価は今年 5 月に完了し、主に Universal Model Pro、Skylark2、
- AI 428 2024-06-06 13:45:41
-
- Yann LeCun: ViT は遅くて非効率です。リアルタイム画像処理は依然として畳み込みに依存しています。
- トランスフォーマー統一の時代においても、CNNのコンピュータビジョンの方向性を研究する必要はあるのでしょうか?今年の初め、OpenAI の大規模ビデオ モデル Sora により、VisionTransformer (ViT) アーキテクチャが人気を博しました。それ以来、ViT と従来の畳み込みニューラル ネットワーク (CNN) のどちらがより強力であるかについての議論が続いています。最近では、チューリング賞受賞者であり、ソーシャルメディアで活動しているメタ主任科学者のヤン・ルカン氏も、ViTとCNNの間の論争に関する議論に参加した。この事件の原因は、Comma.ai の CTO である Harald Schäfer が最新の研究をデモンストレーションしていたことでした。彼は(最近の多くのAI学者と同様に)ヤン・ルカンの表現をヒントにしているが、
- AI 1149 2024-06-06 13:25:02
-
- サノフィは OpenAI および Formation Bio と提携して AI 創薬を加速します
- 編集者 |この提携は製薬業界にとって大きな変革となるでしょう。データ、人工知能技術、医薬品開発の専門知識を組み合わせることで、新薬の発見と市場投入の方法に革命を起こすことを目指しています。サノフィのポール・ハドソン最高経営責任者(CEO)は「この提携は、AIを活用した製薬会社になるという当社の取り組みにおける重要なステップだ」と述べ、OpenAIの最高執行責任者(COO)ブラッド・ライトキャップ氏は「AIには医薬品開発を加速する大きな可能性がある。
- AI 645 2024-06-06 12:54:35
-
- 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用
- 01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出
- AI 1164 2024-06-06 12:33:01