現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- LinkedIn が大規模な言語モデルを使用して 10 億人のユーザーにサービスを提供することから学んだこと
- 世界中に 10 億人を超えるユーザーを抱える LinkedIn は、今日のエンタープライズ テクノロジーの限界に挑戦し続けています。 LinkedIn とまったく同じように運営している企業や、同様に膨大なデータ リソースを持っている企業はほとんどありません。ビジネスと雇用に焦点を当てたこのソーシャル メディア プラットフォームは、資格のある候補者と潜在的な雇用主を結びつけ、求人の補充を支援することがその中核事業です。プラットフォーム上の投稿が雇用主と消費者のニーズを反映していることを確認することも重要です。 LinkedIn のモデルでは、これらのマッチング プロセスは常にテクノロジーに依存してきました。 GenAI が最初に勢いを増していた 2023 年の夏までに、LinkedIn は大規模言語モデル (LLM) を活用して候補者と雇用主をマッチングし、情報の流れをより有用にするかどうかを検討し始めました。したがって、
- AI 541 2024-04-26 16:49:11
-
- FisheyeDetNet: 魚眼カメラに基づいた最初のターゲット検出アルゴリズム
- 目標検出は自動運転システムにおいて比較的成熟した問題であり、その中でも歩行者検出は最も初期に導入されたアルゴリズムの 1 つです。ほとんどの論文では非常に包括的な研究が行われています。ただし、サラウンドビューに魚眼カメラを使用した距離認識については、あまり研究されていません。放射状の歪みが大きいため、標準のバウンディング ボックス表現を魚眼カメラに実装するのは困難です。上記の説明を軽減するために、拡張バウンディング ボックス、楕円、および一般的な多角形の設計を極/角度表現に探索し、これらの表現を分析するためのインスタンス セグメンテーション mIOU メトリックを定義します。提案された多角形モデルの FisheyeDetNet は、他のモデルよりも優れたパフォーマンスを示し、同時に自動運転用の Valeo 魚眼カメラ データセットで 49.5% の mAP を達成しました。
- AI 995 2024-04-26 11:37:01
-
- 機械学習と人事管理の衝突について話しましょうか?
- はじめに 近年、機械学習の分野で多くの大きな進歩があり、人工知能技術を活用した人材管理サービス製品も巨大でダイナミックな市場を持っています。ますます多くの企業や政府機関が、機械学習テクノロジーを人事管理に適用し、ニューラル ネットワークを通じて効果的な意思決定を行い、人事管理の結果を正確に予測することを検討しています。この記事では、機械学習を人事管理研究に適用する際の 4 つの側面、主に技術的な困難さ、人事管理の意思決定システムの紹介、システム設計方法、システムのセキュリティを紹介します。読者が関連研究について予備的な理解を得ることができれば幸いです。 。技術的な困難 2019 年に米国の大企業 20 社の CEO が関連セミナーを実施した結果、人事管理における機械学習テクノロジーの応用が示されました。
- AI 676 2024-04-26 10:25:07
-
- Docker が LLama3 オープンソース大規模モデルのローカル展開を 3 分で完了
- 概要 LLaMA-3 (LargeLanguageModelMetaAI3) は、Meta Company が開発した大規模なオープンソースの生成人工知能モデルです。前世代のLLaMA-2と比べてモデル構造に大きな変更はありません。 LLaMA-3 モデルは、さまざまなアプリケーションのニーズやコンピューティング リソースに合わせて、小規模、中規模、大規模などのさまざまな規模のバージョンに分割されています。小型モデルのパラメータ サイズは 8B、中型モデルのパラメータ サイズは 70B、大型モデルのパラメータ サイズは 400B に達します。ただし、トレーニング中の目標は、マルチモーダルおよび複数言語の機能を達成することであり、その結果は GPT4/GPT4V に匹敵することが期待されます。 Ollama をインストールするOllama は、オープンソースの大規模言語モデル (LL) です。
- AI 1556 2024-04-26 10:19:21
-
- 定量化、枝刈り、蒸留、これらの大きなモデルのスラングは正確には何を言っているのでしょうか?
- 数量化、枝刈り、蒸留など、大規模な言語モデルによく注意を払うと、必ずこれらの単語が表示されます。これらの単語を見るだけでは、それらが何をするのかを理解するのは困難ですが、このいくつかの単語は開発にとって特に重要です。この段階では大規模な言語モデルが存在します。この記事は、それらを知り、その原則を理解するのに役立ちます。モデル圧縮の量子化、枝刈り、および蒸留は、実際には一般的なニューラル ネットワーク モデル圧縮テクノロジであり、大規模な言語モデルに限定されるものではありません。モデル圧縮の重要性: 圧縮後、モデル ファイルが小さくなり、使用されるハードディスク容量も小さくなり、メモリにロードまたは表示されるときに使用されるキャッシュ容量も小さくなり、モデルの実行速度も低下する可能性があります。改善されること。圧縮により、モデルを使用するとコンピューティング リソースの消費が減り、大幅なスケールが可能になります。
- AI 928 2024-04-26 09:28:18
-
- LLM を微調整する方法の革新: PyTorch のネイティブ ライブラリ torchtune の革新的な力と応用価値の包括的な解釈
- 人工知能の分野では、大規模言語モデル (LLM) が研究と応用においてますます新たなホットスポットになりつつあります。ただし、これらの巨大なシステムを効率的かつ正確に調整する方法は、産業界と学術界が常に直面している重要な課題です。最近、PyTorch 公式ブログに TorchTune に関する記事が掲載され、広く注目を集めました。 LLM のチューニングと設計に焦点を当てたツールとして、TorchTune はその科学的性質と実用性が高く評価されています。この記事では、LLM チューニングにおける TorchTune の機能、特長、および応用について詳しく紹介し、読者に包括的かつ深い理解を提供したいと考えています。 1. トーチチューンの誕生背景と意義、深層学習技術と深層学習モデル(LLM)の開発
- AI 860 2024-04-26 09:20:02
-
- Jiyue が再び NVIDIA と提携し、ハイパフォーマンス コンピューティング プラットフォーム Thor が 2026 年に発売される予定
- 第 18 回北京国際自動車展示会が 4 年ぶりに戻ってきます。インテリジェンスのパイオニアとして、ハイエンドのスマートカーロボットブランドである Jiyue は、「Jiyue はより賢く、より美しい」をテーマに将来の AI テクノロジーを解釈し、北京モーターショーに初登場します。 2024 年 4 月 25 日、Jiyue Auto Robot は新製品ラインナップを携えて北京モーターショーでデビューし、その 2 番目のモデルである AI インテリジェント純粋電気駆動車 Jiyue 07 が中国オリジナルのデザインでデビューしました。強い芸術的美学を持ち、「最も美しい7シリーズ」の称号を獲得しました。 Jiyue と NVIDIA が再び提携し、1000TFLOPS の高性能コンピューティング プラットフォーム Thor が 2026 年に量産される予定です。同時に、Jiyue 01 も最新の V1.5.0 バージョンである PPA Smart にアップグレードされます。
- AI 1224 2024-04-26 08:28:01
-
- 長安 Qiyuan E07 の「1 台の車に複数の状態がある」は従来の認識を覆す 将来の車はロボットを変えるのでしょうか?
- 2024年4月25日、北京国際自動車ショー(以下、北京オートショー)が北京の中国国際展覧センターで無事開幕し、長安斉源E07が盛大にデビューした。可変形状、可変機能、可変ソフトウェアを備えた世界初の量産可変新車であり、長安汽車のインテリジェンス進化のマイルストーンとなる。そのスタイリング デザインとソフトウェア アーキテクチャにより、「中国版 Cybertruck」としても知られています。今回消費者に出会ったChangan Qiyuan E07は、特別なサプライズ特典をもたらしました。公式専用APP - Topspaceをダウンロードして登録したユーザーは、アクティビティに参加すると、1日あたり少なくとも120元のオプション装備資金を獲得できます。さらに、Changan Qiyuan E07 は早期アクセス権と関心のあるアクティビティも開始しました。
- AI 906 2024-04-25 21:04:45
-
- 厳水成が担当し、「ユニバーサルビジュアルマルチモーダル大型モデル」の究極の形を確立しました。統一理解・生成・分割・編集
- 最近、Yan Shuicheng 教授のチームは、Vitron のユニバーサル ピクセル レベルのビジュアル マルチモーダル大規模言語モデルを共同でリリースし、オープンソース化しました。プロジェクトのホームページとデモ: https://vitron-llm.github.io/ 論文リンク: https://is.gd/aGu0VV オープンソース コード: https://github.com/SkyworkAI/Vitron これは強力なコードです一般的なビジョン マルチモーダル大規模モデルは、視覚的な理解から視覚的な生成まで、低レベルから高レベルまでの一連の視覚タスクをサポートし、大規模言語モデル業界を長年悩ませてきた画像/ビデオモデルの分離問題を解決します。包括的な統合された静的画像を提供し、動的ビデオ コンテンツを理解、生成、セグメント化、編集します。
- AI 1077 2024-04-25 20:04:15
-
- Alipay はインテリジェント アシスタントを密かにリリースしました。私たちはそれを密かにテストしました
- Alipay が新しい AI 製品を発表したことが明らかになりました。 Qubit は、Alipay が AI スマート アシスタントのグレースケール テストを実施したことを知りました。この AI 製品への入り口は Alipay の中核となるホームページにありますが、奥深くに隠されています。幸運にもグレースケールで表示できる場合は、ホームページの右上隅にあるプラス記号をクリックすると、「インテリジェント アシスタント」ボタンが表示されます。ただし、Alipay のインテリジェント アシスタントは、会話型コミュニケーションや作成支援の一般的な大規模モデルとは異なり、よりサービス指向の AI アシスタントです。インターフェイスの表示に従って、医療相談、オフィス積立金の確認、航空券の購入、トイレの検索、映画の勧めなどのサービス指示を行うことができます。さらに、必要に応じてAlipayの対応機能を推奨したり、ミニプログラムを直接接続したりすることもでき、アプリ内のインテリジェントなナビゲーションとして機能します。このニュースを知った後、Qubit はすぐにクリックしました
- AI 1561 2024-04-25 18:25:17
-
- 8B テキスト マルチモーダル大規模モデル インデックスは、Byte、Huashan、Huake が共同で提案した TextSquare に近いものです。
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、記事を投稿するか、報告用メールアドレスにご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。最近、マルチモーダル大規模モデル (MLLM) がテキスト中心の VQA の分野で大幅な進歩を遂げ、特に GPT4V や Gemini などの複数のクローズドソース モデルは、いくつかの面で人間の能力を超えたパフォーマンスを実証しています。ただし、オープン
- AI 1309 2024-04-25 18:16:01
-
- 人工知能が建設業界を変革する準備をしましょう
- 最新の自動運転技術は、自動車の自動運転システムから航空機の自動ナビゲーションや自動運転機器に至るまで、目覚ましい進歩を遂げ、第 1 世代の人工知能があらゆるところに登場しています。これらのツールは、私たちの生活方法、そして世界との関わり方、そしてお互いの関わり方を変えました。 30 年前の世界を覚えていますか? それは、インターネット、電子メール、ソーシャル メディア、ユビキタス写真、配車サービス、ましてや路面電車のない世界でした。汎用人工知能 (AGI) として知られる次世代の人工知能は、抽象的思考などの幅広いタスクを理解できるようになります。人間と同じように判断し、適応することができるでしょう。これにより、おそらく今後 20 ~ 30 年以内に、私たちが住む世界は完全に変わるでしょう。 AGIは近い将来利用可能になる予定です
- AI 990 2024-04-25 17:50:01
-
- 拡散モデルを加速し、最速の 1 ステップで SOTA レベルのイメージを生成、Byte Hyper-SD はオープンソースです
- 最近、DiffusionModel は画像生成の分野で大きな進歩を遂げ、画像生成およびビデオ生成タスクに前例のない開発機会をもたらしました。素晴らしい結果にもかかわらず、拡散モデルの推論プロセスに固有のマルチステップ反復ノイズ除去特性により、計算コストが高くなります。最近、拡散モデルの推論プロセスを高速化する一連の拡散モデル蒸留アルゴリズムが登場しました。これらの方法は、大きく 2 つのカテゴリに分類できます: i) 軌道保存蒸留、ii) 軌道再構築蒸留。ただし、これら 2 種類の方法は、効果の上限や出力領域の変更によって制限されます。これらの問題を解決するために、ByteDance 技術チームは Hyper-SD と呼ばれる軌跡セグメンテーションの一貫した方法を提案しました。
- AI 1191 2024-04-25 17:25:30
-
- オンライン地図はまだこのままでしょうか? MapTracker: 追跡を使用してオンライン マップの新しい SOTA を実現します。
- 上記と著者の個人的な理解は、このアルゴリズムによりオンラインでの高精度地図の構築が可能になるということです。私たちのメソッドである MapTracker は、センサー ストリームを 2 つのディスプレイのメモリ バッファーに蓄積します。1) 鳥瞰図 (BEV) 空間のラスター潜在要素、および 2) 道路要素 (横断歩道、車線境界線、道路境界線) のベクトル潜在要素です。このメソッドは、オブジェクト追跡におけるクエリ伝播パラダイムを利用し、前のフレームで追跡された道路要素を現在のフレームに明示的に関連付けます。同時に、メモリ潜在のサブセットと距離ストライドをオープンソース リンクに融合します: https://map-tracker .github.io/ 要約すると、この記事の主な貢献は次のとおりです。
- AI 1227 2024-04-25 17:01:17
-
- Llama3 のトレーニング コストがわずか 1/17 の Snowflake オープンソース 128x3B MoE モデル
- Snowflake が LLM 争いに加わりました。 Snowflake は、社内のエンタープライズ アプリケーションに焦点を当てた、高度な「エンタープライズ インテリジェンス」モデルである Arctic をリリースします。ちょうど今、データ管理およびウェアハウスのプロバイダーである Snowflake が、LLM 乱戦に参加し、エンタープライズ レベルのアプリケーションに焦点を当てたトップレベルの大規模言語モデル (LLM) である SnowflakeArctic をリリースしたと発表しました。クラウド コンピューティング会社によって立ち上げられた LLM として、Arctic には主に次の 2 つの利点があります。 効率的なインテリジェンス: Arctic は、SQL 生成、プログラミング、命令追従などのエンタープライズ タスクで優れたパフォーマンスを発揮し、より高度なソフトウェアを使用するオープンソース トレーニングと競合することもできます。コンピューティングコストは同等です。 Arctic はコスト効率の高いトレーニング機器を提供します
- AI 700 2024-04-25 16:10:09