現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- いくつかの .NET オープンソース AI および LLM 関連プロジェクト フレームワークを共有する
- 現在、人工知能(AI)技術の開発は本格化しており、さまざまな分野で大きな可能性と影響力を発揮しています。本日、Dayao は、参考にしていただけるよう、4 つの .NET オープン ソース AI モデル LLM 関連プロジェクト フレームワークを共有します。 https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/DotNetProjectPicks.mdSemanticKernelSemanticKernel は、OpenAI、Azure などの大規模言語モデル (LLM) を統合するように設計されたオープン ソース ソフトウェア開発キット (SDK) です。
- AI 725 2024-05-06 16:43:12
-
- OpenAI Sora はクリエイターの仕事を楽にし、クリエイターは簡単に置き換えられるものではないと信じています
- 5 月 6 日のニュースによると、OpenAI のテキスト生成ビデオ ツール Sora の初期テスターは安心しているようです。彼らは、このツールに取って代わられることにパニックになるのではなく、このツールの方が自分たちの仕事が面白くなると感じています。今年2月、人工知能スタートアップのOpenAIは、「変化する現実世界を深く理解し、シミュレーションする」ことを目的に設計されたツール「Sora」を正式にローンチした。 Sora は、最長 1 分間の長編の高品質ビデオを生成する独自のテキストからビデオへの変換テクノロジーで知られており、その概念実証ビデオはリリース時に Web 全体で幅広い注目を集めました。しかし、ハリウッドの一部の実務家にとって、このテクノロジーの出現は間違いなくある程度の脅威をもたらします。ベテラン映画監督タイラー・ペリー(
- AI 1111 2024-05-06 16:34:09
-
- 人工知能時代の需要が高まる中、AWS、Microsoft、Google はクラウド コンピューティングへの投資を続けています。
- クラウド コンピューティング大手 3 社の成長は 2024 年まで衰える気配がなく、Amazon、Microsoft、Google はいずれもクラウド コンピューティングでこれまで以上の収益を上げています。クラウド ベンダー 3 社はいずれも最近収益を報告し、一貫した収益成長を目指す複数年戦略を継続しています。 4月25日、GoogleとMicrosoftの両社が結果を発表した。 Alphabet の 2024 会計年度第 1 四半期における Google Cloud の収益は 95 億 7,000 万米ドルで、前年比 28% 増加しました。 Microsoft のクラウド収益は 351 億ドルで、前年比 23% 増加しました。 4 月 30 日、アマゾン ウェブ サービス (AWS) は、前年比 17% 増の 250 億米ドルの収益を報告し、3 つの巨人の中にランクされました。クラウド コンピューティング プロバイダーは、過去の市場リーダー 3 社の成長率に満足することがたくさんあります。
- AI 680 2024-05-06 16:22:20
-
- テスラのロボットは工場で働く、マスク氏:手の自由度は今年22に達する!
- テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません
- AI 1120 2024-05-06 16:13:01
-
- ルカンが月に? Nankai と Byte が StoryDiffusion をオープンソース化、複数枚の漫画や長いビデオをより一貫性のあるものにする
- 2日前、チューリング賞受賞者のヤン・ルカン氏が長編漫画「月に行って自分を探検しよう」を再版し、ネチズンの間で熱い議論を巻き起こした。論文「StoryDiffusion: 長距離画像とビデオ生成のための一貫した自己注意」の中で、研究チームは、複雑なシーンを記述する一貫した画像とビデオを生成するための StoryDiffusion と呼ばれる新しい方法を提案しました。これらの漫画に関する研究は、南開大学やバイトダンスなどの機関によって行われています。論文アドレス: https://arxiv.org/pdf/2405.01434v1 プロジェクトのホームページ: https:
- AI 889 2024-05-06 16:10:31
-
- わずか 250 ドルで、Hugging Face のテクニカル ディレクターが Llama 3 を段階的に微調整する方法を教えます
- Meta が立ち上げた Llama3、MistralAI が立ち上げた Mistral および Mixtral モデル、AI21 Lab が立ち上げた Jamba など、おなじみのオープンソースの大規模言語モデルは、OpenAI の競合相手となっています。ほとんどの場合、モデルの可能性を最大限に引き出すには、ユーザーが独自のデータに基づいてこれらのオープンソース モデルを微調整する必要があります。単一の GPU で Q-Learning を使用して、大規模な言語モデル (Mistral など) を小規模な言語モデルに比べて微調整することは難しくありませんが、Llama370b や Mixtral のような大規模なモデルを効率的に微調整することは、これまで課題として残されています。 。したがって、HuggingFace のテクニカル ディレクター、Philipp Sch 氏は次のように述べています。
- AI 1124 2024-05-06 15:52:35
-
- 開発者にとって朗報です。 GitHub が 4 つのコア機能を備えた AI ネイティブ開発環境 Copilot Workspace のプレビュー版をリリースしました。
- 編集 | Yifeng 制作 | 51CTO Technology Stack (WeChat ID: blog51cto) AI プログラミングの世界に新しい成果物はありますか? GitHub は、人工知能のネイティブ開発環境である Copilot Workspace を開始しました。これは、「あらゆる開発者がアイデアから始めてコードを作成し、その後自然言語を使用するソフトウェアに進む」ことを可能にすることを目的としています。画像開発者は、自然言語を使用してコードのブレインストーミング、計画、構築、テスト、実行をこれまでよりも迅速かつ簡単に行うことができます。 2023 年、GitHub Copilot Workspace が初めてユーザーの注目を集めました。現在はテクノロジープレビューとしてリリースされており、開発者はこの開発ツールに強い関心を示し、待機リストに登録しています。 https://github.co
- AI 807 2024-05-06 15:49:01
-
- 現在のフロントエンド エディタを見てみましょう
- 一部の学生がリモートでコードを変更するのを手伝ったとき、誰もが使用しているエディタがさまざまであることがわかりました。VSCode、WebStorm、さらには Sublime...これは私に次のことを思い出させずにはいられません。[最初にフロントエンドを学んだとき、私は本当にエディターでさまざまなオプションを試してみました]。これまでのところ、私は VSCode を使用する「熱狂的なファン」になり、他のエディターの存在を「忘れて」さえいました。これは一種の「焦点」と考えることができます。ただし、これは私たちの選択肢を制限するものでもあります。したがって、今日は、現在のフロントエンド エディターについて見ていきます。結局のところ、「百派の思想の争い」がさらなるインスピレーションを「衝突」させるでしょう。 notepad++ 利点: 無料でオープン ソース: Notepad++ は無料です。
- AI 752 2024-05-06 15:30:16
-
- OmniDrive: 大規模モデルを 3D 運転タスクと連携させるためのフレームワーク
- まず、スパース クエリを使用して視覚表現を 3D にリフトおよび圧縮し、LLM に入力する新しい 3DMLLM アーキテクチャから始めます。タイトル: OmniDrive: AHolisticLLM-AgentFramework for Autonomous Driving with 3DPerception Reasoning and Planning 著者の所属: 北京工業大学、NVIDIA、華中科技大学 オープンソース アドレス: GitHub-NVlabs/OmniDrive マルチモーダル大規模言語モデル (MLLM) の開発強力な推論能力を活用して、LLM ベースの自動運転への関心が高まっています
- AI 991 2024-05-06 15:16:35
-
- MLPは一夜にして消滅した! MIT カリフォルニア工科大学とその他の革新的な KAN が記録を破り、DeepMind を打ち砕く数学的定理を発見
- 一夜にして、機械学習のパラダイムが変わろうとしています。現在、深層学習の分野を支配しているインフラストラクチャは、ニューロンに活性化関数を配置する多層パーセプトロン (MLP) です。では、それを超えて、新たなルートはあるのでしょうか?ちょうど今日、MIT、カリフォルニア工科大学、ノースイースタン大学、その他の機関のチームが、新しいニューラル ネットワーク構造であるコルモゴロフ アーノルド ネットワーク (KAN) をリリースしました。研究者らは、学習可能な活性化関数をノード (ニューロン) からエッジ (重み) に移動することで、MLP に簡単な変更を加えました。論文アドレス: https://arxiv.org/pdf/2404.19756 この変更は一見すると根拠がないように見えます
- AI 879 2024-05-06 15:10:01
-
- 医療診断市場における人工知能は2028年までに40億ドルに達する
- 正確さとスピードが重要な医療分野では、人工知能 (AI) の統合が変革の力となっています。医療診断における人工知能の市場は、かつては新興のニッチ市場でしたが、急速に強力な市場に成長し、その規模は数十億ドルに達すると予測されています。医療診断における人工知能の市場規模は、2023 年の収益が 12 億 5,000 万米ドルに達し、2028 年までに 44 億 8,000 万米ドルに達すると予測されており、予測期間中に 29.04% の CAGR で成長します。医療診断市場における人工知能の成長は、いくつかの重要な要因によって推進されています。 人工知能ベースのソリューションに対する需要の増大: 現代の医療環境が進化し続け、新たな疾患や状態が発見されるにつれ、人工知能ベースのソリューションに対する需要が高まっています。
- AI 482 2024-05-06 15:01:06
-
- テスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能です
- テスラの人型ロボットが新しいスキルを解放しました!昨日、テスラ オプティマスは、第 2 世代オプティマス人型ロボットの最新の進歩を示す新しいデモビデオを正式にリリースしました。今回、オプティマスはテスラ電池工場で電池の組み立てを学び、以前よりも速く、より遠くへ、そしてより安定して歩き始めました。まずはオプティマスの最新スキルとトレーニング内容を見ていきましょう。オプティマスのエンドツーエンドのニューラル ネットワークは現在、テスラの工場でバッテリー セルを正確に組み立てるようにトレーニングされています。これは、2D カメラ、ハンドタッチ、および力センサーのみに依存して、ロボットの FSD コンピューター上でリアルタイムで実行されます。オプティマスは脚を使ってバランスを保ち、ネットワークが上半身全体を動かします。
- AI 835 2024-05-06 14:52:10
-
- CVPR 2024 | 浙江大学は神経構造化光を利用して動的三次元現象のリアルタイム取得と再構築を実現
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。煙などの動的三次元物理現象を効率的かつ高品質に再現することは、航空力学的設計検証や気象三次元観測などの分野での幅広い応用が期待できる関連科学研究の重要な課題です。時間の経過とともに変化する 3 次元の密度シーケンスを再構築することで、科学者を支援することができます。
- AI 731 2024-05-06 14:50:14
-
- ICLR 2024 スポットライト | NoiseDiffusion: 拡散モデルのノイズを修正し、補間画像の品質を向上
- 著者|PengfeiZheng Unit|USTC,HKBUTMLRGroup 近年、生成 AI の急速な発展により、テキストから画像への生成やビデオ生成などの注目を集める分野に大きな推進力が注入されています。これらの技術の中核は、拡散モデルの適用にあります。拡散モデルは、最初に連続的にノイズを追加する順方向プロセスを定義することによって画像を徐々にガウス ノイズに変更し、次に逆方向プロセスを通じてガウス ノイズを徐々に除去して鮮明な画像に変換して実際のサンプルを取得します。拡散常微分モデルは、生成された画像の値を補間するために使用され、ビデオや一部の広告クリエイティブの生成に大きな応用可能性があります。ただし、この方法を自然画像に適用すると、補間された画像効果が満足できない場合が多いことに気付きました。存在する
- AI 1003 2024-05-06 14:01:24
-
- AIは自分の思考と理性をこっそり隠すことを学びます!人間の経験に頼らずに複雑なタスクを解決することは、よりブラックボックスです
- AIが数学の問題を解く時の本当の思考は実は密かに「暗算」?ニューヨーク大学のチームによる新しい研究では、たとえ AI がステップを書くことを許可されておらず、意味のない「...」に置き換えられたとしても、一部の複雑なタスクのパフォーマンスは大幅に向上する可能性があることがわかりました。著者の一人、JacabPfau 氏は次のように述べています。追加のトークンを生成するためにコンピューティング能力を費やす限り、どのトークンを選択しても利点は得られます。たとえば、Llama34M に次のような単純な質問に答えてもらいます。自然定数 e の最初の 6 桁のうち、5 より大きいものはいくつありますか? AIの直接の答えは、最初の6桁だけをカウントし、実際には7をカウントするのと同じです。 AI に各数値を検証する手順を書き取らせると、正しい答えが得られます。 AI にステップを非表示にして、多数の「...」に置き換えます。
- AI 858 2024-05-06 12:00:30