現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- Sora が Adobe ファミリー バケットに加わり、ビデオが写真やシーンを含むように変更されました: PR アップデート プレビュー
- 生成AI時代のビデオ編集ツールです。アドビは間もなく、最先端の生成 AI ビデオ作成機能を利用できるようになります。本日、Adobe は Premiere Pro の新バージョンのアップデート計画を発表しました。これには、OpenAI の Sora や Runway の Gen-2 や Pika など、サードパーティの AI ビデオ生成モデル用のプラグインの追加が含まれており、間もなく Adobe ツール システムに追加され、人々が使用できるようになります。 Adobe 独自の大型モデル Firefly の機能に基づいて、ビデオ素材に直接コンテンツを追加または削除できるようになりました。トランジション中に背景に焦点が当てられていないように感じられるショットはありませんか?あとは OpenAI の Sora を使って段落を自動生成するだけです。そら缶
- AI 946 2024-04-16 21:43:21
-
- DeepMind がトランスフォーマーをアップグレードし、フォワードパスの FLOP を最大半分に削減可能
- ハイブリッド深度を導入した DeepMind の新しい設計により、トランスの効率が大幅に向上します。 Transformer の重要性は言うまでもありませんが、現在多くの研究チームがこの革新的なテクノロジーの改善に取り組んでいます。その重要な改善の方向性の 1 つは、不必要な計算時間を節約できる適応型コンピューティング機能を提供することです。 。 Transformer アーキテクチャの提案者の 1 人であり、NEARProtocol の共同創設者である Illiya Polosukhin 氏は、少し前の Jen-Hsun Huang 氏との会話の中で次のように述べています。特定の問題に費やされます。」
- AI 1206 2024-04-16 20:10:37
-
- 清華の最新作! RoadBEV: BEV で路面の再構築をどのように実現するか?
- 原題: RoadBEV: RoadSurfaceReconstructioninBird'sEyeView 論文リンク: https://arxiv.org/pdf/2404.06605.pdf コードリンク: https://github.com/ztsrxh/RoadBEV 著者の所属: 清華大学、カリフォルニア大学バークレー校 論文アイデア: 路面状況、特に幾何学的輪郭は自動運転車の運転能力に大きく影響します。ビジョンベースのオンライン道路再構築により、道路情報を事前に取得できることが期待されます。単眼奥行き推定や立体視推定などの既存のソリューションには限界があります。最寄りの鳥瞰図 (BEV)
- AI 841 2024-04-16 19:55:24
-
- 非常に長いシーケンス、非常に高速: 新世代の効率的な大規模言語モデルのための LASP シーケンス並列処理
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。国際的なトップクラスの GPT-4128K や Claude200K から、200 万語を超えるテキストをサポートする国内の KimChat に至るまで、ラージ言語モデル (LLM) はロング コンテキスト テクノロジーにおいて常に人気を博しています。世界で一番
- AI 1385 2024-04-16 18:49:01
-
- Adobe ビデオ編集ソフトウェアに Sora が登場! Premiere Pro の新バージョンが AI 編集の時代を切り開く
- Sora は Adobe ビデオ編集ソフトウェアに統合される予定です。新しくリリースされた PremierPro コンセプトのデモンストレーションで、Adobe は OpenAI との協力の結果を示しました。メイン レンズに加えて、B ロール補助レンズは完全に Sora によって生成されました。 Sora に加えて、その他の人気 AI ビデオ ツール Runway や Pika もオプションとして利用可能になります。ランウェイはデモでのソラと同様に使用され、新しい補助ショットを生成できます。 Pika は既存のレンズを数秒間自然に延長できます。これらの機能はまだ初期プレビューと研究段階にあり、いつリリースされるかはまだ明らかにされていないことを強調しておく必要があります。比較すると、Adobe 独自の AI 製品 Firefly
- AI 752 2024-04-16 15:20:01
-
- IoT センサーと人工知能がスマート ビルディングにどのような革命をもたらしているか
- ここ数年、特に新型コロナウイルス感染症(COVID-19)のパンデミックを受けて、施設管理者の変化や持続可能性のニーズの拡大への期待に伴い、建設管理は継続的な成長と進化に直面している。オフィスからよりハイブリッドで柔軟な作業環境への移行により、商業ビルの使用方法が変化し、ビルの使用状況や占有率の傾向などをリアルタイムで把握することが求められています。絶えず変化する建設管理の状況では、全体的な生産性とパフォーマンスを向上させながら、新しい柔軟な環境に迅速に適応するソリューションが実証されています。スマート ビルディング 自社の施設と改善の機会を評価する スマート ビルディングは、業務を合理化するだけでなく、コストを削減し、すべての人の認知度を高める可能性を秘めた成長傾向です。モノのインターネット (IoT)、人工知能 (AI)、自動化などのテクノロジーの活用
- AI 958 2024-04-16 15:16:37
-
- 北京大学の林周晨氏のチームは、一次最適化アルゴリズムに触発されて、普遍的な近似特性を備えたニューラル ネットワーク アーキテクチャの設計方法を提案しました。
- ニューラル ネットワークは、深層学習テクノロジーの基礎として、多くの応用分野で効果的な成果を上げています。実際には、ネットワーク アーキテクチャは学習効率に大きな影響を与える可能性があります。優れたニューラル ネットワーク アーキテクチャは、問題に関する事前知識を組み込み、ネットワーク トレーニングを確立し、コンピューティング効率を向上させることができます。現在、古典的なネットワーク アーキテクチャ設計手法には、手動設計、ニューラル ネットワーク アーキテクチャ検索 (NAS) [1]、および最適化ベースのネットワーク設計手法 [2] が含まれます。 ResNet などの人工的に設計されたネットワーク アーキテクチャ。ニューラル ネットワーク アーキテクチャの探索は、探索または強化学習を通じて探索空間内で最適なネットワーク構造を探索します。明確な目的がある
- AI 908 2024-04-15 18:22:15
-
- Js-pytorch: フロントエンド + AI の新しい世界を切り開く
- 皆さんこんにちは、私の名前は徐暁西です。最近、Github で非常に興味深いフレームワーク js-pytorch を発見しました。これにより、フロントエンドで JavaScript を簡単に使用して深層学習フレームワークを実行できるようになります。フロントエンド テクノロジーの上級プレーヤーとして、今日はこのフレームワークを皆さんと共有したいと思います。現在の人工知能の分野において、ディープラーニング技術は非常に注目を集めている技術となっています。 PyTorch は、ディープラーニングフレームワークの 1 つとして注目を集めています。このフレームワークは、深層学習の分野で重要な開発速度を持っています。 js-pytorch は JavaScript テクノロジーを活用して PyTorch の機能を導入し、JavaScript の世界で PyTorch を使用できるようにします。
- AI 775 2024-04-15 16:40:55
-
- エンドツーエンドおよび次世代の自動運転システムと、エンドツーエンドの自動運転に関する誤解について話しましょう。
- この 1 か月間、いくつかのよく知られた理由により、私は業界のさまざまな教師やクラスメートと非常に集中的な交流をしてきました。この交換で避けられない話題は当然、エンドツーエンドと人気の Tesla FSDV12 です。この機会に、現時点での私の考えや意見を整理し、皆様のご参考とご議論に役立てたいと思います。エンドツーエンドの自動運転システムをどのように定義するか、またエンドツーエンドで解決することが期待される問題は何でしょうか?最も伝統的な定義によれば、エンドツーエンド システムとは、センサーから生の情報を入力し、関心のある変数をタスクに直接出力するシステムを指します。たとえば、画像認識では、従来の特徴抽出 + 分類子方式と比較して、CNN はエンドツーエンドと言えます。自動運転タスクでは、各種センサー(カメラ/LiDAR)からのデータを入力
- AI 1282 2024-04-15 16:13:01
-
- 米国の巨大テクノロジー企業が世界のAI市場を操作していることを懸念し、英国の規制当局が複数の調査を開始
- 英国競争市場庁(CMA)は最近、米国のテクノロジー企業が世界のAI市場を操作する可能性があると懸念を表明した。 CMAは、基本的なAIモデル(FMなど)の開発と運用を支配するいくつかのテクノロジー企業と、それらの企業間の協力方法(OpenAIやMicrosoftなど)を調査している。同庁は、これらのテクノロジー企業が90社以上のパートナーからなる「インターネットネットワーク」を確立し(図1参照)、Google、Apple、Microsoft、Meta、Amazon、Nvidiaなどから投資を受けていると指摘した。 CMAは、こうした投資が他の企業のAI市場参入に対する障壁を生み出すために利用される可能性があると懸念している。 image001.jpg 図 1: アメリカのテクノロジー大手によって形成された「インターネット」に関する CMA 調査は昨年完了しました。
- AI 459 2024-04-15 16:07:21
-
- 世界最高峰のAIカンファレンスNeurlPSが高校生からの論文募集を開始
- 大学入学試験を受けて論文を書く次のステップは何でしょうか? AI の人材育成は幼少期から始めるべきだ この言葉は、ますます冗談ではなくなってきています。金曜日、トップ学術会議 NeurIPS が高校生向けのペーパートラックを開設したというニュースが人工知能コミュニティに衝撃を与えた。このニュースはカンファレンスの主催者からの新たな発表から引用されている。これはワークショップではなく、メインのカンファレンスであることに注意してください。機械学習の社会的影響に関する研究論文の提出を高校生に心から募集しており、彼らのプロジェクトは NeurIPS+2024 で発表されます。組織委員会はファイナリストの中から何人かを選出し、プロジェクトをバーチャルで発表し、NeurIPS ホームページでその成果を強調します。さらに、最大 5 つの受賞プロジェクトの主著者が Ne に招待されます。
- AI 1230 2024-04-15 16:04:01
-
- ムスクの新作! Grok-1.5V マルチモーダル モデルの衝撃的なリリース: デジタル世界と物理世界の完璧な統合
- Musk の第一世代マルチモーダル モデル Grok-1.5V がついに登場! Grok1.5V は、デジタル世界と物理世界を接続できると主張しています。テキスト機能に加えて、ドキュメント、アイコン、スクリーンショット、写真などのさまざまな視覚情報を処理できます。 Grok 1.5V は、すべての初期テスターとすべての Grok ユーザーが間もなく利用できるようになります。 NVIDIA のシニア サイエンティストである Jim Fan 氏は、Grok-1.5V の「最大のハイライト」を発見しました。彼の見解では、Grok-1.5V の最も興味深い点は、自動運転のエッジ ケースを解決できる可能性があることです。 Grok-1.5V は、自動車が複雑なシナリオを解決し、ルールや反事実に基づいて推論し、決定を説明するのに役立つ「思考チェーン」を使用することで、認識を次のレベルに引き上げることができます。
- AI 1113 2024-04-15 16:01:01
-
- かつて人気だった InstantID には、オープンソース化された様式化された画像の生成という新しい遊び方があります。
- InstantID のオリジナル チームは、スタイル移行の新しい方法である InstantStyle を立ち上げました。様式化された画像の生成はスタイル転送と呼ばれることが多く、その目標は、参照画像とスタイルが一致し、元の画像の内容と一致する画像を生成することです。このテクノロジーは、同じスタイル データのバッチ トレーニングのための拡散手法 (LoRA など) に基づいており、新しいスタイルに移行することはできません。または、反転操作 (StyleAlign など) に基づいて、スタイル イメージを潜在ノイズに復元することにより、順伝播によって取得された K と V を使用して、生成時にスタイル イメージを置き換えます。この方法では、反転操作により生成スタイルが劣化することがよくあります。最近、インスタントID
- AI 895 2024-04-15 15:58:20
-
- ReFT (Representation Fine-tuning): PeFT よりも優れた新しい大規模言語モデル微調整テクノロジ
- ReFT (Representation Finetuning) は、大規模な言語モデルを微調整する方法を再定義する画期的な手法です。スタンフォード大学の研究者らがarxivに最近(4月)発表した論文によると、ReFTは従来の重みベースの微調整手法とは大きく異なり、これらの大規模モデルを新しいものに適応させるためのより効率的かつ効果的な方法を提供するという。タスクとエリア!この論文を紹介する前に、PeFT について見てみましょう。パラメーターの効率的な微調整 PeFTParameterEfficientFine-Tuning (PEFT) は、少数または追加のモデル パラメーターを微調整するための効率的な微調整方法です。従来の予測ネットワークによる微調整
- AI 1465 2024-04-15 15:30:02
-
- ゾウは踊れないなんて誰が言った? ICLR 2024 のクロスモーダル インタラクションのタイミング予測を実現するための大規模言語モデルの再プログラミング
- 最近、オーストラリアのモナッシュ大学、Ant Group、IBM Research およびその他の機関の研究者らは、大規模言語モデル (LLM) に対するモデル再プログラミング (モデル再プログラミング) の適用を検討し、大規模言語モデルの効率的な再プログラミングという新しい観点を提案しました ( LLM)。一般的な時系列予測システム、つまり Time-LLM フレームワークの言語モデル。このフレームワークは、言語モデルを変更せずに高精度かつ効率的な予測を実現でき、複数のデータセットや予測タスクにおいて従来の時系列モデルを上回ることができ、LLM がクロスモーダル時系列データを処理する際に、象が踊るように優れたパフォーマンスを発揮できるようになります。 。近年、一般知能分野における大規模言語モデルの開発では、「大規模モデル+時系列・時系列データ」という新たな手法が注目されています。
- AI 762 2024-04-15 15:20:02