ホームページ テクノロジー周辺機器 AI 一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

Apr 13, 2023 am 10:19 AM
AI モデル

ディレクトリ:


  1. #Composer: 合成可能な条件を使用したクリエイティブで制御可能な画像合成
  2. 拡散モデルを使用した構造とコンテンツに基づくビデオ合成
  3. ##昆虫の脳のコネクトーム
  4. ## 不確実性-原子間ポテンシャルの能動学習のための駆動ダイナミクス
  5. AI 駆動の材料発見のための組み合わせ合成
  6. マスクされた画像は堅牢な微調整のための反事実のサンプルです
  7. 1 つのトランスフォーマーで大規模なマルチモーダル拡散のすべての分布に適合
  8. ArXiv Weekly Radiostation: NLP、CV、ML など 厳選された論文 (音声付き)
論文 1: Composer: 合成可能な条件を使用したクリエイティブで制御可能な画像合成

    ##著者: Lianghua Huang et al
  • 論文アドレス: https://arxiv.org/pdf/2302.09778v2.pdf
要約:

AI ペイントの分野では、多くの研究者が AI ペイント モデルの制御性の向上、つまり、画像を生成するモデルがより人間に優しいものになります。少し前に、ControlNet と呼ばれるモデルがこの制御性を新たな頂点に押し上げました。同時期にアリババやアントグループの研究者らも同じ分野で成果を出しており、本稿ではその成果について詳しく紹介する。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

推奨:

AI ペイントの新しいアイデア: 50 億のパラメーターを備えた国産オープンソースの新モデル、総合的にコントロール性と品質の飛躍を実現。

論文 2: 拡散モデルを使用した構造およびコンテンツガイド付きビデオ合成

    著者:Patrick Esser et al
  • 論文アドレス: https://arxiv.org/pdf/2302.03011.pdf
#要約:

特に 2022 年の AIGC の流行を経験した後では、多くの人が生成 AI テクノロジーの魅力をすでに理解していると思います。 Stable Diffusion に代表されるテキストから画像への生成技術は、かつて世界中で普及し、AI の助けを借りて芸術的な想像力を表現するために無数のユーザーが殺到しました... 比較画像編集、ビデオ編集は、時間的な一貫性を維持しながら、単に見た目を変更するのではなく、新しいアクションを合成する必要がある、より難しいテーマです。多くの企業がこの道を模索しています。少し前に、Google はビデオ編集にテキスト条件付きビデオ拡散モデル (VDM) を適用する Dreamix をリリースしました。

最近、Stable Diffusion の作成に参加した企業である Runway は、テキスト プロンプトまたは参照を適用することで指定されたスタイルを使用する新しい人工知能モデル「Gen-1」を発表しました。画像。既存のビデオを新しいビデオに変換できます。たとえば、「路上の人々」を「粘土人形」に変えるには、たった 1 行のプロンプトが必要です。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

# おすすめ:

一文や写真に特殊効果を追加する、Stable Diffusion 社AIGCは新たな策略を講じた。

論文 3: 昆虫の脳のコネクトーム

##著者: MICHAEL WINDING et al .
  • 論文アドレス: https://www.science.org/doi/10.1126/science.add9330
  • #要約:
研究者らはこれまでで最も進んだ昆虫の脳のアトラスを完成させた。これは科学者を思考のメカニズムの真の理解に近づける神経科学における画期的な成果である。

ジョンズ・ホプキンス大学とケンブリッジ大学が率いる国際チームは、ショウジョウバエの幼虫の脳のあらゆる神経接続の驚くほど詳細な地図を作成し、これは人間の脳と密接に関係している研究です。プロトタイプの科学モデル。この研究は将来の脳研究をサポートし、新しい機械学習アーキテクチャにインスピレーションを与える可能性があります。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

推奨: これまでで最も完全な昆虫の脳マップ。新しい機械学習を刺激する可能性があります。アーキテクチャ 。

#論文 4: 原子間ポテンシャルの能動学習のための不確実性駆動ダイナミクス

  • 著者: Maksim Kulichenko et al
  • 論文アドレス: https://www.nature.com/articles/s43588-023-00406-5

要約: 機械学習 (ML) モデルは、高忠実度の量子シミュレーションからのデータセットでトレーニングされた場合、正確かつ効率的な原子間ポテンシャルを生成できます。アクティブ ラーニング (AL) は、さまざまなデータ セットを反復的に生成するための強力なツールです。このアプローチでは、ML モデルは、新しい原子構成ごとに不確実性の推定値とその予測を提供します。不確実性の推定値が特定のしきい値を超える場合、その構成はデータセットに含まれます。

最近、米国のロスアラモス国立研究所の研究者らは、トレーニング データを有意義に増強するより高速な検出構成を実現するための不確実性駆動型アクティブ ラーニング ダイナミクス (UDD-AL) という戦略を開発しました。セット。 UDD-AL は、分子動力学シミュレーションで使用されるポテンシャル エネルギー曲面を変更して、大きなモデルの不確実性が存在する配置空間の領域をサポートします。 UDD-AL のパフォーマンスは 2 つの AL タスクで実証されます。以下の図は、グリシン テスト ケースにおける UDD-AL メソッドと MD-AL メソッドの比較を示しています。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

推奨: Nature サブジャーナル | 不確実性を重視した、アクティブな学習のためのパワー自動サンプリングを使用します。

論文 5: AI 駆動の材料発見のためのコンビナトリアル合成

  • 著者: John M. Gregoire et al
  • 論文アドレス: https://www.nature.com/articles/s44160-023-00251-4

要約: 合成は固体材料実験の基礎であり、どの合成技術にも必然的にいくつかの合成パラメータの変更が含まれます。最も一般的なのは組成とアニーリングです。温度。コンビナトリアル合成とは、一般に、1 つまたは複数の合成パラメータを体系的に変化させてマテリアルのコレクションを作成する自動化/並列化されたマテリアル合成を指します。人工知能によって制御される実験ワークフローにより、コンビナトリアル合成に新たな要件が課されます。

ここでは、カリフォルニア工科大学の研究者がコンビナトリアル合成の概要を説明し、コンビナトリアル合成と AI テクノロジーの共同開発によって促進される材料科学の未来を構想しています。そして、速度、拡張性、範囲、品質をカバーする、異なるテクノロジー間のトレードオフを評価するための 10 の指標を確立しました。これらの指標は、特定のワークフローに対するテクノロジーの適合性を評価するのに役立ち、コンビナトリアル合成の進歩が材料科学の加速の新時代をどのように導くかを示します。複合合成プラットフォームの合成指標とそれぞれの評価は以下のとおりです。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

# 推奨: Nature Synthesis レビュー: 材料発見のための人工知能によるコンビナトリアル合成。

論文 6: マスクされた画像は堅牢な微調整のための反事実のサンプルである

  • 著者: Yao Xiao 他
  • 論文アドレス: https://arxiv.org/abs/2303.03052

##要約: 孫文大学ヒューマン・コンピュータ・インテリジェンス融合研究所 (HCP) は、AIGC とマルチモーダルで実りある成果を上げました最近の AAAI 2023 および CVPR 2023 には 10 件以上の論文が選ばれており、世界的な研究機関のトップクラスにランクされています。成果の 1 つは、チューニングにおけるマルチモーダル大規模モデルの制御性と一般化を大幅に改善するために因果モデルの使用を実装したものです - 「マスクされた画像はロバストな微調整のための反事実サンプル」。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

推奨事項: 中山大学 HCP 研究室の新たなブレークスルー: 因果関係パラダイムを使用したアップグレードマルチモデル 大規模な状態モデル。

論文 7: 1 つのトランスフォーマーで大規模なマルチモーダル拡散のすべての分布に適合

  • #著者: Fan Bao 他
  • 論文アドレス: https://ml.cs.tsinghua.edu.cn/diffusion/unidiffuser.pdf

##要約: この論文では、マルチモダリティ向けに設計された確率的モデリング フレームワークである UniDiffuser を提案し、チームによって提案されたトランスフォーマー ベースのネットワーク アーキテクチャを採用しています。 U-ViT は、オープンソースの大規模グラフィック データ セット LAION-5B で 10 億のパラメーターを使用してモデルをトレーニングし、基礎となるモデルがさまざまな生成タスクを高品質で完了できるようにしました (図 1)。簡単に言うと、一方向のテキスト生成に加えて、画像生成、画像とテキストの結合生成、無条件の画像とテキスト生成、画像とテキストの書き換えなどの複数の機能も実現でき、制作効率が大幅に向上します。テキストと画像コンテンツの効率を高め、テキストとグラフィックスの生成をさらに向上させる 数式モデルの応用想像力。

一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップ

推奨: 清華 Zhu Jun チームは、ベースとなる初の大規模マルチモーダル拡散モデルをオープンソース化しました。 Transformer では、テキストと画像の相互作用、および書き換えがすべてを勝ち取りました。 ArXiv Weekly Radiostation

Heart of Machine は、Chu Hang、Luo Ruotian、Mei Honyuan によって開始された ArXiv Weekly Radiostation と協力しています。7 つの論文に基づいて、このセレクションは詳細です。今週の重要な論文には、NLP、CV、ML の各分野で選ばれた 10 件の論文と、音声形式での論文の要約紹介が含まれます。

今週選ばれた 10 の NLP 論文は次のとおりです:

1. GLEN: 数千人向けの汎用イベント検出タイプ (Martha Palmer、Jiawei Han より)

2. 言語モデルの概要: 最近の開発と展望 (C.-C. Jay Kuo より)

3. 言語を超えた視覚的音声表現の学習 (Maja Pantic より)

4. ChatGPT およびプロンプト付き GPT-4 を使用した放射線医学レポートの平易な言語への翻訳学習: 有望な結果、限界、および可能性 (Ge Wang より)

5. 百聞は一見に如かず: ピクセルからの言語モデル計画(Honglak Lee より)

6. マスクされた単語を予測しながらトランスフォーマーは解析しますか? (Sanjeev Arora より)

7. コンテキスト内学習の学習可能性 . ( Amnon Shashua より)

##8. 病院内のメタ情報は抽象的な退院概要生成に役立ちますか? (松本裕司より)

##9 ChatGPT コンピュータ サイエンス試験に参加 (Ulrike von Luxburg より)

10. SemEval-2023 でのチーム SheffieldVeraAI タスク 3: ニュースのジャンル、トピック、説得手法に対する単言語および多言語のアプローチ(Kalina Bontcheva より)

今週の CV から選ばれた 10 件の論文は次のとおりです:

1. ローカル バイナリより効率的な視覚表現学習のためのピクセル差分ネットワークへのパターン (Matti Pietikäinen、Li Liu より)

2.カテゴリレベルのマルチパーツ、マルチジョイント 3D 形状アセンブリ。 (Wojciech Matusik、Leonidas Guibas より)

3. PartNeRF: 3D 監視なしでパーツを認識した編集可能な 3D 形状を生成します。 (レオニダス・ギバスより)

4.マルチビュー 3D 知覚のための反復的長期時間融合の探求。 (張項宇より)

5.必要なものを入手: 柔軟なコンポーネントの審議で複雑なテーブル構造の認識を再考します。 (Bing Liu より)

6.視覚モデルと言語モデルを使用した統合された視覚的関係の検出。 (ヤン・ミンシュアンより)

7. Reliable Bank を介した水中画像復元のための対照的半教師あり学習。 (Huan Liuより)

8. InstMove: オブジェクト中心のビデオ セグメンテーションのためのインスタンス モーション。 (シャンバイ、アラン・ユイレより)

9. ViTO: ビジョントランスフォーマーオペレーター。 (ジョージ・エム・カルニアダキスより)

10.オープンボキャブラリーのセグメンテーションと検出のためのシンプルなフレームワーク。 (Jianfeng Gao、Lei Zhang より)

本周 10 篇 ML 精选论文是:

1.超球状均一性ギャップによる神経崩壊の一般化と切り離し。 (ベルンハルト・シェルコフより)

2. AutoTransfer: 知識伝達を備えた AutoML -- グラフ ニューラル ネットワーク用のアプリケーション。 (Jure Leskovec より)

3.リレーショナル マルチタスク学習: データとタスク間の関係のモデル化。 (Jure Leskovec より)

4.解釈可能な外れ値の要約。 (サミュエル・マッデンより)

5.ビジュアルプロンプトベースのパーソナライズされたフェデレーテッドラーニング。 (タオ大成より)

6. NOvA でのスパース CNN とトランスフォーマーを使用したニュートリノ物理学の解釈可能な共同イベント粒子再構成。 (ピエール・バルディより)

7. FedLP: 通信と計算の効率的なフェデレーテッド ラーニングのためのレイヤーごとのプルーニング メカニズム。 (フェイ・ワン、ハーレド・B・レタイフより)

8. NeurIPS 2022 での Traffic4cast -- スパース ノード データからグラフ エッジに沿ったダイナミクスを予測: 静止車両検出器からの都市全体の交通量と ETA。 (ゼップ・ホッホライターより)

9.継続学習における補助ネットワークを介して、より優れた安定性と可塑性のトレードオフを達成します。 (トーマス・ホフマンより)

10.リハーサル不要の継続学習のための即時チューニングを備えたステアリング プロトタイプ。 (ディミトリス N. メタクサスより)

以上が一文でビデオに特殊効果を追加、これまでで最も完全な昆虫の脳マップの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります 微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

Yolov10: 詳細な説明、展開、アプリケーションがすべて 1 か所にまとめられています。 Yolov10: 詳細な説明、展開、アプリケーションがすべて 1 か所にまとめられています。 Jun 07, 2024 pm 12:05 PM

1. はじめに ここ数年、YOLO は、計算コストと検出パフォーマンスの効果的なバランスにより、リアルタイム物体検出の分野で主流のパラダイムとなっています。研究者たちは、YOLO のアーキテクチャ設計、最適化目標、データ拡張戦略などを調査し、大きな進歩を遂げました。同時に、後処理に非最大抑制 (NMS) に依存すると、YOLO のエンドツーエンドの展開が妨げられ、推論レイテンシに悪影響を及ぼします。 YOLO では、さまざまなコンポーネントの設計に包括的かつ徹底的な検査が欠けており、その結果、大幅な計算冗長性が生じ、モデルの機能が制限されます。効率は最適ではありませんが、パフォーマンス向上の可能性は比較的大きくなります。この作業の目標は、後処理とモデル アーキテクチャの両方から YOLO のパフォーマンス効率の境界をさらに改善することです。この目的を達成するために

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性​​を実証しています。 「S」で始まる関連研究

OpenAI データは必要ありません。大規模なコード モデルのリストに加わりましょう。 UIUC が StarCoder-15B-Instruct をリリース OpenAI データは必要ありません。大規模なコード モデルのリストに加わりましょう。 UIUC が StarCoder-15B-Instruct をリリース Jun 13, 2024 pm 01:59 PM

ソフトウェア テクノロジの最前線に立つ UIUC Zhang Lingming のグループは、BigCode 組織の研究者とともに、最近 StarCoder2-15B-Instruct 大規模コード モデルを発表しました。この革新的な成果により、コード生成タスクにおいて大きな進歩が達成され、CodeLlama-70B-Instruct を上回り、コード生成パフォーマンス リストのトップに到達しました。 StarCoder2-15B-Instruct のユニークな特徴は、その純粋な自己調整戦略であり、トレーニング プロセス全体がオープンで透過的で、完全に自律的で制御可能です。このモデルは、高価な手動アノテーションに頼ることなく、StarCoder-15B 基本モデルの微調整に応じて、StarCoder2-15B を介して数千の命令を生成します。

SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 Aug 01, 2024 pm 09:40 PM

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス

See all articles