メタオープンソース AI 言語モデル MusicGen はテキストとメロディーを完全な音楽に変換できます
IT House News 6 月 12 日、Meta は最近、2017 年に Google が発表した Transformer モデルに基づく AI 言語モデル MusicGen を Github でオープンソース化しました。モデルの名前が示すように、MusicGen は主に音楽生成に使用され、テキストと既存のメロディーを完全な音楽に変換できます。
R&D チームは次のように述べています。「モデルのトレーニングには 20,000 時間の認可された音楽を使用し、Meta の EnCodec エンコーダを使用してオーディオ データをより小さなユニットに分解して並列処理することで、MusicGen のコンピューティング効率と生成速度が向上しました。同じ種類の AI モデル。」
さらに、MusicGen はテキストとメロディーの組み合わせ入力もサポートしています。たとえば、「軽いトラック」を生成することを提案し、同時に「それをベートーベンの「頌歌」と組み合わせる」というリクエストもできます。 to Joy「結合」。
研究開発チームは、MusicGen の実際のパフォーマンスもテストしました。その結果、Google の MusicLM や Riffusion、Mousai、Noise2Music などの他の音楽モデルと比較して、MusicGen は音楽とテキスト プロンプトの一致や楽曲の信頼性などの指標のテストで優れたパフォーマンスを発揮し、全体的に Google のパフォーマンスよりわずかに高いことがわかりました。 MusicLMレベル。
Meta はモデルの商用利用を許可し、Huggingface でデモ Web アプリケーションをリリースしました。
IT Home にモデルのアドレスが添付されています: ここをクリックして移動します
デモ アプリケーションのアドレス: ここをクリックして移動します
以上がメタオープンソース AI 言語モデル MusicGen はテキストとメロディーを完全な音楽に変換できますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

ファルコン3:革新的なオープンソースの大規模な言語モデル LLMSの称賛されたFalconシリーズの最新のイテレーションであるFalcon 3は、AIテクノロジーの重要な進歩を表しています。 Technology Innovation Institute(TII)によって開発されたこのオープン

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。

2024年は、コンテンツ生成にLLMSを使用することから、内部の仕組みを理解することへの移行を目撃しました。 この調査は、AIエージェントの発見につながりました。これは、最小限の人間の介入でタスクと決定を処理する自律システムを処理しました。 buildin
