お気に入りの電子書籍のオーディオブックバージョンを待つのにうんざりしていませんか? PythonプログラムであるAudiblezは、Linux、Macos、およびWindowsでEpub Ebooksから独自のオーディオブックを作成できます。
目次
- はじめに
はじめに
オーディオブックのリリースを待つことは、特にニッチのタイトルではイライラする可能性があります。 audiblezはソリューションを提供します。テキストツーチック(TTS)テクノロジーを使用して独自のオーディオブックを生成します。 Kokoro V0.19モデルを搭載したAudiblezは、非常に自然なナレーションを生成します。 ココロ:高品質のTTSモデル
ココロは、高品質の出力で有名なコンパクトでありながら強力なTTSモデル(8200万パラメーター)です。 表現力豊かな音声とISTFTNETのためにStyletts 2を活用して、効率的なオーディオ処理を行います。 倫理的に調達されたデータ(パブリックドメインと合成オーディオ)で訓練されたココロは、例外的な結果を提供します。
ココロの重要な機能:
TTSスペースアリーナベンチマークでトップランク
効率的なトレーニング(約500 gpu時間)。比較的小さなデータセット(< 100時間のオーディオ)でトレーニングされています。 複数の言語(アメリカとイギリスの英語を含む)をサポートしています 多様な音声オプション(男性と女性)を提供しています。
ココロを介した高品質の音声合成。
多言語のサポート(以下を参照)。 カスタマイズ可能な音声選択(以下を参照)。
自動章の検出。
ユーザーフレンドリーなコマンドラインインターフェイス。
audiblezは現在、en-us、en-gb、fr-fr、ja、kr、およびcmnをサポートしています。 音声オプションには、AF、AF_BELLA、AF_NICOLE、AF_SARAH、AF_SKY、AM_ADAM、AM_MICHAEL、BF_EMMA、BF_ISABELLA、BM_GEORGE、およびBM_LEWISが含まれます。 音声サンプルは、ココロ-TTSデモで入手できます:https://www.php.cn/link/3fc703661503434d7524267dfdd3e668。
インストールffmpeg:
pipx install audiblez
Kokoro:kokoro-v0_19.onnx
voices.json
epubsをオーディオブックに変換します
オーディオ速度の調整
audiblez book.epub -l en-us -v af_sky
gpu加速
-s
audiblez book.epub -l en-gb -v af_sky -s 1.5
フラグ:
pip install onnxruntime-gpu
--providers
audiblez book.epub -l en-gb -v af_sky --providers CUDAExecutionProvider
audiblezは、既存の電子ブックからのオーディオブックの作成を簡素化します。まだ開発中ですが、強力でアクセス可能なツールを提供します。将来の更新には、改善された章のナビゲーションと画像からテキストへの機能が含まれる場合があります。
以上がLinuxでAudiblezとKokoroを使用してEpub電子ブックをオーディオブックに変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。