Drew Thomasson氏が最近公開した革新的なオープンソースプロジェクト、ebook2audiobookXTTSは、CalibreとCoqui TTSを利用して電子書籍を高品質なオーディオブックに変換するツールです。多言語に対応し、音声クローン機能もオプションで提供しています。このプロジェクトは、ユーザーが簡単に章とメタデータ付きのオーディオブックを作成し、より豊かな読書体験を実現することを目的としています。

このツールの主な特徴は以下のとおりです。

効率的な変換:Calibreを利用することで、ユーザーは様々な電子書籍フォーマット(.epubや.mobiなど)をテキストに変換し、自動で章を検出できます。

多言語対応:デフォルトでは英語に対応していますが、スペイン語、フランス語、ドイツ語など、多くの言語にも対応しており、世界中のユーザーのニーズを満たします。

任意の音声クローン:ユーザーはカスタムの音声ファイルを使用して、独自の聴覚体験を作り出すことができます。

シンプルな操作性:Gradioウェブインターフェースにより、ユーザーは変換プロセスを迅速に開始でき、使いやすい操作性を提供します。

QQ20240929-110813.png

QQ20240929-110820.png

このプロジェクトには、Python3.x、Calibre、FFmpegが必要です。詳細なインストールと実行手順が提供されているため、ユーザーは簡単に使い始めることができます。Drew氏は、様々なオペレーティングシステム向けの具体的なインストールガイドも提供しており、ユーザーは自身の環境に合わせて設定できます。

また、対応する電子書籍フォーマットについては、.pdf、.txt、.htmlなど、様々なフォーマットに対応しています。特に.epubと.mobiフォーマットで最適な結果が得られます。変換後のオーディオブックは.m4bフォーマットで保存され、豊富なメタデータと章情報が含まれており、ユーザーエクスペリエンスを向上させます。

github:https://github.com/DrewThomasson/ebook2audiobookXTTS