Notebookcheck Logo

开源电子书有声读物转换器支持 1000 多种语言

您现在可以免费将电子书转换为高质量的有声读物(图片来源:Canva -edits)
您现在可以免费将电子书转换为高质量的有声读物(图片来源:Canva -edits)
ebook2audiobook 项目进行了大规模更新,支持 1000 种语言。2.0 版更新拥有更多的功能,可为读者提供更多的服务。
Open Source Software

开发人员 Drew Thomasson 最近推出了广受欢迎的 ebook2audiobook 项目的 2.0 版。2.0 版带来了全新的图形用户界面、方便的微调模型访问,以及适用于本地 Mac、Windows 和 Linux 安装的易用安装程序。然而,这些功能只是 ebook2audiobooks 功能的冰山一角。

ebook2audiobook 结合使用开源人工智能项目,可以创建具有完整章节和元数据的有声读物,甚至还能进行语音克隆。为此,ebook2audiobook 采用兼容的非 DRM 电子书,并使用 Calibre 将其转换为可用格式。然后,将电子书分成若干章节,以帮助组织电子书的音频。最后,使用 Coqui XTTSv2 和 Fairseq 将电子书转换为音频。Coqui 提供的文本到语音模型可以生成高质量的音频,并允许用户使用自己的声音进行旁白。借助 Facebook 的 Fairseq 模型,用户可以使用超过 1,107 种语言。

虽然 2.0 版包含了在各种操作系统上进行本地安装的更简便方法,但该项目还托管在Hugging FaceGoogle Colab,使其更易于访问。不过,需要注意的是,将电子书转换成音频是一个漫长的过程。此外,使用 Hugging Face 转换电子书的用户受限于免费级别的处理能力,这将导致较慢的渲染时间和潜在的超时。不过,对于希望在本地运行该项目的用户来说,技术要求是合理的,因为该项目只需 4 GB 内存即可运行。如需了解更多信息或试用该项目,请访问下面的资源。

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 12 > 开源电子书有声读物转换器支持 1000 多种语言
Stephen Pereyra, 2024-12-30 (Update: 2024-12-30)