Notebookcheck Logo

Mozilla Ocho 团队提供的 Whisperfile 可轻松实现本地 ASR

llamafile 项目(图片来源:Mozilla)
llamafile 项目(图片来源:Mozilla)
Mozilla 以创新和实验著称的团队将 OpenAI 的 Whisper 自动语音识别系统整合到了他们的 llamafile 项目中。该项目旨在以单个可执行文件的形式提供本地硬件友好的大型语言模型。在本地运行转录软件的能力可以为希望转录敏感音频的注重隐私的用户带来好处。
AI Linux / Unix MacBook Microsoft Windows

对于那些不熟悉llamafile项目,Mozilla Ocho 团队正致力于将 llama.cpp 和 Cosmopolitan Libc 这两种使用 C/C++ 编程语言的语言结合起来,以消除安装 LLM 的复杂性。Llamafile 使用 元的 LLaMA模型的推理,并将其与 Cosmopolitan Libc 对 C 语言的 "一次构建,随处运行 "转换结合起来。Cosmopolitan Libc 还消除了在 Linux、Mac 和 Windows 机器上运行 C 语言时对解释器或虚拟机的需求。

llamafile 项目的最新成员Whisperfile在 Mozilla 的 "Hugging Face "个人主页上有详细介绍。根据他们的页面,"Whisperfile 是 OpenAI's C 语言的高性能实现。 的高性能实现。作为 llamafile 项目的一部分,它基于 Georgi Gerganov 等人编写的 whisper.cpp 软件"。在该项目中,团队将模型所需的所有权重打包成 "whisperfiles",这些文件保留了 Cosmopolitan Libc 中的功能,使模型可以在大多数系统上运行。

该团队 GitHub 个人档案上的 "Whisperfile 入门 "文档详细介绍了一个简单的安装过程,只需三个步骤。用户下载模型、构建软件并运行程序后,就可以从三种不同的模型中进行选择,开始转录音频。模型的范围从小巧到大型,在转录过程中可以用速度换取准确性。此外,Whisperfile 还能使用多语言模型和"--translate "标志将不同语言翻译成英语。

有关 llamafile 和 Whisperfile 的信息以及安装过程的更多详情,请访问以下资源。

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 08 > Mozilla Ocho 团队提供的 Whisperfile 可轻松实现本地 ASR
Stephen Pereyra, 2024-08-23 (Update: 2024-08-23)