Notebookcheck Logo

Whisper-Medusa 是 aiOla 新推出的开源语音识别人工智能模型,声称比 OpenAI 的 Whisper 快 50%。

aiOla 是一家总部位于以色列的公司,它采用人工智能驱动的解决方案来实现纸质工作流程的数字化。(图片来源:aiOla)
aiOla 是一家总部位于以色列的公司,它采用人工智能驱动的解决方案来实现纸质工作流程的数字化。(图片来源:aiOla)
aiOla推出了开源人工智能模型Whisper-Medusa,旨在提高自动语音识别能力。结合 OpenAI 的 Whisper 和 aiOla 的技术,Whisper-Medusa 声称其运行速度比 Whisper 本身快 50%。该模型支持 100 多种语言,可将非结构化语音数据转化为可操作的见解,在航空、物流和医疗保健等行业大有可为。
AI Software

aiOla是一家总部位于以色列的公司,成立于 2019 年,专注于为纸质工作流程数字化提供人工智能驱动的解决方案。该公司最近推出了Whisper-Medusa,这是一个开源人工智能模型,结合了OpenAI的Whisper和 aiOla 技术的结合。它声称在保持高精确度的同时,运行速度可提高 50%以上。这种速度是通过一种独特的代币预测方法实现的,即一次预测十个代币,而不是一个代币。 OpenAI的 Whisper 中看到的那样。

Whisper-Medusa 采用弱监督方式开发。这一过程包括使用 Whisper 转录音频数据集,然后将其作为标签来训练 Medusa 的标记预测模块。

aiOla的技术通过其后台系统 "aiOla Jargonic "可以为各行各业的一线工人提供帮助。例如,在食品制造业,aiOla 通过将人工检查单转化为数字工作流程,简化了质量控制。该公司表示,整个过程 "就像上传您现有流程的照片或文件一样简单"。

Whisper-Medusa 支持 100 多种语言和各种口音,在航空、食品制造、物流和医疗保健等行业也很有用。通过将非结构化语音数据转化为可操作的见解,企业可以降低成本,改善资源分配。

感兴趣的人可以在Hugging FaceGitHub.

aiOla 的 Whisper-Medusa 号称比 OpenAI 的 Whisper 快 50%。(图片来源:aiOla)
aiOla 的 Whisper-Medusa 号称比 OpenAI 的 Whisper 快 50%。(图片来源:aiOla)

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 08 > Whisper-Medusa 是 aiOla 新推出的开源语音识别人工智能模型,声称比 OpenAI 的 Whisper 快 50%。
Anubhav Sharma, 2024-08- 4 (Update: 2024-08- 4)