Buzz-v0.9.0 视频、音频、麦克风流转文本 开源

2次阅读
没有评论

功能

导入音频和视频文件并将转录导出为 TXT、SRT 和 VTT(演示)
从计算机的麦克风进行转录和翻译为文本(资源密集型,可能不是实时的,演示)
支持 Whisper、Whisper.cpp、Faster Whisper、Whisper 兼容的 Hugging Face 模型和 OpenAI Whisper API
命令行界面
适用于 Mac、Windows 和 Linux

v0.9.0 最新版本
更新内容

更新语言翻译
更新文档
发布到 PyPI
在 #626 中升级到 Whisper v3
修复 OpenAI API 转录音频限制
添加文件夹监视
更新 Linux Snap 构建
添加 URL 导入
修复 CLI 生成空文件名
将转录保存到 SQLite
修复 #685 中的 Linux Keyring 异常
在 #686 中添加转录文本查看器

Mac是收费版本 这里不提

Whisper多语言支持的好,如果就是汉语那么阿里的那个达摩也不错,那个本地部署稍微麻烦点
需要显卡 嗯 应该是N卡 否则会慢

介绍文档
Introduction | Buzz (chidiwilliams.github.io)
项目地址
chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper. (github.com)
下载地址
链接:https://pan.baidu.com/s/1yHP2ksXtvFDITAaJky8OaQ?pwd=aqmj
提取码:aqmj

正文完
 0
116博客
版权声明:本篇文章由 116博客 于2024-11-27发表,共计634字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码