#AI开源项目推荐：VoiceStreamAIVoiceStreamAI 是一个可以自己托管的 Whisper 解决方案，服务端是 Python，客户端是 JS，基于 WebSocket 实时通信，可以做到语音的实时传输和文本转换。系统内部运用了来自Huggingface的语音活动检测（Voice Activity Detection，…

发布时间: 2023-12-30 07:50:08

1分

数据加载中

#AI开源项目推荐：VoiceStreamAI
VoiceStreamAI 是一个可以自己托管的 Whisper 解决方案，服务端是 Python，客户端是 JS，基于 WebSocket 实时通信，可以做到语音的实时传输和文本转换。
系统内部运用了来自Huggingface的语音活动检测（Voice Activity Detection，…
IT技术
( twitter.com )

#AI开源项目推荐：VoiceStreamAI

VoiceStreamAI 是一个可以自己托管的 Whisper 解决方案，服务端是 Python，客户端是 JS，基于 WebSocket 实时通信，可以做到语音的实时传输和文本转换。

系统内部运用了来自Huggingface的语音活动检测（Voice Activity Detection， VAD）技术，以及来自OpenAI的Whisper模型，从而实现对语音的准确识别和处理。

功能
- 支持WebSocket，实现实时音频流的传输。
- 采用来自Huggingface的VAD技术，对语音活动进行精确检测。
- 利用来自OpenAI的Whisper模型，完成语音转写。
- 可针对音频块进行个性化处理。
- 具备多语言转写功能。

https://t.co/vr6iKdrCeq

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

IT技术

#AI开源项目推荐：GFPGAN
腾讯开源的AI模型GFPGAN，能帮助恢复老照片

项目地址：
在线测试地址：
IT技术
( twitter.com)

IT技术

#AI开源项目推荐：Real-ESRGAN
实用的图像/视频修复算法

🔗
IT技术

开源推荐
( github.com)

IT技术

开源推荐

#AI开源项目推荐：wav2lip

可以音频输入生成口型同步视频。

项目首页：
代码仓库：
论文：

视频来源：

IT技术
( twitter.com)

IT技术

#AI开源项目推荐：screenshot-to-code
借助GPT-4V，直接把屏幕截图生成HTML网页
IT技术
( twitter.com)

IT技术

AI开源项目推荐：Tune-A-Video
通过文本直接生成视频。

BTW：蔡徐坤都火到AI圈了😄
漫画
( github.com)

漫画

#AI开源项目推荐#：Video-LLaVA
北京大学的多模态图像视频识别
论文摘要：…
IT技术
( twitter.com)

IT技术

#AI开源项目推荐： Novel
Novel 是一款 Notion 风格的所见即所得编辑器，集成了 AI ，可以借助 AI 自动写作内容。
IT技术
( github.com)

IT技术

#AI开源项目推荐：qingwu-zimu
青梧字幕是一款基于whisper的AI字幕提取工具，有完整的字幕提取、翻译和导出功能。
项目地址：
IT技术
( github.com)

IT技术

#开源项目推荐：minosoft
用 Kotlin 从头写的一个开源 Minecraft
IT技术
( github.com)

IT技术

开源项目推荐：ChatGPT资料汇总学习


漫画
( github.com)

漫画

IT技术

#AI开源项目推荐：GFPGAN 腾讯开源的AI模型GFPGAN，能帮助恢复老照片 项目地址： 在线测试地址： IT技术 ( twitter.com)

IT技术

#AI开源项目推荐：Real-ESRGAN 实用的图像/视频修复算法 🔗 IT技术 开源推荐 ( github.com)

IT技术

开源推荐

#AI开源项目推荐：wav2lip 可以音频输入生成口型同步视频。 项目首页： 代码仓库： 论文： 视频来源： IT技术 ( twitter.com)

IT技术

#AI开源项目推荐：screenshot-to-code 借助GPT-4V，直接把屏幕截图生成HTML网页 IT技术 ( twitter.com)

IT技术

AI开源项目推荐：Tune-A-Video 通过文本直接生成视频。 BTW：蔡徐坤都火到AI圈了😄 漫画 ( github.com)

漫画

#AI开源项目推荐#：Video-LLaVA 北京大学的多模态图像视频识别 论文摘要：… IT技术 ( twitter.com)

IT技术

#AI开源项目推荐： Novel Novel 是一款 Notion 风格的所见即所得编辑器，集成了 AI ，可以借助 AI 自动写作内容。 IT技术 ( github.com)

IT技术

#AI开源项目推荐：qingwu-zimu 青梧字幕是一款基于whisper的AI字幕提取工具，有完整的字幕提取、翻译和导出功能。 项目地址： IT技术 ( github.com)

IT技术

#开源项目推荐：minosoft 用 Kotlin 从头写的一个开源 Minecraft IT技术 ( github.com)

IT技术

开源项目推荐：ChatGPT资料汇总学习 漫画 ( github.com)

漫画

创建一个新帐户

登录

#AI开源项目推荐：GFPGAN
腾讯开源的AI模型GFPGAN，能帮助恢复老照片

项目地址：
在线测试地址：
IT技术
( twitter.com)

#AI开源项目推荐：Real-ESRGAN
实用的图像/视频修复算法

🔗
IT技术

开源推荐
( github.com)

#AI开源项目推荐：wav2lip

可以音频输入生成口型同步视频。

项目首页：
代码仓库：
论文：

视频来源：

IT技术
( twitter.com)

#AI开源项目推荐：screenshot-to-code
借助GPT-4V，直接把屏幕截图生成HTML网页
IT技术
( twitter.com)

AI开源项目推荐：Tune-A-Video
通过文本直接生成视频。

BTW：蔡徐坤都火到AI圈了😄
漫画
( github.com)

#AI开源项目推荐#：Video-LLaVA
北京大学的多模态图像视频识别
论文摘要：…
IT技术
( twitter.com)

#AI开源项目推荐： Novel
Novel 是一款 Notion 风格的所见即所得编辑器，集成了 AI ，可以借助 AI 自动写作内容。
IT技术
( github.com)

#AI开源项目推荐：qingwu-zimu
青梧字幕是一款基于whisper的AI字幕提取工具，有完整的字幕提取、翻译和导出功能。
项目地址：
IT技术
( github.com)

#开源项目推荐：minosoft
用 Kotlin 从头写的一个开源 Minecraft
IT技术
( github.com)

开源项目推荐：ChatGPT资料汇总学习

漫画
( github.com)