《【机器学习】FFmpeg+Whisper：二阶段法视频理解-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_48007632

《【机器学习】FFmpeg+Whisper：二阶段法视频理解（video-to-text）大模型实战》
本文在音频转文本的基础上，引入了视频转音频，这样可以采用二阶段法：先提取音频，再音频转文字的方法完成视频内容理解。之后可以配上LLM对视频内提取的文本进行一系列应用。
——来自博客 https://blog.csdn.net/weixin_48007632/article/details/140106912

你使用过FFmpeg吗(单选)

1 人已经参与已结束

使用过

0人

没用过

1人

CSDN App 扫码分享

分享

评论

点赞

复制链接
举报

下一条：

昨天在黑客马拉松上遇见了@桃兜兜，他在两个月内将一个TikTok频道的粉丝数增长到了31k，100%由AI生成。