热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_48007632
LDG_AGI
2 年前
trueweixin_48007632

《【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战》
本文在音频转文本的基础上,引入了视频转音频,这样可以采用二阶段法:先提取音频,再音频转文字的方法完成视频内容理解。之后可以配上LLM对视频内提取的文本进行一系列应用。
——来自博客
https://blog.csdn.net/weixin_48007632/article/details/140106912

你使用过FFmpeg吗(单选)
1 人已经参与 已结束
使用过
0人
没用过
1人
CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条:
昨天在黑客马拉松上遇见了@桃兜兜,他在两个月内将一个TikTok频道的粉丝数增长到了31k,100%由AI生成。
立即登录