这篇文章主要讲,如何快速分析并总结视频要点。
通过之前的RSS,通常我们会得到视频的链接(Input),最终的输出(Output)我们希望是对视频的总结。因此有两个思路:
- 直接可以分析视频链接的模型。video URL → Gemini
- 先下载,接着转录成文本,然后进行分析。video URL → Download Video → Transcribe Recording → Any Chat Model
一、准备工作
因为可能涉及多个大模型API的调用,这里我使用的是一个聚合API 的网站,https://kg-api.cloud/ ,价格也会更合适。
测试视频我选择的是Tom在X上关于Trading的想法,链接是:https://video.twimg.com/ext_tw_video/1896873804321742848/pu/vid/avc1/720x1280/nmlnAb7oflld-Zee.mp4?tag=12
二、video URL → Gemini
Looks like bullshit:-(
三、video URL → Download Video → Transcribe Recording → Any Chat Model
其中,Transcribe Recording用的是OPENAI 的Whisper
有了Output的文本信息,剩下就好操作了,我们用Deepseek的r1模型进行总结。
从content 的内容来看,会比第一种方案的Gemini要更合理一些。
四、总结
正常来说,如果可以直接通过视频链接进行分析会更高效,但确实效果不好,可能是我没找到合适的模型;另外,通过Whisper有一个好处,就是转录的文本一方面方便保存,另一方面也方便分析。
下一篇内容,准备优先处理一些文字信息,比如微信公众号的整理输出。