I am what I see_(2)视频分析

这篇文章主要讲,如何快速分析并总结视频要点。

通过之前的RSS,通常我们会得到视频的链接(Input),最终的输出(Output)我们希望是对视频的总结。因此有两个思路:

  • 直接可以分析视频链接的模型。video URL → Gemini
  • 先下载,接着转录成文本,然后进行分析。video URL → Download Video → Transcribe Recording → Any Chat Model

一、准备工作

因为可能涉及多个大模型API的调用,这里我使用的是一个聚合API 的网站,https://kg-api.cloud/ ,价格也会更合适。

测试视频我选择的是Tom在X上关于Trading的想法,链接是:https://video.twimg.com/ext_tw_video/1896873804321742848/pu/vid/avc1/720x1280/nmlnAb7oflld-Zee.mp4?tag=12

二、video URL → Gemini

Looks like bullshit:-(

三、video URL → Download Video → Transcribe Recording → Any Chat Model

其中,Transcribe Recording用的是OPENAI 的Whisper

有了Output的文本信息,剩下就好操作了,我们用Deepseek的r1模型进行总结。

从content 的内容来看,会比第一种方案的Gemini要更合理一些。

四、总结

正常来说,如果可以直接通过视频链接进行分析会更高效,但确实效果不好,可能是我没找到合适的模型;另外,通过Whisper有一个好处,就是转录的文本一方面方便保存,另一方面也方便分析。


下一篇内容,准备优先处理一些文字信息,比如微信公众号的整理输出。

You may also like

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注