I am what I see_(2)视频分析

这篇文章主要讲，如何快速分析并总结视频要点。

通过之前的RSS，通常我们会得到视频的链接（Input），最终的输出（Output）我们希望是对视频的总结。因此有两个思路：

直接可以分析视频链接的模型。video URL → Gemini
先下载，接着转录成文本，然后进行分析。video URL → Download Video → Transcribe Recording → Any Chat Model

因为可能涉及多个大模型API的调用，这里我使用的是一个聚合API 的网站，https://kg-api.cloud/ ，价格也会更合适。

Looks like bullshit:-(

其中，Transcribe Recording用的是OPENAI 的Whisper

有了Output的文本信息，剩下就好操作了，我们用Deepseek的r1模型进行总结。

从content 的内容来看，会比第一种方案的Gemini要更合理一些。

正常来说，如果可以直接通过视频链接进行分析会更高效，但确实效果不好，可能是我没找到合适的模型；另外，通过Whisper有一个好处，就是转录的文本一方面方便保存，另一方面也方便分析。