01 灵感来源
不知道大家有没有在B站刷到过 3Blue1Brown 的科普视频,我记得以前学线性代数的时候,就经常看他们的视频,他们把复杂的概念用图像化的方式展示出来,对理解有很大帮助。
前段时间 DeepSeek 发布了它的技术报告,我也去看了一眼,但说实话,我也看不太懂…这时候我就想到——是不是能参考3Blue1Brown,用视频的方式来解读DeepSeek的技术报告。
02 技术方案
于是开始研究,我发现3Blue1Brown是用的 Manim 这个动画引擎,然后做视频还有Remote和HyperFrames框架,
我把他们都接入到了本地,各自适合不同的场景:
接下来我就让AI出方案,它建议我用 Manim 做算法可视化,HyperFrames 做图文串场,组合起来做成一个完整的科普视频。
然后它帮我在项目文件夹里创建产物、源文件和素材。
全程我只负责告诉它用什么框架、跟它讨论怎么设计、语音怎么接。一开始出的视频是没有配音的,我让它帮我找,它找到了一个微软开源的语音项目,可以给视频配音,我就接进来了。最后就生成了下面这样一段视频。
03 成果与展望
虽然目前还比较粗糙,我还没怎么进一步优化,但总体来说已经远超我的预期。
通过这种方式,可以把难以理解的文本技术报告做成视频,方便我们学习,有的朋友需要做科普视频的时候,也能使用这个方法降低工作量。