重磅!OpenClaw下个版本支持视频生成,字节跳动、谷歌、阿里都支持

2026-04-06

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

今早7点,OpenClaw之父Peter Steinberger宣布了一个重磅消息,下个版本的OpenClaw将原生支持视频生成功能。

最香的是直接兼容字节跳动、谷歌、fal、阿里千问等主流视频平台全都整合到了一起。

对咱们做内容、玩AI的人来说,再也不用挨个打开不同平台的网页、记不同的操作方式,一个工具就能搞定所有并且是自动化生成,省了超多时间和精力。

简单来说,就是你给段文字提示、参考图或者一个现成视频当参考,OpenClaw就能帮你生成新视频。

并会根据你的配置和手里的API密钥,自动挑最合适的平台来跑,完全不用自己手动选,特别省心。

只有当你配置了至少一个视频生成平台的API密钥后,里面的video_generate工具才会显示出来。

如果你的工具列表里没看到它,要么是没配API密钥,要么就是没设置默认的视频生成模型,把这两个地方弄好就行。

使用方法

根据最新官方文档显示,用起来也不复杂。

第一步先给任意一个支持的平台配置API密钥,比如谷歌的直接在命令行里输入exportGEMINI_API_KEY=你的密钥就行,把自己的密钥填进去就好。

第二步可以选做,要是你有固定想用的模型,就用openclawconfigset这个命令把它设为默认。

比如把谷歌的veo-3.1-fast-generate-preview设成首选,之后生成视频就会优先用这个模型,不用每次都选。

第三步,直接跟OpenClaw说你的需求就行,比如让它生成一段5秒的电影质感视频,画面是友善的龙虾在日落时冲浪,智能体会自动调用生成工具,根本不用额外配置什么白名单,输入指令等着就行。

那咱们发出指令后后台到底在干嘛,其实OpenClaw是支持异步处理的,不用一直守着电脑等结果,中间该干嘛干嘛。

当智能体接到指令调用工具后,OpenClaw会先把请求发给对应的平台,然后马上给你一个任务ID,这个ID留好,后面查进度要用。

接下来就是平台在后台处理任务了,耗时不一定,一般30秒到5分钟不等,主要看你选的平台和要生成的视频分辨率,分辨率越高,需要的时间会稍长一点。

等视频生成好,OpenClaw会自动唤醒你之前的会话,智能体就会把做好的视频直接发到对话里,你看到消息就是弄好了。

要是任务还在处理中,你再发一次生成指令也没关系,它不会重新开一个任务,只会告诉你当前的进度。

想主动查进度的话,用openclawtaskslist或者加上任务IDshow命令就行,在命令行里敲一下就有结果。

还有一种情况,要是你不是在会话里直接用,而是直接调用工具,那它就会变成内联生成模式,生成完直接给你视频文件的路径,不用等唤醒,两种方式都很方便。

支持哪些模型

这次OpenClaw支持的模型几乎把国内外的主流都囊括了,字节跳动、谷歌、阿里巴巴都在列,每个平台的默认模型、支持的输入方式都不一样,我把关键信息整理清楚了。

阿里通义千问用wan2.6-t2v做默认模型,支持文本、远程链接的图片和视频参考,需要配置对应的API密钥。

字节跳动、ComfyUIfalMinimaxTogetherVydra这几个平台,目前都只支持单张图片参考,不支持视频参考,各自有对应的默认模型和密钥配置要求。

谷歌、RunwayxAI这几个平台是功能比较全的,不仅支持文本和单张图片参考,还能放视频参考,生成的灵活性更高,适合有复杂需求的场景。

确定要退出登录吗?
确定 取消