重磅！OpenClaw下个版本支持视频生成，字节跳动、谷歌、阿里都支持

2026-04-06

关注CAIE，国内头部AI人才认证、培训体系，助你在职场升职加薪。

CAIE注册人工智能工程师

公众号作者

CAIE，全称 Certifed Artifcial Intelligence Engineer（人工智能工程师），简称 CAIE（赛一），是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

今早7点，OpenClaw之父Peter Steinberger宣布了一个重磅消息，下个版本的OpenClaw将原生支持视频生成功能。

最香的是直接兼容字节跳动、谷歌、fal、阿里千问等主流视频平台全都整合到了一起。

对咱们做内容、玩AI的人来说，再也不用挨个打开不同平台的网页、记不同的操作方式，一个工具就能搞定所有并且是自动化生成，省了超多时间和精力。

简单来说，就是你给段文字提示、参考图或者一个现成视频当参考，OpenClaw就能帮你生成新视频。

并会根据你的配置和手里的API密钥，自动挑最合适的平台来跑，完全不用自己手动选，特别省心。

只有当你配置了至少一个视频生成平台的API密钥后，里面的video_generate工具才会显示出来。

如果你的工具列表里没看到它，要么是没配API密钥，要么就是没设置默认的视频生成模型，把这两个地方弄好就行。

使用方法

根据最新官方文档显示，用起来也不复杂。

第一步先给任意一个支持的平台配置API密钥，比如谷歌的直接在命令行里输入exportGEMINI_API_KEY=你的密钥就行，把自己的密钥填进去就好。

第二步可以选做，要是你有固定想用的模型，就用openclawconfigset这个命令把它设为默认。

比如把谷歌的veo-3.1-fast-generate-preview设成首选，之后生成视频就会优先用这个模型，不用每次都选。

第三步，直接跟OpenClaw说你的需求就行，比如让它生成一段5秒的电影质感视频，画面是友善的龙虾在日落时冲浪，智能体会自动调用生成工具，根本不用额外配置什么白名单，输入指令等着就行。

那咱们发出指令后后台到底在干嘛，其实OpenClaw是支持异步处理的，不用一直守着电脑等结果，中间该干嘛干嘛。

当智能体接到指令调用工具后，OpenClaw会先把请求发给对应的平台，然后马上给你一个任务ID，这个ID留好，后面查进度要用。

接下来就是平台在后台处理任务了，耗时不一定，一般30秒到5分钟不等，主要看你选的平台和要生成的视频分辨率，分辨率越高，需要的时间会稍长一点。

等视频生成好，OpenClaw会自动唤醒你之前的会话，智能体就会把做好的视频直接发到对话里，你看到消息就是弄好了。

要是任务还在处理中，你再发一次生成指令也没关系，它不会重新开一个任务，只会告诉你当前的进度。

想主动查进度的话，用openclawtaskslist或者加上任务ID的show命令就行，在命令行里敲一下就有结果。

还有一种情况，要是你不是在会话里直接用，而是直接调用工具，那它就会变成内联生成模式，生成完直接给你视频文件的路径，不用等唤醒，两种方式都很方便。

支持哪些模型

这次OpenClaw支持的模型几乎把国内外的主流都囊括了，字节跳动、谷歌、阿里巴巴都在列，每个平台的默认模型、支持的输入方式都不一样，我把关键信息整理清楚了。

阿里通义千问用wan2.6-t2v做默认模型，支持文本、远程链接的图片和视频参考，需要配置对应的API密钥。

字节跳动、ComfyUI、fal、Minimax、Together、Vydra这几个平台，目前都只支持单张图片参考，不支持视频参考，各自有对应的默认模型和密钥配置要求。

谷歌、Runway、xAI这几个平台是功能比较全的，不仅支持文本和单张图片参考，还能放视频参考，生成的灵活性更高，适合有复杂需求的场景。

恭喜你顺利通过CAIE 注册人工智能工程师认证！你的 AI 专业能力已获官方认可。愿你继续在智能时代保持领先，持续进步、不断升级。