创意工具 | Dibi8 | 代码吸收・AI 生金

手动视频分镜的时代结束了你有一个故事创意——两只猫和一只新来的猫咪之间的搞笑相遇。你想把它做成一个卡通短片。但即使是制作一个简单的动画视频，也需要写剧本、设计分镜、塑造一致的角色、拍摄场景、剪辑画面、添加音频——传统流程需要一支完整的创作团队来完成。如果只需描述你的创意，就能得到一个精美的成品视频呢？这正是 ViMax 能做到的事情。由香港科技大学（HKU）研究人员开发，ViMax 是一个开源的智能体 AI 框架，能够将原始创意、剧本甚至小说章节自动转化为完成的视频——无需分镜师、无需动画师、无需手动场景规划。只需描述、配置，然后让 AI 智能体处理一切。指标数值 GitHub 星标 3,600+（趋势中——Python Trending 每日增长 +108 星标）许可证 MIT 语言 Python 3.12 依赖管理 uv（超轻量化包管理器）智能体架构多智能体编排管线模型支持 Google Gemini、OpenRouter、MiniMax 图像生成 Nanobanana / Google API 视频生成 Veo / Google API 核心贡献者从启动以来活跃开发，已有 329 次提交 ViMax 是什么？ ViMax 不仅仅是另一个只能生成五秒片段的 AI 视频生成器。它是一个端到端视频创作引擎，建立在多智能体架构之上，处理专业视频制作的每一个阶段：剧本理解 — 从输入中提取角色、环境、风格意图和场景边界分镜设计 — 根据目标受众创建电影语言的镜头级分镜参考图选择 — 智能挑选视觉参考图，确保数百个镜头中的角色一致性自动化图像生成 — 生成逐帧视觉效果，附带空间定位逻辑一致性验证 — 使用 MLLM/VLM 模型验证角色和环境的一致性并行镜头渲染 — 同时处理连续镜头以实现高产出率音视频绑定 — 将配音和音效与视觉内容同步把它想象成一个整个电影剧组——导演、编剧、摄影师、剪辑师和音响设计师——根据你的创意方向自主工作。 ...