MoneyPrinterTurbo:使用 AI 自动生成视频

    MoneyPrinterTurbo:使用 AI 自动生成视频 #

    简介 #

    在 YouTube、TikTok 和 Instagram 等平台上进行内容创作需要持续不断的视频内容供应。对于创作者和企业来说,手动制作视频既费时又昂贵。MoneyPrinterTurbo 是一个开源项目,可自动化整个视频创建流程。您只需提供文本提示或主题,AI 就会生成完整的视频,包括配音旁白、背景音乐、字幕和视觉素材——只需一条命令即可。

    什么是 MoneyPrinterTurbo? #

    MoneyPrinterTurbo 是一个基于 Python 的开源应用程序,它利用大型语言模型(LLM)和 AI 驱动的文本转语音引擎生成专业质量的视频。它专为"无脸频道"创作者设计——那些想建立 YouTube 影响力但不想露脸或使用自己声音的人。该项目支持多种语言、多种 AI 语音模型和可定制的视觉风格。

    应用程序处理整个流程:主题研究、脚本撰写、语音生成、音乐选择、视觉素材匹配、字幕创建和最终视频渲染。所有这些都通过清晰的 CLI 接口和可选的 Web UI 来编排。

    核心功能 #

    MoneyPrinterTurbo 集成了全面的功能集:

    • AI 脚本撰写:使用 LLM 从单一主题或提示生成引人入胜的视频脚本
    • 文本转语音:支持 20 多种语言的多 AI 语音模型,包括英语、中文、日语、韩语、西班牙语等
    • 背景音乐:根据视频情绪和内容自动选择免版税背景音乐
    • 自动字幕:从旁白音频生成同步字幕,支持可配置的字体和样式
    • 视觉素材匹配:提取相关图像和视频素材来补充旁白
    • 可定制输出:控制视频分辨率、纵横比(16:9、9:16 用于短视频)、持续时间和过渡效果
    • 批量处理:一次从主题列表生成多个视频
    • Web UI 和 CLI:在浏览器界面或命令行工作流程之间选择
    • 可扩展架构:通过插件系统添加自定义语音模型、音乐库和视觉素材

    安装 #

    MoneyPrinterTurbo 运行在 Python 3.10+ 上,需要 FFmpeg 进行视频渲染。以下是入门指南:

    前置要求 #

    首先安装 FFmpeg——它是所有视频操作所必需的:

    # Ubuntu/Debian
    sudo apt install ffmpeg
    
    # macOS
    brew install ffmpeg
    
    # Windows (使用 Chocolatey)
    choco install ffmpeg
    

    克隆并安装 #

    git clone https://github.com/HFrost665/MoneyPrinterTurbo.git
    cd MoneyPrinterTurbo
    pip install -r requirements.txt
    

    配置 API 密钥 #

    您需要一个 OpenAI 兼容的 API 密钥用于脚本生成。将其设置为环境变量:

    export OPENAI_API_KEY="your-api-key"
    export OPENAI_BASE_URL="https://api.openai.com/v1"
    

    对于语音生成,配置您偏好的 TTS 后端:

    # Azure TTS
    export AZURE_SPEECH_KEY="your-azure-key"
    export AZURE_SPEECH_REGION="eastus"
    
    # OpenAI TTS
    export OPENAI_TTS_KEY="your-openai-key"
    

    生成您的第一个视频 #

    通过 CLI 生成视频的最简单方法:

    python main.py \
      --topic "人工智能的历史" \
      --language zh \
      --voice zh-CN-XiaoxiaoNeural \
      --resolution 1920x1080 \
      --output ./output
    

    该命令生成一部关于 AI 历史的完整视频,使用 Aria 神经语音进行旁白,分辨率为 1080p,输出保存到 ./output 目录。

    自定义脚本 #

    您可以提供自己的脚本而不是使用 AI 生成:

    python main.py \
      --script ./my-script.txt \
      --language zh \
      --voice zh-CN-YunxiNeural \
      --output ./output
    

    批量生成视频 #

    从文本文件处理主题列表:

    python main.py \
      --topics-list ./topics.txt \
      --language zh \
      --voice zh-CN-XiaoxiaoNeural \
      --output ./output
    

    其中 topics.txt 每行包含一个主题:

    量子计算的未来
    区块链如何改变金融
    可再生能源的重要性
    

    Web UI 使用 #

    MoneyPrinterTurbo 还包括一个 Web 界面,可通过 http://localhost:8501 访问。UI 提供:

    • 新视频的主题输入框
    • 所有可用语音的选择下拉菜单
    • 视觉风格预设(极简、电影、教育、活力)
    • 纵横比选择器(横向、纵向、方形)
    • 长生成任务的进度跟踪
    • 已完成视频的下载链接
    # 启动 Web UI
    python main.py --ui
    

    然后在浏览器中打开 http://localhost:8501。

    API 编程访问 #

    为了集成到您自己的应用程序中,MoneyPrinterTurbo 提供 REST API:

    from moneyprinter import VideoGenerator
    
    generator = VideoGenerator(
        llm_model="gpt-4",
        tts_backend="azure",
        voice="en-US-AriaNeural"
    )
    
    result = generator.generate(
        topic="机器学习基础",
        language="zh",
        duration_minutes=5,
        aspect_ratio="16:9"
    )
    
    print(f"视频保存至: {result.video_path}")
    

    API 端点 #

    MoneyPrinterTurbo 暴露以下 REST 端点:

    # 从主题生成视频
    curl -X POST http://localhost:8080/api/v1/generate \
      -H "Content-Type: application/json" \
      -d '{"topic": "神经网络简介", "language": "zh", "voice": "zh-CN-XiaoxiaoNeural"}'
    
    # 获取生成状态
    curl http://localhost:8080/api/v1/status/{job-id}
    
    # 下载已完成的视频
    curl -O http://localhost:8080/api/v1/download/{job-id}
    

    高级配置 #

    自定义语音模型 #

    将自定义语音模型放入 voices/ 目录并在配置中注册:

    # config.yaml
    voices:
      custom:
        - name: "my-voice"
          language: "zh-CN"
          gender: "female"
          backend: "custom-tts"
          model_path: "./custom-voices/my-model.onnx"
    

    自定义音乐库 #

    mkdir -p ./music/calm
    mkdir -p ./music/energetic
    mkdir -p ./music/sad
    python main.py --music ./music/calm/
    

    视觉风格预设 #

    # config.yaml
    styles:
      cinematic:
        transition: "fade"
        font_family: "Georgia"
        font_size: 32
        subtitle_color: "#FFFFFF"
        background_style: "gradient"
    

    使用场景 #

    MoneyPrinterTurbo 服务于广泛的内容创作场景:

    无脸 YouTube 频道 #

    最常见的用例。为不露脸的频道生成教育性、激励性或信息性视频。主题范围从"十大太空发现"到"古代文明历史"。

    社交媒体内容 #

    为 TikTok、Instagram Reels 和 YouTube Shorts 创建短视频内容。使用 9:16 纵向纵横比和快节奏编辑以实现最大参与度。

    在线教育视频 #

    将书面课程或文章转化为引人入胜的视频课程。AI 脚本撰写功能可以将密集的技术内容转化为易于理解的旁白。

    新闻摘要 #

    输入当前事件主题,生成每日新闻摘要视频。这对于需要快速产生内容的内容聚合频道来说非常理想。

    产品展示 #

    为电子商务列表生成产品展示视频。描述产品功能,MoneyPrinterTurbo 就会创建精美的旁白视频。

    对比:MoneyPrinterTurbo 与替代方案 #

    功能MoneyPrinterTurboPictoryInVideo AILumen5Synthesia
    开源
    自托管
    免费版本完全免费有限有限有限仅试用
    自定义 AI 语音有限有限有限
    多语言20+10+5+5+12+
    脚本生成
    背景音乐自动选择手动自动手动有限
    字幕定制完整有限有限有限有限
    API 访问付费付费付费付费
    纵横比控制完整有限完整有限有限
    批量处理
    Web UI
    CLI 界面
    平台本地/云

    对比:手动视频制作与 MoneyPrinterTurbo #

    方面手动制作MoneyPrinterTurbo
    脚本撰写每个视频 1-2 小时10 秒
    录音30 分钟设置即时
    视频编辑2-4 小时1 分钟
    音乐版权需要研究自动包含
    字幕制作手动或付费工具自动
    每个视频总时间4-8 小时不到 5 分钟
    每个视频成本$50-200(自由职业者)仅 API 成本
    一致性可变高(相同声音/风格)
    可扩展性受时间限制受 API 调用限制

    与内容排程集成 #

    您可以将 MoneyPrinterTurbo 与排程工具集成以自动化内容流程:

    import schedule
    import time
    from moneyprinter import VideoGenerator
    
    def generate_daily_video():
        generator = VideoGenerator(llm_model="gpt-4", tts_backend="azure")
        generator.generate(topic="今日科学", language="zh", output="./scheduled-videos/")
    
    # 每天上午 8 点生成新视频
    schedule.every().day.at("08:00").do(generate_daily_video)
    
    while True:
        schedule.run_pending()
        time.sleep(60)
    

    局限性 #

    虽然 MoneyPrinterTurbo 是一个强大的工具,但它有几个重要的局限性:

    1. API 成本:LLM 和 TTS API 有使用成本。一个 5 分钟的视频可能花费 $0.50-$2.00,具体取决于所选模型和语音。
    2. 语音质量差异:某些 AI 语音听起来比其他的更自然。不同语音模型和语言之间的质量差异很大。
    3. 视觉素材相关性:视觉素材匹配基于关键字提取,可能无法始终捕捉旁白的细微上下文。
    4. 音乐情绪匹配:音乐选择基于启发式算法,可能不会完美匹配预期的情感基调。
    5. 仅单旁白:每个视频使用单一语音。目前不支持多旁白对话或辩论风格视频。
    6. 无视觉角色动画:该工具从素材视频和图像生成视频,而不是来自动画角色或虚拟人。
    7. 语言细微差别:虽然支持多语言,但在脚本生成中文化细微差别和习语可能无法完美翻译。
    8. 平台特定优化:视频以通用格式渲染。平台特定优化(YouTube 缩略图、TikTok 覆盖层)未内置。

    常见问题(FAQ) #

    Q1:MoneyPrinterTurbo 支持哪些 AI 服务? #

    支持 OpenAI GPT 用于脚本生成、Azure Cognitive Services 用于文本转语音和 OpenAI TTS。还可以通过插件系统接入自定义 LLM 和 TTS 后端。

    Q2:我可以将 MoneyPrinterTurbo 用于商业内容吗? #

    可以。由于项目是开源的且使用免版税音乐素材,您可以生成用于商业用途的视频。但请检查您选择的 LLM 和 TTS API 的许可条款,因为它们可能有自己的商业使用限制。

    Q3:生成一个视频需要多长时间? #

    生成时间取决于视频长度和 AI API 的速度。典型的 5 分钟视频生成需要约 1-3 分钟,包括脚本撰写、语音合成和视频渲染。

    Q4:MoneyPrinterTurbo 可以离线使用吗? #

    核心视频渲染(基于 FFmpeg)可以离线工作。但是 AI 脚本生成和文本转语音需要联网访问配置好的 API 提供商。

    Q5:生成视频前可以编辑 AI 生成的脚本吗? #

    可以。--script 标志允许您提供自己的脚本文件。使用 --topic 标志生成草稿后,可以在重新运行生成之前查看和编辑生成的脚本。

    Q6:输出支持哪些视频格式? #

    默认输出标准 MP4(H.264)文件。您可以在配置文件中通过 FFmpeg 选项配置输出格式来生成 WebM、AVI 等其他格式。

    Q7:MoneyPrinterTurbo 可以在 Windows 上运行吗? #

    可以。MoneyPrinterTurbo 在 Windows 上与 Python 3.10+ 兼容。安装 Windows 版 FFmpeg 并确保所有 Python 依赖已安装。CLI 和 Web UI 在所有平台上工作方式相同。

    来源 #

    1. MoneyPrinterTurbo 官方仓库:https://github.com/HFrost665/MoneyPrinterTurbo
    2. FFmpeg 文档:https://ffmpeg.org/documentation.html
    3. Azure Cognitive Services TTS:https://azure.microsoft.com/services/cognitive-services/text-to-speech/
    4. OpenAI API 文档:https://platform.openai.com/docs/
    5. YouTube 创作者学院:https://creatoracademy.youtube.com/

    行动号召 #

    准备好自动化您的视频内容创作了吗?今天就试用 MoneyPrinterTurbo,开始规模化生产专业质量的视频。

    更多信息,加入我们的 Telegram 社区:https://t.me/DIBI8_Group/4

    推荐工具:

    • Binance:在 Binance 开始交易。立即注册:https://www.bsmkweb.cc/register?ref=DIBI8
    • OKX 交易所:在 OKX 上交易。注册:https://www.promoohubly.com/join/12190433
    • WebShare:使用 WebShare 匿名浏览。开始使用:https://www.webshare.io/?referral_code=oa14d5f0wx4f
    • DigitalOcean:在 DigitalOcean 上部署项目。注册:https://m.do.co/c/eca87ac14ee0
    • HTStack:管理您的云基础设施。加入:https://my.htstack.com/aff.php?aff=27187

    DIBI8 是您发现最佳开源工具、AI 创新和开发者资源的门户。订阅我们的 Telegram 频道获取每日更新。

    💬 留言讨论