/ 目录 / 演练场 / video-podcast-maker
● 社区 Agents365-ai 🔑 需要你的密钥

video-podcast-maker

作者 Agents365-ai · Agents365-ai/video-podcast-maker

从想法到 Bilibili / YouTube 播客视频,一气呵成——脚本撰写、多声道 TTS、自动剪辑、多语言,全部内置。

video-podcast-maker 是一个 Claude Code skill,接收话题或文章,输出视频播客资产:双主持人剧本、通过 6 个 TTS 引擎(Edge / Azure / OpenAI 等)合成的多声道音频、B-roll 风格视觉素材,以及可上传 Bilibili/YouTube 的成品视频。开箱即支持 zh-CN 和 en-US 双语。

为什么要用

核心特性

实时演示

实际使用效果

就绪

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "video-podcast-maker-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "video-podcast-maker-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/Agents365-ai/video-podcast-maker",
          "~/.claude/skills/video-podcast-maker"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add video-podcast-maker-skill -- git clone https://github.com/Agents365-ai/video-podcast-maker ~/.claude/skills/video-podcast-maker

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: video-podcast-maker

将一篇博客文章转化为播客风格视频

👤 复用文字内容的内容创作者 ⏱ ~60 min intermediate

何时使用: 你有一篇长文,想转成 10 分钟的视频发布到 YouTube/B站。

前置条件
  • Skill 已安装 — git clone https://github.com/Agents365-ai/video-podcast-maker ~/.claude/skills/video-podcast-maker
  • TTS 引擎凭证 — 设置你选择的引擎对应的环境变量(如 AZURE_TTS_KEY)
步骤
  1. 生成脚本
    Use video-podcast-maker. From post.md, write a two-host script (10 min) in en-US. Hosts: Alice (analytical), Bob (curious).✓ 已复制
    → 含 Alice/Bob 对白的逐段脚本
  2. 渲染声音
    Render with Azure TTS — Alice: en-US-JennyNeural, Bob: en-US-GuyNeural.✓ 已复制
    → 两条 MP3 音轨;对齐元数据
  3. 剪辑合成
    Assemble video: title card, b-roll keywords from script, host avatars, captions.✓ 已复制
    → MP4 已就绪,1920×1080
  4. 上传
    Push to YouTube as unlisted with description + tags from the script.✓ 已复制
    → YouTube 链接

结果: 一篇长文不到一小时即可转成精良的播客视频。

注意事项
  • TTS 对技术术语的发音有误 — 在脚本中为难读词预标注音标提示;大多数引擎都支持
搭配使用: humanizer-skill

按固定节奏运营某话题的每周播客

👤 有发布频率的细分话题创作者 ⏱ ~45 min advanced

何时使用: 你想在 AI/Web3 或其他领域做每周五更新的播客——自动化执行。

步骤
  1. 定义主持人人设
    Set host personas: Alice (skeptic), Bob (enthusiast). Save as default.✓ 已复制
    → 人设文件已保存
  2. 拉取每周新闻
    Use video-podcast-maker. Pull this week's top 5 stories on <topic> from RSS feeds. Generate the script.✓ 已复制
    → 含 5 个版块的脚本
  3. 渲染并发布
    Render and publish to YouTube + Bilibili at Friday 9am.✓ 已复制
    → 两个平台都已有本期节目

结果: 持续输出每周内容;每期制作几乎零人工干预。

注意事项
  • 几期之后 AI 声音听起来千篇一律 — 轮换人设;变换引擎;加入真实的片头音乐
搭配使用: duckduckgo-mcp

将英文播客本地化为中文版(或反之)

👤 服务跨语言受众的创作者 ⏱ ~50 min intermediate

何时使用: 你有一个英文播客,想制作中文版发布到 B站,使用原生声音。

步骤
  1. 翻译脚本
    Use video-podcast-maker. Translate script from en-US to zh-CN preserving the conversational tone.✓ 已复制
    → 保留文化语境的 zh-CN 脚本,而非逐字翻译
  2. 用原生声音渲染
    Render with zh-CN voices (e.g. Azure XiaoxiaoNeural + YunxiNeural).✓ 已复制
    → 原生品质的音频
  3. 重新剪辑并上传至 B站
    Use the same b-roll; new audio; new captions in zh-CN. Upload to B站.✓ 已复制
    → B站链接

结果: 地道的跨语言版本,而非翻译磁带。

注意事项
  • 直译会丢失惯用语 — Skill 已配置为进行文化适配;请手动审查笑话和文化典故

组合

与其他 MCP 搭配,撬动十倍杠杆

video-podcast-maker-skill + humanizer-skill

去除生成脚本中的 AI 痕迹

Run humanizer on the script before TTS — sound less generated, more conversational.✓ 已复制
video-podcast-maker-skill + duckduckgo-mcp

为脚本抓取最新新闻

Search latest <topic> stories; feed top 5 into make_script.✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
make_script source_text, hosts, length_min, language 第一步——撰写脚本 LLM tokens
render_tts script, engine, voices 脚本审批后 TTS engine quota / $
assemble_video audio_tracks, b_roll_keywords, theme 最终剪辑合成 Local CPU/GPU
publish platform, mp4_path, metadata 推送到 YouTube / Bilibili 0
translate_script script, target_language 本地化步骤 LLM tokens

成本与限制

运行它的成本

API 配额
TTS 引擎有按字符计费的限额;Azure 免费层约 50 万字符/月
每次调用 Token 数
脚本约 3k–6k token;视频合成在本地进行
费用
Skill 免费;按 TTS 引擎 + LLM 付费
提示
草稿阶段使用 Edge TTS(免费);仅在生产版本时使用 Azure/ElevenLabs

安全

权限、密钥、影响范围

最小权限: filesystem-write (output)
凭据存储: 引擎 API key 通过环境变量传入;YouTube/Bilibili token 存放在 secrets 文件中
数据出站: TTS 引擎、LLM 提供商、目标平台
切勿授予: 不要使用可以无需确认就在你的频道发布内容的公开 OAuth token

故障排查

常见错误与修复

TTS 截断了长台词

大多数引擎对单句有约 250 字符的限制;Skill 会自动拆分,但请验证长句

长时间渲染中出现音频漂移

分段渲染,用交叉渐变拼接——Skill 对超过 5 分钟的内容默认执行此操作

B站上传失败

验证 secrets 文件中的 cookies;B站有时需要重新登录

字幕不同步

重新运行对齐;部分 TTS 引擎的时间报告不准确——Skill 有重新同步模式

替代方案

video-podcast-maker 对比其他方案

替代方案何时用它替代权衡
ElevenLabs Studio你想要精良的 SaaS 界面成本更高;对话中的自动化程度较低
NotebookLM Audio Overview你想从任意来源一键生成双主持人音频摘要无视频;控制度较低;仅限云端

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills