/ Каталог / Песочница / video-podcast-maker
● Сообщество Agents365-ai 🔑 Нужен свой ключ

video-podcast-maker

автор Agents365-ai · Agents365-ai/video-podcast-maker

От идеи до подкаст-видео для Bilibili / YouTube за один флоу — написание сценария, многоголосый TTS, автоматическая сборка, многоязычность.

video-podcast-maker — Claude Code-скилл, который берёт тему или статью и создаёт видеоподкаст-ресурс: сценарий с двумя ведущими, многоголосый TTS через 6 движков (Edge / Azure / OpenAI и др.), b-roll визуалы и готовое видео для Bilibili/YouTube. Из коробки поддерживает zh-CN и en-US.

Зачем использовать

Ключевые функции

Живое демо

Как выглядит на практике

готово

Установка

Выберите клиент

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

Откройте Claude Desktop → Settings → Developer → Edit Config. Перезапустите после сохранения.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

Cursor использует ту же схему mcpServers, что и Claude Desktop. Конфиг проекта приоритетнее глобального.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

Щёлкните значок MCP Servers на боковой панели Cline, затем "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "video-podcast-maker-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ],
      "_inferred": true
    }
  }
}

Тот же формат, что и Claude Desktop. Перезапустите Windsurf для применения.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "video-podcast-maker-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/Agents365-ai/video-podcast-maker",
        "~/.claude/skills/video-podcast-maker"
      ]
    }
  ]
}

Continue использует массив объектов серверов, а не map.

~/.config/zed/settings.json
{
  "context_servers": {
    "video-podcast-maker-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/Agents365-ai/video-podcast-maker",
          "~/.claude/skills/video-podcast-maker"
        ]
      }
    }
  }
}

Добавьте в context_servers. Zed перезагружается автоматически.

claude mcp add video-podcast-maker-skill -- git clone https://github.com/Agents365-ai/video-podcast-maker ~/.claude/skills/video-podcast-maker

Однострочная команда. Проверить: claude mcp list. Удалить: claude mcp remove.

Сценарии использования

Реальные сценарии: video-podcast-maker

Конвертировать пост блога в подкаст-видео

👤 Авторы контента, перерабатывающие написанные материалы ⏱ ~60 min intermediate

Когда использовать: Есть длинный пост и нужно 10-минутное видео для YouTube/B站.

Предварительные требования
  • Скилл установлен — git clone https://github.com/Agents365-ai/video-podcast-maker ~/.claude/skills/video-podcast-maker
  • Учётные данные TTS-движка — Установить env var для выбранного движка (например, AZURE_TTS_KEY)
Поток
  1. Сгенерировать сценарий
    Use video-podcast-maker. From post.md, write a two-host script (10 min) in en-US. Hosts: Alice (analytical), Bob (curious).✓ Скопировано
    → Сценарий по ходу с репликами Alice/Bob
  2. Озвучить
    Render with Azure TTS — Alice: en-US-JennyNeural, Bob: en-US-GuyNeural.✓ Скопировано
    → Две MP3-дорожки; метаданные выравнивания
  3. Собрать
    Assemble video: title card, b-roll keywords from script, host avatars, captions.✓ Скопировано
    → MP4 готов, 1920×1080
  4. Загрузить
    Push to YouTube as unlisted with description + tags from the script.✓ Скопировано
    → YouTube URL

Итог: Полированное подкаст-видео из одного длинного поста менее чем за час.

Подводные камни
  • TTS произносит технические термины неверно — Заранее помечайте сложные слова в сценарии фонетическими подсказками; поддерживается большинством движков
Сочетать с: humanizer-skill

Вести еженедельный подкаст по теме с постоянными ведущими

👤 Авторы нишевых тем с регулярным расписанием ⏱ ~45 min advanced

Когда использовать: Нужен автоматизированный пятничный подкаст по AI/Web3/другой теме.

Поток
  1. Задать персонажей
    Set host personas: Alice (skeptic), Bob (enthusiast). Save as default.✓ Скопировано
    → Файл персонажей сохранён
  2. Собрать еженедельные новости
    Use video-podcast-maker. Pull this week's top 5 stories on <topic> from RSS feeds. Generate the script.✓ Скопировано
    → Сценарий с 5 сегментами
  3. Озвучить и опубликовать
    Render and publish to YouTube + Bilibili at Friday 9am.✓ Скопировано
    → Эпизод на обеих платформах

Итог: Стабильный еженедельный контент; почти нулевые усилия на эпизод.

Подводные камни
  • Голоса ИИ звучат одинаково после нескольких эпизодов — Ротировать персонажей; менять движок; добавить настоящие вступительные заставки
Сочетать с: duckduckgo-mcp

Локализовать английский подкаст на китайский (или наоборот)

👤 Авторы для разноязычной аудитории ⏱ ~50 min intermediate

Когда использовать: Есть английский подкаст и нужна китайская версия для B站 с native-голосами.

Поток
  1. Перевести сценарий
    Use video-podcast-maker. Translate script from en-US to zh-CN preserving the conversational tone.✓ Скопировано
    → Сценарий на zh-CN с культурной адаптацией, а не буквальным переводом
  2. Озвучить native-голосами
    Render with zh-CN voices (e.g. Azure XiaoxiaoNeural + YunxiNeural).✓ Скопировано
    → Аудио native-качества
  3. Пересобрать и загрузить на Bilibili
    Use the same b-roll; new audio; new captions in zh-CN. Upload to B站.✓ Скопировано
    → B站 URL

Итог: Аутентичная версия на другом языке, а не переводная запись.

Подводные камни
  • Буквальный перевод теряет идиомы — Скилл настроен на культурную адаптацию; шутки и отсылки проверяйте вручную

Комбинации

Сочетайте с другими MCP — эффект x10

video-podcast-maker-skill + humanizer-skill

Убрать ИИ-следы из сгенерированных сценариев

Run humanizer on the script before TTS — sound less generated, more conversational.✓ Скопировано
video-podcast-maker-skill + duckduckgo-mcp

Получить свежие новости для сценария

Search latest <topic> stories; feed top 5 into make_script.✓ Скопировано

Инструменты

Что предоставляет этот MCP

ИнструментВходные данныеКогда вызыватьСтоимость
make_script source_text, hosts, length_min, language Шаг 1 — написание сценария LLM tokens
render_tts script, engine, voices После утверждения сценария TTS engine quota / $
assemble_video audio_tracks, b_roll_keywords, theme Финальная сборка Local CPU/GPU
publish platform, mp4_path, metadata Загрузка на YouTube / Bilibili 0
translate_script script, target_language Шаг локализации LLM tokens

Стоимость и лимиты

Во что обходится

Квота API
TTS-движки имеют ограничения по символам; Azure бесплатный уровень ~500k символов/месяц
Токенов на вызов
Сценарий ~3k–6k токенов; сборка локальная
Деньги
Скилл бесплатный; платить за TTS-движок + LLM
Совет
Используйте Edge TTS (бесплатно) для черновиков; Azure/ElevenLabs только для продакшена

Безопасность

Права, секреты, радиус поражения

Минимальные скоупы: filesystem-write (output)
Хранение учётных данных: API-ключи движков через env vars; токены YouTube/Bilibili в файле секретов
Исходящий трафик: TTS-движки, LLM-провайдер, целевые платформы
Никогда не давайте: Public OAuth tokens that could post on your channel without confirmation

Устранение неполадок

Частые ошибки и исправления

TTS обрезает длинные строки

Большинство движков ограничивают ~250 символами; скилл авторазбивает, но проверяйте длинные предложения

Drift аудио при длинном рендере

Рендерить по частям, соединять с crossfade — скилл делает это по умолчанию для >5 мин

Загрузка на B站 не удаётся

Проверить cookies в файле секретов; B站 иногда требует повторного входа

Субтитры не синхронизированы

Перезапустить выравнивание; некоторые TTS-движки неточно отчитываются о тайминге — скилл имеет режим ресинка

Альтернативы

video-podcast-maker в сравнении

АльтернативаКогда использоватьКомпромисс
ElevenLabs StudioНужен полированный SaaS UIДороже; меньше автоматизации в чате
NotebookLM Audio OverviewНужен одноразовый двухведущий аудиорезюме из любого источникаНет видео; меньше контроля; только облако

Ещё

Ресурсы

📖 Читать официальный README на GitHub

🐙 Открытые задачи

🔍 Все 400+ MCP-серверов и Skills