freemcplab / 目錄 / 演練場 / ARIS (Auto-Research-In-Sleep)

● 社群 wanshuiyin ⚡ 即開即用

ARIS (Auto-Research-In-Sleep)

Name: ARIS (Auto-Research-In-Sleep) (Claude Skill)
Author: wanshuiyin

作者 wanshuiyin · wanshuiyin/Auto-claude-code-research-in-sleep

將 LLM 程式代理轉變為自主 ML 研究員的技能——創意發現、跨模型審查迴圈、隔夜實驗自動化。

ARIS（Auto-Research-In-Sleep）是一個純 Markdown 技能套件，用於自主 ML 研究。設計為無人值守執行——通常是隔夜——並產出一堆經過驗證的研究候選項、實驗結果和審查筆記。無框架鎖定：技能可用於 Claude Code、Codex、OpenCode 以及任何能載入 Markdown 技能的代理。為獨立研究員和小型實驗室打造，讓運算和推理能力在睡眠時持續複利。

▶ 觀看演示 📦 安裝 💡 使用場景

為什麼要用

核心特性

跨模型審查的創意發現（多 LLM 共識）
實驗自動化——撰寫、執行、評估、迭代
過濾低品質輸出的審查迴圈
純 Markdown——無不透明框架，容易派生
適用於任何代理框架

即時演示

實際使用效果

就緒

安裝

選擇你的客戶端

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

開啟 Claude Desktop → Settings → Developer → Edit Config。儲存後重啟應用。

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用與 Claude Desktop 相同的 mcpServers 格式。專案級設定優先於全域。

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

點擊 Cline 側欄中的 MCP Servers 圖示，然後選 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

格式與 Claude Desktop 相同。重啟 Windsurf 生效。

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "aris-research-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ]
    }
  ]
}

Continue 使用伺服器物件陣列，而非映射。

~/.config/zed/settings.json

{
  "context_servers": {
    "aris-research-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
          "~/.claude/skills/aris"
        ]
      }
    }
  }
}

加入 context_servers。Zed 儲存後熱重載。

claude mcp add aris-research-skill -- git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep ~/.claude/skills/aris

一行命令搞定。用 claude mcp list 驗證，claude mcp remove 移除。

使用場景

實戰用法： ARIS (Auto-Research-In-Sleep)

執行一整夜的自主研究工作階段

👤 獨立研究員／小型實驗室 ⏱ ~720 min advanced

何時使用： 你有一個研究方向和 12 個小時；你想要醒來時有候選實驗。

前置條件

實驗的計算資源存取（GPU／雲端） — ARIS 負責排程；你提供執行環境

步驟

確定範圍

使用 ARIS。目標：探索小型 LLM 的參數高效微調變體。預算：12 小時，5 個創意，每個創意 2 個實驗。✓ 已複製

→ 含各階段預算的計劃
發現

生成 10 個候選創意。交叉審查。保留前 5 名。✓ 已複製

→ 含評論的排名創意列表
執行

對每個頂級創意，起草一個實驗、執行它、記錄指標。預算耗盡時停止。✓ 已複製

→ 實驗完成；指標已記錄

結果： 早晨報告：含實際實驗訊號的排名創意。

注意事項

計算使用量失控 — 對每個實驗設定硬性預算上限；ARIS 會遵守

搭配使用： filesystem

執行文獻掃描並提取實驗宣稱

👤 進入新領域的研究人員 ⏱ ~90 min intermediate

何時使用： 你需要描繪一個子領域的宣稱和空白。

步驟

確定範圍

掃描 2024–2026 年關於 diffusion-LM 混合的論文。提取宣稱的貢獻和基準測試。✓ 已複製

→ 宣稱表格
批評

互相交叉審查宣稱。哪些是相互矛盾或測試不足的？✓ 已複製

→ 空白分析

結果： 含具體研究空白的子領域地圖。

注意事項

幻覺引用 — ARIS 包含驗證步驟——搭配 arxiv MCP 取得真實來源

搭配使用： notebooklm-py-skill

組合

與其他 MCP 搭配，撬動十倍槓桿

aris-research-skill + notebooklm-py-skill

研究前後的文獻摘要

用 NotebookLM 整理相關論文；用 ARIS 設計實驗。✓ 已複製

aris-research-skill + filesystem

將實驗產物持久化至 /research/<run-id>/

將所有日誌和結果儲存在 /research/2026-05-03/ 下。✓ 已複製

工具

此 MCP 暴露的能力

工具	輸入參數	何時呼叫	成本
plan_research	goal, budget	工作階段開始	token
discover_ideas	topic, n	創意生成階段	token
cross_review	idea, models[]	過濾創意	token × n models
run_experiment	idea, runner config	驗證	計算 + token

成本與限制

運行它的成本

API 配額: Token + 計算——兩者都可能很可觀
每次呼叫 Token 數: 創意發現和交叉審查耗 token 較多
費用: 技能免費；你支付計算和模型使用費
提示: 在規劃階段設定硬性的 token 和計算上限

安全

權限、密鑰、影響範圍

最小權限： 計算執行環境存取 資料讀取存取

憑證儲存： 外部——由你的執行環境處理

資料出站： 取決於你的模型／執行環境設定

切勿授予： 將正式環境資料提供給自主研究迴圈

自主實驗——在讓生成的程式碼在真實系統上執行前，先審查所有程式碼

故障排查

常見錯誤與修復

迴圈沒有收斂

收緊預算；ARIS 遵守上限並停止

交叉審查收斂到單一觀點

多樣化審查模型；若全是同一個模型家族，你會得到相關的觀點

實驗靜默失敗

改善執行環境的錯誤回報；ARIS 記錄但無法修復不良的執行環境

替代方案