/ 目录 / 演练场 / ARIS (Auto-Research-In-Sleep)
● 社区 wanshuiyin ⚡ 即开即用

ARIS (Auto-Research-In-Sleep)

作者 wanshuiyin · wanshuiyin/Auto-claude-code-research-in-sleep

将 LLM 编程 agent 变成自主机器学习研究员的 skill——创意发现、多模型审查循环、隔夜实验自动化。

ARIS(Auto-Research-In-Sleep)是一套仅使用 Markdown 的自主机器学习研究 skill 集合包。设计为无人值守运行——通常是整夜——并产出一批经过筛选的研究候选方案、实验结果和审查笔记。没有框架锁定:skill 兼容 Claude Code、Codex、OpenCode 以及任何支持 Markdown skill 的 agent。专为独立研究者和希望让计算与推理在睡眠时间复利增长的小型实验室设计。

为什么要用

核心特性

实时演示

实际使用效果

就绪

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "aris-research-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "aris-research-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
          "~/.claude/skills/aris"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add aris-research-skill -- git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep ~/.claude/skills/aris

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: ARIS (Auto-Research-In-Sleep)

隔夜运行自主研究会话

👤 独立研究者 / 小型实验室 ⏱ ~720 min advanced

何时使用: 你有一个研究方向和 12 小时;希望醒来时已有候选实验结果。

前置条件
  • 实验所需的计算资源(GPU / 云端) — ARIS 负责调度;你提供运行环境
步骤
  1. 确定范围
    Use ARIS. Goal: explore parameter-efficient fine-tuning variants for small LLMs. Budget: 12h, 5 ideas, 2 experiments per idea.✓ 已复制
    → 包含各阶段预算的研究计划
  2. 发现创意
    Generate 10 candidate ideas. Cross-review. Keep the top 5.✓ 已复制
    → 带批评意见的创意排名列表
  3. 运行
    For each top idea, draft an experiment, run it, log metrics. Stop when budget exhausted.✓ 已复制
    → 实验完成;指标已记录

结果: 早报:带真实实验信号的创意排名。

注意事项
  • 计算用量失控 — 对每个实验设置硬性预算上限;ARIS 会遵守
搭配使用: filesystem

进行文献扫描并提取实验性主张

👤 进入新研究领域的研究者 ⏱ ~90 min intermediate

何时使用: 你需要梳理某个子领域的主张和研究空白。

步骤
  1. 确定范围
    Scan papers from 2024-2026 on diffusion-LM hybrids. Extract claimed contributions and benchmarks.✓ 已复制
    → 主张汇总表
  2. 交叉审查
    Cross-review claims against each other. What's contradictory or under-tested?✓ 已复制
    → 差距分析

结果: 包含具体研究空白的子领域地图。

注意事项
  • 幻觉引用 — ARIS 包含验证步骤——搭配 arxiv MCP 做事实核查
搭配使用: notebooklm-py-skill

组合

与其他 MCP 搭配,撬动十倍杠杆

aris-research-skill + notebooklm-py-skill

研究前后的文献消化

Use NotebookLM to digest related papers; ARIS to design experiments.✓ 已复制
aris-research-skill + filesystem

将实验产物持久化到 /research/<run-id>/

Save all logs and results under /research/2026-05-03/.✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
plan_research goal, budget 会话开始时 tokens
discover_ideas topic, n 创意生成阶段 tokens
cross_review idea, models[] 筛选创意时 tokens × n models
run_experiment idea, runner config 验证阶段 compute + tokens

成本与限制

运行它的成本

API 配额
token + 计算——两者都可能相当可观
每次调用 Token 数
创意发现和交叉审查非常耗 token
费用
skill 免费;你支付计算和模型使用费
提示
在计划阶段设置严格的 token / 计算硬性上限

安全

权限、密钥、影响范围

最小权限: Compute runner access Read access to data
凭据存储: 外部管理——由你的运行环境处理
数据出站: 取决于你的模型/运行环境配置
切勿授予: Production data to autonomous research loops

故障排查

常见错误与修复

Loops without converging

收紧预算;ARIS 会遵守上限并停止

Cross-review collapses to one viewpoint

多样化审查员模型;如果全部来自同一家族,观点会高度相关

Experiments fail silently

加强运行环境的错误上报;ARIS 会记录日志但无法修复糟糕的运行环境

替代方案

ARIS (Auto-Research-In-Sleep) 对比其他方案

替代方案何时用它替代权衡
Hand-run experiments需要完全掌控无法突破你个人的工作时间上限
Hosted AutoML platforms需要托管计算 + UI灵活性较低;有额外费用

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills