freemcplab / 目录 / 演练场 / ARIS (Auto-Research-In-Sleep)

● 社区 wanshuiyin ⚡ 即开即用

ARIS (Auto-Research-In-Sleep)

Name: ARIS (Auto-Research-In-Sleep) (Claude Skill)
Author: wanshuiyin

作者 wanshuiyin · wanshuiyin/Auto-claude-code-research-in-sleep

将 LLM 编程 agent 变成自主机器学习研究员的 skill——创意发现、多模型审查循环、隔夜实验自动化。

ARIS（Auto-Research-In-Sleep）是一套仅使用 Markdown 的自主机器学习研究 skill 集合包。设计为无人值守运行——通常是整夜——并产出一批经过筛选的研究候选方案、实验结果和审查笔记。没有框架锁定：skill 兼容 Claude Code、Codex、OpenCode 以及任何支持 Markdown skill 的 agent。专为独立研究者和希望让计算与推理在睡眠时间复利增长的小型实验室设计。

▶ 观看演示 📦 安装 💡 使用场景

为什么要用

核心特性

创意发现与多模型交叉审查（多 LLM 共识机制）
实验自动化——编写、运行、评估、迭代
过滤低质量输出的审查循环
仅使用 Markdown——无不透明框架，易于 fork
兼容任何 agent harness

实时演示

实际使用效果

就绪

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标，然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "aris-research-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ],
      "_inferred": true
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "aris-research-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
        "~/.claude/skills/aris"
      ]
    }
  ]
}

Continue 使用服务器对象数组，而非映射。

~/.config/zed/settings.json

{
  "context_servers": {
    "aris-research-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep",
          "~/.claude/skills/aris"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add aris-research-skill -- git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep ~/.claude/skills/aris

一行命令搞定。用 claude mcp list 验证，claude mcp remove 卸载。

使用场景

实战用法： ARIS (Auto-Research-In-Sleep)

隔夜运行自主研究会话

👤 独立研究者 / 小型实验室 ⏱ ~720 min advanced

何时使用： 你有一个研究方向和 12 小时；希望醒来时已有候选实验结果。

前置条件

实验所需的计算资源（GPU / 云端） — ARIS 负责调度；你提供运行环境

步骤

确定范围

Use ARIS. Goal: explore parameter-efficient fine-tuning variants for small LLMs. Budget: 12h, 5 ideas, 2 experiments per idea.✓ 已复制

→ 包含各阶段预算的研究计划
发现创意

Generate 10 candidate ideas. Cross-review. Keep the top 5.✓ 已复制

→ 带批评意见的创意排名列表
运行

For each top idea, draft an experiment, run it, log metrics. Stop when budget exhausted.✓ 已复制

→ 实验完成；指标已记录

结果： 早报：带真实实验信号的创意排名。

注意事项

计算用量失控 — 对每个实验设置硬性预算上限；ARIS 会遵守

搭配使用： filesystem

进行文献扫描并提取实验性主张

👤 进入新研究领域的研究者 ⏱ ~90 min intermediate

何时使用： 你需要梳理某个子领域的主张和研究空白。

步骤

确定范围

Scan papers from 2024-2026 on diffusion-LM hybrids. Extract claimed contributions and benchmarks.✓ 已复制

→ 主张汇总表
交叉审查

Cross-review claims against each other. What's contradictory or under-tested?✓ 已复制

→ 差距分析

结果： 包含具体研究空白的子领域地图。

注意事项

幻觉引用 — ARIS 包含验证步骤——搭配 arxiv MCP 做事实核查

搭配使用： notebooklm-py-skill

组合

与其他 MCP 搭配，撬动十倍杠杆

aris-research-skill + notebooklm-py-skill

研究前后的文献消化

Use NotebookLM to digest related papers; ARIS to design experiments.✓ 已复制

aris-research-skill + filesystem

将实验产物持久化到 /research/<run-id>/

Save all logs and results under /research/2026-05-03/.✓ 已复制

工具

此 MCP 暴露的能力

工具	输入参数	何时调用	成本
plan_research	goal, budget	会话开始时	tokens
discover_ideas	topic, n	创意生成阶段	tokens
cross_review	idea, models[]	筛选创意时	tokens × n models
run_experiment	idea, runner config	验证阶段	compute + tokens

成本与限制

运行它的成本

API 配额: token + 计算——两者都可能相当可观
每次调用 Token 数: 创意发现和交叉审查非常耗 token
费用: skill 免费；你支付计算和模型使用费
提示: 在计划阶段设置严格的 token / 计算硬性上限

安全

权限、密钥、影响范围

最小权限： Compute runner access Read access to data

凭据存储： 外部管理——由你的运行环境处理

数据出站： 取决于你的模型/运行环境配置

切勿授予： Production data to autonomous research loops

自主实验——在让生成的代码在真实系统上运行之前，务必人工审查

故障排查

常见错误与修复

Loops without converging

收紧预算；ARIS 会遵守上限并停止

Cross-review collapses to one viewpoint

多样化审查员模型；如果全部来自同一家族，观点会高度相关

Experiments fail silently

加强运行环境的错误上报；ARIS 会记录日志但无法修复糟糕的运行环境

替代方案