用 AI 提前识别 3 个 Rug Pull 的案例研究
我们挑了过去 6 个月已经被市场确认为 rug pull 的 3 个项目, 假装"穿越回 rug 之前 1 周",把当时 100% 公开可得的信息喂给 ChatGPT、Claude、Perplexity, 看 AI 能不能在没作弊的情况下识别出来。结果是 2 个看出来 1 个没看出来。 没看出来的那个,比看出来的两个学到更多。
1. 我们是怎么做这次复盘的 #
挑选标准:过去 6 个月内(2025-11 至 2026-04)发生的 rug pull / exit scam,被 Etherscan / Solscan / DEXTools 或多家媒体公开确认。我们筛了 11 个候选,最终挑了 3 个具有代表性的:
- A 项目:DeFi 协议,Solana 链,rug 时 TVL 约 $4.1M
- B 项目:meme 币 + GameFi 概念,Base 链,rug 时市值约 $9.7M
- C 项目:基础设施类,以太坊主网,慢速跑路 6 周以上,累计提走约 $1.2M
方法:我们把"rug 前 7 天"的所有公开信息整理成材料包给 AI,包括:
| 材料类型 | 来源 | 给 AI 哪些 |
|---|---|---|
| 合约信息 | Etherscan / Solscan | verified 源码 / 持币分布 / 部署人地址历史 |
| 团队信息 | 官网 / LinkedIn / Twitter | 团队页文本截图 / 主推人 X 账号近 30 天发言 |
| 项目文档 | 白皮书 / GitBook | 白皮书 PDF(投喂 Claude) |
| 链上活动 | Dune Analytics / Nansen | 过去 30 天 TVL/Holder/前 10 持币集中度 |
| 社交舆情 | Twitter / Discord / Telegram | 讨论关键词聚合(不是原始记录) |
三个 AI 各跑 3 次,9 次输出取共识。最后我们人工对照"rug 实际发生"做后验。
2. 案例 A:能识别出的"团队空地址" #
A 项目是 Solana 链上的 DeFi 协议,rug 时 TVL 约 $4.1M。Claude 在 9 次输出里有 8 次给了"高风险"判定,理由聚焦在三个点:
第一,部署人地址历史。我们把项目合约部署人地址给 Claude,让它分析"这个地址在部署本项目前的 6 个月有没有部署过其他合约"。Claude 拿到 Solscan 数据后立刻指出:该地址在过去 6 个月部署了 4 个其他合约,其中 2 个已经停止维护、合约 owner 提走了流动性。这是 AI 真正擅长的事——对相似 pattern 的关联识别。
第二,团队 LinkedIn 反查。项目官网列了 5 个团队成员,每人有 LinkedIn 链接。Perplexity 联网帮我们抓了 5 个 LinkedIn 公开 profile,发现 3 个 profile 的"创建时间 / connection 数 / endorsement 数"模式异常(少于 30 个 connection、profile 创建时间不到 4 个月、endorsement 全是英文复制粘贴)。Perplexity 直接判定"团队页大概率是合成身份"。这种交叉验证人类做要花 1-2 小时,AI 给了 20 分钟答案。
第三,TVL 增长曲线 vs 用户地址增长曲线背离。Dune 数据显示项目 TVL 30 天增长 +180%,但持币地址数只增长 +24%。ChatGPT 直接点出:"这意味着 TVL 主要由少数大额地址贡献,而非有机增长。结合 rug 风险,应警惕大户撤资引发挤兑。"
| AI | 9 次输出判定 | 最强信号 |
|---|---|---|
| Claude 4.5 Sonnet | 高风险 ×8 / 中风险 ×1 | 部署人历史 |
| ChatGPT GPT-4o | 高风险 ×7 / 中风险 ×2 | TVL 与地址背离 |
| Perplexity Pro | 高风险 ×9 | LinkedIn 合成身份 |
A 项目在我们模拟时间窗口的 5 天后真实 rug。这个案例 AI 是真的有用——只要你给的信息够,AI 在 30 分钟内能把人类需要做的 5-6 项尽调动作并行处理。
3. 案例 B:能识别出的"抄袭合约 + 假团队" #
B 项目挂的旗号是"GameFi + meme",Base 链,市值跑到过 $9.7M。这个项目 AI 识别的核心信号是合约抄袭。
我们把 B 项目的 verified 源码丢给 ChatGPT Code Interpreter,让它和已知的 5 个开源 token 合约做相似度对比。结果:B 合约和某 2024 年 rug 项目的源码相似度 96%,唯一改动是变量名和事件名。96% 相似度本身不直接等于 rug,但配合"部署人是新地址 / 团队全员匿名 / Twitter 账号注册仅 3 周"这套组合,AI 把它打成了 9/10 高风险。
另一个 AI 识别得很漂亮的点:白皮书。我们投喂了 38 页白皮书给 Claude(200K context 一次读完),Claude 找出了 4 处"硬伤":
- 路线图 Q2 提到的"和 X 合作",X 在 Twitter 上从未承认过这个合作
- "由 CertiK 审计"——但 CertiK 公开数据库无对应记录
- tokenomics 章节里"团队 + 顾问 + 私募" 加起来占总量 67%,但分配图饼图标的是 35%
- 团队联合创始人引用的"前 Coinbase 工程师"经历,Coinbase 公司没有此员工的 GitHub 提交记录
第 2 条最关键。"声称审计但 CertiK 数据库查不到"在 rug 项目里出现的频率高得惊人——AI 看到这条线索后给的风险评级直接拉到 9/10。这种"声称 vs 公开记录"的核对是 AI 的强项,因为它不带感情、不被项目方话术影响。
4. 案例 C:没识别出的"慢速 rug" #
这才是这篇文章最值钱的一节。C 项目是以太坊主网的基础设施类,跑路用了 6 周以上,累计转走约 $1.2M。9 次 AI 输出全部判定"低风险"或"中等风险"。
为什么 AI 看不出来?事后复盘有四个原因:
原因 1:合约本身真审计过。C 项目找了一家二线审计公司做了真实审计,报告在 GitHub 上,CertiK 数据库也能查到。AI 看到"已审计 + 报告可验证"就把"合约层 rug 风险"打了低分。但合约本身没问题,不代表项目不会 rug——团队后来是通过 multisig 慢慢转移 treasury 钱包资产,这个动作在合约层无法被识别。
原因 2:团队全实名 + LinkedIn 真实。C 项目 4 个团队成员都用实名,LinkedIn 都是 2016 年前创建、connection 数 500+,前雇主有 Coinbase / Consensys 这种大厂。AI 把"团队可验证"也打了正分。但实名团队照样可以做 rug——只是他们用了"我们项目战略转型"这种话术,慢速撤资 6 周。
原因 3:rug 信号在治理论坛,不在链上。事后我们去 Discord 治理频道翻历史,发现 rug 前 4 周开始团队就在 RFC 里"暗示项目方向调整"——这些是文字信号,藏在 200+ 条治理讨论里。我们投喂给 AI 的"社交舆情"只给了关键词聚合,没给原始讨论文本。如果给了,AI 可能能识别"治理频道讨论密度异常上升 + 团队回应延迟"这种二阶信号。
原因 4:慢速 rug 没有突变点。AI(以及大多数 rug 检测工具)依赖"异常突变"作为信号——TVL 暴跌、大额转账、流动性突撤。慢速 rug 每天只转 1-2 万美元,6 周累计 $1.2M。任何单日数字看上去都很正常。这是 rug 演化的方向:从一次性激进 rug 转向慢速温水煮青蛙。
| 失败原因 | 影响信号 | 下次能改进吗 |
|---|---|---|
| 合约真审计 | 合约层信号失效 | 很难,结构性 |
| 团队实名 | 身份层信号失效 | 很难,结构性 |
| 治理论坛没投喂原文 | 二阶信号缺失 | 可以,加 Discord/Forum 原文 |
| 慢速无突变 | 异常检测失效 | 需要时间序列分析工具 |
C 项目的结论是:AI 对"老派 rug"(团队空地址 + 合约抄袭 + 假身份)效果很好,对"慢速 rug"几乎无效。这是我们后来调整尽调流程的关键经验。
5. AI 看 rug 真正擅长的 5 类信号 #
把 3 个案例的成功和失败合起来看,AI 在 rug 识别上有明确的能力边界。下面 5 类是它真的能帮上忙的:
- 地址历史关联:部署人地址过去 6-12 个月部署过的其他合约的命运。这一条是 AI 工具相对人类最大的速度优势——人类做一次要 1 小时,AI 几分钟。
- 合约源码相似度:尤其是和已知 rug 合约的相似度。Code Interpreter / Claude 都能做。
- 团队身份合成验证:LinkedIn / GitHub / 历史发言的交叉验证,Perplexity 联网做最快。
- 白皮书 vs 现实核对:声称的审计 / 投资人 / 合作方在公开数据库是否能查到,Claude 长文档处理最强。
- 链上指标背离:TVL / Holder / Volume 三组数据之间是否一致,Dune 数据 + ChatGPT/Claude 分析。
AI 几乎做不到的:嗅出"温水煮青蛙"。慢速 rug、治理操控、长期价值稀释——这些需要人类对项目文化的长期跟踪。
6. 我们用的 Prompt 模板 #
这套模板我们现在每次看新项目都会跑一遍。30 分钟就能挡掉绝大多数老派 rug:
你是一位严格的加密项目尽调员。基于以下材料,给我一份 rug pull 风险评估(0-10 分)。
材料:
[1] 合约部署人地址:{ADDRESS}
[2] 合约 verified 源码:{SOURCE_CODE}
[3] 团队页 LinkedIn 链接列表:{LINKS}
[4] 白皮书 PDF:{ATTACHED}
[5] 近 30 天链上指标:TVL={X}, Holders={Y}, Top10 集中度={Z}%
[6] 项目声称的审计方:{AUDITOR}
要求:
1. 对每个红旗信号给出"证据 + 评级(低/中/高)",不空说。
2. 不要预测"会不会 rug",只描述当前风险结构。
3. 如果材料不足以判断某项,写"信息不足"。
4. 最后给 0-10 分,并给出"不该投资"的 3 个最强理由(如果没有强理由就直接写"无明显红旗")。
5. 给出 3 个你看不出来的方向(自己的盲区)。
最后一条"给出 3 个你看不出来的方向"是我们后来加的——逼 AI 承认局限,反而让输出更可信。如果 AI 列出"我无法看到 Discord 内部讨论"这种盲区,我们就知道要去人工补这一块。
AI 不能挡所有 rug。但它能挡掉 70% 的低成本 rug,让你把人脑算力留给那些真的"看起来正经"的项目深度跟踪。
查看 Binance 现货研究 看完整 Prompt 库 →
— PromptDeck, 2026-04-25
rel="sponsored"),通过链接注册我们可能获得佣金,不会增加您的任何费用。
完整披露 →