用 AI 提前识别 3 个 Rug Pull 的案例研究
以 3 类已被市场确认为 rug pull 的项目为原型,设想"穿越回 rug 之前 1 周", 把当时 100% 公开可得的信息喂给 ChatGPT、Claude、Perplexity, 看 AI 能不能在没作弊的情况下识别出来。典型结果是:两类老派 rug 能看出来、一类慢速 rug 看不出来。 看不出来的那类,反而比能看出来的更值得学。文中的项目细节与数字均为示意,用来说明方法。
1. 这套复盘怎么做 #
选材思路:取最近一段时间内已被 Etherscan / Solscan / DEXTools 或多家媒体公开确认的 rug pull / exit scam 类型,挑 3 个具有代表性的形态(以下为示意原型):
- A 类:DeFi 协议,Solana 链,rug 时 TVL 在数百万美元量级
- B 类:meme 币 + GameFi 概念,Base 链,市值曾达到约千万美元量级
- C 类:基础设施类,以太坊主网,慢速跑路数周、累计提走约百万美元量级
方法:把"rug 前 7 天"的所有公开信息整理成材料包给 AI,包括:
| 材料类型 | 来源 | 给 AI 哪些 |
|---|---|---|
| 合约信息 | Etherscan / Solscan | verified 源码 / 持币分布 / 部署人地址历史 |
| 团队信息 | 官网 / LinkedIn / Twitter | 团队页文本截图 / 主推人 X 账号近 30 天发言 |
| 项目文档 | 白皮书 / GitBook | 白皮书 PDF(投喂 Claude) |
| 链上活动 | Dune Analytics / Nansen | 过去 30 天 TVL/Holder/前 10 持币集中度 |
| 社交舆情 | Twitter / Discord / Telegram | 讨论关键词聚合(不是原始记录) |
让三个 AI 各跑几次、取多次输出的共识,最后人工对照"rug 实际发生"做后验。
2. 场景 A:能识别出的"团队空地址" #
A 类是 Solana 链上的 DeFi 协议。这类情形里,偏稳健的模型(如 Claude 这类)大多数情况下会给出"高风险"判定,理由通常聚焦在三个点:
第一,部署人地址历史。把项目合约部署人地址给 Claude,让它分析"这个地址在部署本项目前有没有部署过其他合约"。拿到 Solscan 数据后,它能指出该地址此前部署过的其他合约里有几个已经停止维护、合约 owner 提走了流动性。这是 AI 真正擅长的事——对相似 pattern 的关联识别。
第二,团队 LinkedIn 反查。项目官网若列了若干团队成员的 LinkedIn 链接,Perplexity 联网抓取这些公开 profile 后,常能发现部分 profile 的"创建时间 / connection 数 / endorsement 数"模式异常(connection 很少、profile 创建时间很短、endorsement 像复制粘贴),从而判定"团队页大概率是合成身份"。这种交叉验证人类做要花一两小时,AI 几十分钟就能给初稿。
第三,TVL 增长曲线 vs 用户地址增长曲线背离。如果 Dune 数据显示项目 TVL 短期大幅增长、但持币地址数增长很有限,ChatGPT 这类模型会点出:"这意味着 TVL 主要由少数大额地址贡献,而非有机增长。结合 rug 风险,应警惕大户撤资引发挤兑。"
| AI | 多次输出的倾向(示意) | 最强信号 |
|---|---|---|
| Claude(Sonnet 类) | 大多判高风险 | 部署人历史 |
| ChatGPT(GPT-4o) | 多数判高风险 | TVL 与地址背离 |
| Perplexity Pro | 稳定判高风险 | LinkedIn 合成身份 |
这类 A 形态的项目往往在很短时间后真实 rug。这种场景里 AI 是真的有用——只要你给的信息够,AI 几十分钟内能把人类需要做的好几项尽调动作并行处理。
3. 场景 B:能识别出的"抄袭合约 + 假团队" #
B 类挂的旗号是"GameFi + meme",Base 链。这类项目里,AI 识别的核心信号是合约抄袭。
把这类项目的 verified 源码丢给 ChatGPT Code Interpreter,让它和已知的若干开源 token 合约做相似度对比。常见结果是:合约和某个早先的 rug 项目源码高度相似、唯一改动是变量名和事件名。高相似度本身不直接等于 rug,但配合"部署人是新地址 / 团队全员匿名 / Twitter 账号注册时间很短"这套组合,AI 通常会把它评为高风险。
另一个 AI 识别得很漂亮的点:白皮书。把几十页白皮书投喂给 Claude(长 context 一次读完),它常能找出几处"硬伤",例如:
- 路线图 Q2 提到的"和 X 合作",X 在 Twitter 上从未承认过这个合作
- "由 CertiK 审计"——但 CertiK 公开数据库无对应记录
- tokenomics 章节里"团队 + 顾问 + 私募" 加起来占总量 67%,但分配图饼图标的是 35%
- 团队联合创始人引用的"前 Coinbase 工程师"经历,Coinbase 公司没有此员工的 GitHub 提交记录
其中"声称审计但权威数据库查不到"最关键——它在 rug 项目里出现的频率高得惊人,AI 看到这条线索后通常会把风险评级直接拉高。这种"声称 vs 公开记录"的核对是 AI 的强项,因为它不带感情、不被项目方话术影响。
4. 场景 C:没识别出的"慢速 rug" #
这才是这篇文章最值钱的一节。C 类是以太坊主网的基础设施项目,跑路用了数周、累计转走百万美元量级。这类情形里,AI 的多次输出往往全部判定"低风险"或"中等风险"。
为什么 AI 看不出来?拆开看有四个原因:
原因 1:合约本身真审计过。这类项目可能找了一家二线审计公司做了真实审计,报告在 GitHub 上、权威数据库也能查到。AI 看到"已审计 + 报告可验证"就把"合约层 rug 风险"打了低分。但合约本身没问题,不代表项目不会 rug——团队后来通过 multisig 慢慢转移 treasury 钱包资产,这个动作在合约层无法被识别。
原因 2:团队全实名 + LinkedIn 真实。这类项目的团队成员可能都用实名,LinkedIn 创建多年、connection 数很高、前雇主是大厂。AI 把"团队可验证"也打了正分。但实名团队照样可以做 rug——只是他们用了"我们项目战略转型"这种话术,慢速撤资。
原因 3:rug 信号在治理论坛,不在链上。这类情形里,去 Discord 治理频道翻历史,常能发现 rug 前几周团队就在 RFC 里"暗示项目方向调整"——这些是文字信号,藏在大量治理讨论里。如果投喂给 AI 的"社交舆情"只给了关键词聚合、没给原始讨论文本,AI 就抓不到"治理频道讨论密度异常上升 + 团队回应延迟"这种二阶信号。
原因 4:慢速 rug 没有突变点。AI(以及大多数 rug 检测工具)依赖"异常突变"作为信号——TVL 暴跌、大额转账、流动性突撤。慢速 rug 每天只转走很小一笔,累计才到百万美元量级,任何单日数字看上去都很正常。这是 rug 演化的方向:从一次性激进 rug 转向慢速温水煮青蛙。
| 失败原因 | 影响信号 | 下次能改进吗 |
|---|---|---|
| 合约真审计 | 合约层信号失效 | 很难,结构性 |
| 团队实名 | 身份层信号失效 | 很难,结构性 |
| 治理论坛没投喂原文 | 二阶信号缺失 | 可以,加 Discord/Forum 原文 |
| 慢速无突变 | 异常检测失效 | 需要时间序列分析工具 |
C 类的结论是:AI 对"老派 rug"(团队空地址 + 合约抄袭 + 假身份)效果很好,对"慢速 rug"几乎无效。这正是调整尽调流程时最值得记住的一条。
5. AI 看 rug 真正擅长的 5 类信号 #
把 3 个案例的成功和失败合起来看,AI 在 rug 识别上有明确的能力边界。下面 5 类是它真的能帮上忙的:
- 地址历史关联:部署人地址过去 6-12 个月部署过的其他合约的命运。这一条是 AI 工具相对人类最大的速度优势——人类做一次要 1 小时,AI 几分钟。
- 合约源码相似度:尤其是和已知 rug 合约的相似度。Code Interpreter / Claude 都能做。
- 团队身份合成验证:LinkedIn / GitHub / 历史发言的交叉验证,Perplexity 联网做最快。
- 白皮书 vs 现实核对:声称的审计 / 投资人 / 合作方在公开数据库是否能查到,Claude 长文档处理最强。
- 链上指标背离:TVL / Holder / Volume 三组数据之间是否一致,Dune 数据 + ChatGPT/Claude 分析。
AI 几乎做不到的:嗅出"温水煮青蛙"。慢速 rug、治理操控、长期价值稀释——这些需要人类对项目文化的长期跟踪。
6. 可复用的 Prompt 模板 #
这套模板可以在每次看新项目时跑一遍,半小时左右就能挡掉绝大多数老派 rug:
你是一位严格的加密项目尽调员。基于以下材料,给我一份 rug pull 风险评估(0-10 分)。
材料:
[1] 合约部署人地址:{ADDRESS}
[2] 合约 verified 源码:{SOURCE_CODE}
[3] 团队页 LinkedIn 链接列表:{LINKS}
[4] 白皮书 PDF:{ATTACHED}
[5] 近 30 天链上指标:TVL={X}, Holders={Y}, Top10 集中度={Z}%
[6] 项目声称的审计方:{AUDITOR}
要求:
1. 对每个红旗信号给出"证据 + 评级(低/中/高)",不空说。
2. 不要预测"会不会 rug",只描述当前风险结构。
3. 如果材料不足以判断某项,写"信息不足"。
4. 最后给 0-10 分,并给出"不该投资"的 3 个最强理由(如果没有强理由就直接写"无明显红旗")。
5. 给出 3 个你看不出来的方向(自己的盲区)。
最后一条"给出 3 个你看不出来的方向"值得专门加上——逼 AI 承认局限,反而让输出更可信。如果 AI 列出"我无法看到 Discord 内部讨论"这种盲区,你就知道要去人工补这一块。
AI 不能挡所有 rug。但它能挡掉 70% 的低成本 rug,让你把人脑算力留给那些真的"看起来正经"的项目深度跟踪。
查看 Binance 现货研究 看完整 Prompt 库 →
— PromptDeck, 2026-04-25