目录
文章目录
  1. 1. 我们是怎么做这次复盘的
  2. 2. 案例 A:能识别出的"团队空地址"
  3. 3. 案例 B:能识别出的"抄袭合约 + 假团队"
  4. 4. 案例 C:没识别出的"慢速 rug"
  5. 5. AI 看 rug 真正擅长的 5 类信号
  6. 6. 我们用的 Prompt 模板

用 AI 提前识别 3 个 Rug Pull 的案例研究

我们挑了过去 6 个月已经被市场确认为 rug pull 的 3 个项目, 假装"穿越回 rug 之前 1 周",把当时 100% 公开可得的信息喂给 ChatGPT、Claude、Perplexity, 看 AI 能不能在没作弊的情况下识别出来。结果是 2 个看出来 1 个没看出来。 没看出来的那个,比看出来的两个学到更多。

2026-04-25 发布 PromptDeck 撰 阅读约 10 分钟 2,000 字
研究伦理声明:本文涉及的 3 个项目均已在公开渠道被识别为 rug pull 或 exit scam, 本文为事后教育性复盘,所有具体项目名、合约地址、团队信息均做匿名化处理,避免对仍持币用户造成二次干扰。 不构成对任何在售项目的指控

1. 我们是怎么做这次复盘的 #

挑选标准:过去 6 个月内(2025-11 至 2026-04)发生的 rug pull / exit scam,被 Etherscan / Solscan / DEXTools 或多家媒体公开确认。我们筛了 11 个候选,最终挑了 3 个具有代表性的:

方法:我们把"rug 前 7 天"的所有公开信息整理成材料包给 AI,包括:

材料类型 来源 给 AI 哪些
合约信息Etherscan / Solscanverified 源码 / 持币分布 / 部署人地址历史
团队信息官网 / LinkedIn / Twitter团队页文本截图 / 主推人 X 账号近 30 天发言
项目文档白皮书 / GitBook白皮书 PDF(投喂 Claude)
链上活动Dune Analytics / Nansen过去 30 天 TVL/Holder/前 10 持币集中度
社交舆情Twitter / Discord / Telegram讨论关键词聚合(不是原始记录)

三个 AI 各跑 3 次,9 次输出取共识。最后我们人工对照"rug 实际发生"做后验。

2. 案例 A:能识别出的"团队空地址" #

A 项目是 Solana 链上的 DeFi 协议,rug 时 TVL 约 $4.1M。Claude 在 9 次输出里有 8 次给了"高风险"判定,理由聚焦在三个点:

第一,部署人地址历史。我们把项目合约部署人地址给 Claude,让它分析"这个地址在部署本项目前的 6 个月有没有部署过其他合约"。Claude 拿到 Solscan 数据后立刻指出:该地址在过去 6 个月部署了 4 个其他合约,其中 2 个已经停止维护、合约 owner 提走了流动性。这是 AI 真正擅长的事——对相似 pattern 的关联识别

第二,团队 LinkedIn 反查。项目官网列了 5 个团队成员,每人有 LinkedIn 链接。Perplexity 联网帮我们抓了 5 个 LinkedIn 公开 profile,发现 3 个 profile 的"创建时间 / connection 数 / endorsement 数"模式异常(少于 30 个 connection、profile 创建时间不到 4 个月、endorsement 全是英文复制粘贴)。Perplexity 直接判定"团队页大概率是合成身份"。这种交叉验证人类做要花 1-2 小时,AI 给了 20 分钟答案。

第三,TVL 增长曲线 vs 用户地址增长曲线背离。Dune 数据显示项目 TVL 30 天增长 +180%,但持币地址数只增长 +24%。ChatGPT 直接点出:"这意味着 TVL 主要由少数大额地址贡献,而非有机增长。结合 rug 风险,应警惕大户撤资引发挤兑。"

AI 9 次输出判定 最强信号
Claude 4.5 Sonnet高风险 ×8 / 中风险 ×1部署人历史
ChatGPT GPT-4o高风险 ×7 / 中风险 ×2TVL 与地址背离
Perplexity Pro高风险 ×9LinkedIn 合成身份

A 项目在我们模拟时间窗口的 5 天后真实 rug。这个案例 AI 是真的有用——只要你给的信息够,AI 在 30 分钟内能把人类需要做的 5-6 项尽调动作并行处理。

3. 案例 B:能识别出的"抄袭合约 + 假团队" #

B 项目挂的旗号是"GameFi + meme",Base 链,市值跑到过 $9.7M。这个项目 AI 识别的核心信号是合约抄袭。

我们把 B 项目的 verified 源码丢给 ChatGPT Code Interpreter,让它和已知的 5 个开源 token 合约做相似度对比。结果:B 合约和某 2024 年 rug 项目的源码相似度 96%,唯一改动是变量名和事件名。96% 相似度本身不直接等于 rug,但配合"部署人是新地址 / 团队全员匿名 / Twitter 账号注册仅 3 周"这套组合,AI 把它打成了 9/10 高风险

另一个 AI 识别得很漂亮的点:白皮书。我们投喂了 38 页白皮书给 Claude(200K context 一次读完),Claude 找出了 4 处"硬伤":

第 2 条最关键。"声称审计但 CertiK 数据库查不到"在 rug 项目里出现的频率高得惊人——AI 看到这条线索后给的风险评级直接拉到 9/10。这种"声称 vs 公开记录"的核对是 AI 的强项,因为它不带感情、不被项目方话术影响。

4. 案例 C:没识别出的"慢速 rug" #

这才是这篇文章最值钱的一节。C 项目是以太坊主网的基础设施类,跑路用了 6 周以上,累计转走约 $1.2M。9 次 AI 输出全部判定"低风险"或"中等风险"

为什么 AI 看不出来?事后复盘有四个原因:

原因 1:合约本身真审计过。C 项目找了一家二线审计公司做了真实审计,报告在 GitHub 上,CertiK 数据库也能查到。AI 看到"已审计 + 报告可验证"就把"合约层 rug 风险"打了低分。但合约本身没问题,不代表项目不会 rug——团队后来是通过 multisig 慢慢转移 treasury 钱包资产,这个动作在合约层无法被识别。

原因 2:团队全实名 + LinkedIn 真实。C 项目 4 个团队成员都用实名,LinkedIn 都是 2016 年前创建、connection 数 500+,前雇主有 Coinbase / Consensys 这种大厂。AI 把"团队可验证"也打了正分。但实名团队照样可以做 rug——只是他们用了"我们项目战略转型"这种话术,慢速撤资 6 周。

原因 3:rug 信号在治理论坛,不在链上。事后我们去 Discord 治理频道翻历史,发现 rug 前 4 周开始团队就在 RFC 里"暗示项目方向调整"——这些是文字信号,藏在 200+ 条治理讨论里。我们投喂给 AI 的"社交舆情"只给了关键词聚合,没给原始讨论文本。如果给了,AI 可能能识别"治理频道讨论密度异常上升 + 团队回应延迟"这种二阶信号。

原因 4:慢速 rug 没有突变点。AI(以及大多数 rug 检测工具)依赖"异常突变"作为信号——TVL 暴跌、大额转账、流动性突撤。慢速 rug 每天只转 1-2 万美元,6 周累计 $1.2M。任何单日数字看上去都很正常。这是 rug 演化的方向:从一次性激进 rug 转向慢速温水煮青蛙

失败原因 影响信号 下次能改进吗
合约真审计合约层信号失效很难,结构性
团队实名身份层信号失效很难,结构性
治理论坛没投喂原文二阶信号缺失可以,加 Discord/Forum 原文
慢速无突变异常检测失效需要时间序列分析工具

C 项目的结论是:AI 对"老派 rug"(团队空地址 + 合约抄袭 + 假身份)效果很好,对"慢速 rug"几乎无效。这是我们后来调整尽调流程的关键经验。

5. AI 看 rug 真正擅长的 5 类信号 #

把 3 个案例的成功和失败合起来看,AI 在 rug 识别上有明确的能力边界。下面 5 类是它真的能帮上忙的:

  1. 地址历史关联:部署人地址过去 6-12 个月部署过的其他合约的命运。这一条是 AI 工具相对人类最大的速度优势——人类做一次要 1 小时,AI 几分钟。
  2. 合约源码相似度:尤其是和已知 rug 合约的相似度。Code Interpreter / Claude 都能做。
  3. 团队身份合成验证:LinkedIn / GitHub / 历史发言的交叉验证,Perplexity 联网做最快。
  4. 白皮书 vs 现实核对:声称的审计 / 投资人 / 合作方在公开数据库是否能查到,Claude 长文档处理最强。
  5. 链上指标背离:TVL / Holder / Volume 三组数据之间是否一致,Dune 数据 + ChatGPT/Claude 分析。

AI 几乎做不到的:嗅出"温水煮青蛙"。慢速 rug、治理操控、长期价值稀释——这些需要人类对项目文化的长期跟踪。

6. 我们用的 Prompt 模板 #

这套模板我们现在每次看新项目都会跑一遍。30 分钟就能挡掉绝大多数老派 rug:

你是一位严格的加密项目尽调员。基于以下材料,给我一份 rug pull 风险评估(0-10 分)。

材料:
[1] 合约部署人地址:{ADDRESS}
[2] 合约 verified 源码:{SOURCE_CODE}
[3] 团队页 LinkedIn 链接列表:{LINKS}
[4] 白皮书 PDF:{ATTACHED}
[5] 近 30 天链上指标:TVL={X}, Holders={Y}, Top10 集中度={Z}%
[6] 项目声称的审计方:{AUDITOR}

要求:
1. 对每个红旗信号给出"证据 + 评级(低/中/高)",不空说。
2. 不要预测"会不会 rug",只描述当前风险结构。
3. 如果材料不足以判断某项,写"信息不足"。
4. 最后给 0-10 分,并给出"不该投资"的 3 个最强理由(如果没有强理由就直接写"无明显红旗")。
5. 给出 3 个你看不出来的方向(自己的盲区)。

最后一条"给出 3 个你看不出来的方向"是我们后来加的——逼 AI 承认局限,反而让输出更可信。如果 AI 列出"我无法看到 Discord 内部讨论"这种盲区,我们就知道要去人工补这一块。

AI 不能挡所有 rug。但它能挡掉 70% 的低成本 rug,让你把人脑算力留给那些真的"看起来正经"的项目深度跟踪。

查看 Binance 现货研究 看完整 Prompt 库 →

— PromptDeck, 2026-04-25

研究披露:3 个项目案例为匿名化处理后的真实事件复盘,部分细节为合并表达。 本文不指控任何在售项目,仅对已被市场确认为 rug pull 的历史事件做事后分析。不构成投资建议。 本页含 Affiliate 推介链接(Binance,带 rel="sponsored"),通过链接注册我们可能获得佣金,不会增加您的任何费用。 完整披露 →