第 33 章中的第 9 章
简版
Polymarket 中盈利的 7.6% 钱包和亏损的 84.1% 钱包之间的差别(Sergeenkov Dune,2026 年 4 月,分析了 250 万个钱包)并不是更好的信息 - 而是更好的概率思维。大多数交易者会问“这会发生吗?”盈利的交易者会问“当前价格对吗?”这种单一的重新框定,在职业生涯中被问上一千次,就是全部优势所在。
你将学到
- 为什么价格是概率,而不是预测
- 期望值(EV)- 唯一重要的公式
- 基准率:每个估计都应从这里开始
- 贝叶斯更新以及 90-120 分钟的新闻回归窗口
- 校准:你的概率估计真的准确吗?
- 毁掉新手交易者的七个概率错误
- 一套 30 天练习方案,帮助你建立真正的技能

Polymarket 上的每个价格都是概率估计,不是预测。你的任务是找出那些估计错误的价格。
第一部分:价格不是预测
首先要内化的概念是 - 市场价格并不是预测。它是由所有曾经交易过它的人共同投入的资本所推导出的概率估计。
- 以 $0.65 买入 Yes,意味着市场当前估计该事件发生的概率为 65%
- 这并不意味着“它大概率会发生”
- 它的意思是 - 如果你把这个场景运行 100 次,市场预期其中大约有 65 次会结算为 Yes
- 公允价格等于真实概率。如果你不同意市场给出的概率,你就可能有优势
你的任务是找出那些市场概率估计错误的市场 - 即真实概率与价格存在有意义差异的地方 - 然后站在价格对你有利、被错误定价的一方。
为什么市场通常是对的 - 但并不总是
Justin Wolfers 和 Eric Zitzewitz 在 2004 年发表的里程碑式 Journal of Economic Perspectives 论文《Prediction Markets》显示,在美国大选前一周,预测市场对最终得票率的预测平均绝对误差约为 1.5 个百分点,而最终的盖洛普民调为 2.1 个百分点。同一系列研究(Arrow et al., 2008; Snowberg & Wolfers, Brookings 2013)表明,数千份体育和电影合约的市场价格总体上校准良好 - 也就是说,一个“70%”的结果确实大约会在 70% 的情况下发生。
但“平均而言”并不等于“总是如此”。2024 年美国总统大选就是最近最清晰的例子:在 2024 年 11 月 4 日,Polymarket 给特朗普定价约为 57%,而 Silver Bulletin 模型给哈里斯 54.7% 的优势,FiveThirtyEight 则给她 55%。Polymarket 是对的;民调错了。市场的优势在于速度 - 它在几小时内就吸收了临近选举周期的最新信息(拉美裔选民变化、宾夕法尼亚州提前投票),而民调则需要几天。
第 2 部分:期望值 - 唯一重要的数字
期望值(EV)告诉你,一笔交易从长期来看是否有利可图,不管某一笔交易的结果如何。正 EV 重复足够多次就能赚钱。负 EV 重复足够多次就会亏钱。单笔结果只是这一趋势周围的噪音。
公式
每股 EV =(你的概率 × $1.00)− 入场价格
或者等价地,就你的完整仓位而言:
EV =(你的概率 × 赔付)− 成本
计算示例
市场:"Bitcoin 会在 2026 年 6 月 30 日收于 $100,000 以上吗?"
Yes 价格:$0.35(市场概率 = 35%)
你研究后的估计:50%
你以 $0.35 买入 100 份 Yes 股,总成本 $35。
- 如果判断正确(50% 的时间):你收到 $100。利润 = $65。
- 如果判断错误(50% 的时间):你收到 $0。亏损 = $35。
- EV =(0.50 × $100)− $35 = $50 − $35 = 每 100 股 +$15
这是一笔正 EV 交易。平均而言,在许多类似交易中,你预期每 100 股赚 $15。你仍然会有 50% 的时间判断错误 - 但当你判断正确时,回报足以弥补。

在标签页中一直打开 EV 计算器。如果你不能在 10 秒内看出这个数字,那你就是凭感觉在交易。
何时不要交易
如果市场说是 35%,而你也认为是 35%,那么 EV 恰好为零:
EV =(0.35 × $100)− $35 = $0
没有优势。不要交易。你只是在为这种体验支付价差和手续费。专业交易的纪律在于,你能看 100 个市场,如果没有一个提供 EV,就能一笔都不交易。大多数散户交易者无法抵挡行动冲动 - 这正是 84.1% 亏损率的最大来源。
第 3 部分:重新定义每一个问题
初学者最常见的单一错误,就是问错了问题。把每一笔交易都这样重构:
| 错误(初学者)问题 | 正确(专业)问题 |
|---|---|
| 比特币会涨到 10 万美元吗? | 真实概率是高于还是低于 35%? |
| 民主党会赢得参议院吗? | 真实概率是高于还是低于 84%? |
| 堪萨斯城会赢得超级碗吗? | 真实概率是高于还是低于 22%? |
| 会有停火吗? | 真实概率是高于还是低于 40% - 而且结算规则是否真的符合我对停火的定义? |
定价偏差的大小,就是你的优势。2 个百分点的差距(市场 95%,你 97%)几乎不值得交易。15 个百分点的差距(市场 30%,你 45%)就很有意义。30 个百分点的差距通常意味着你漏看了市场已经看到的东西 - 在下注前先回去检查。
差距过大警告
如果你认为市场偏离超过 20 个百分点,先假定自己是错的 first。Polymarket 里聚合起来的全部资金 - 在大市场里通常是数千万美元 - 正在做相反的下注。他们可能会错。通常不会。在交易一个 30 个百分点的差距之前,花 30 分钟主动尝试证明自己是错的。如果你做不到,也许你真的有优势。
第 4 部分:基准率 - 锚点
基准率是某个事件在历史上发生的频率。所有概率估计都应从这里开始。

你打开的基准率来源标签页: FRED、538 档案、NOAA、CME FedWatch、Wikipedia,方便快速查阅事实。
| 事件类型 | 基准率 | 来源 |
|---|---|---|
| 现任美国总统赢得连任 | ~65% (自 1900 年以来 17 次中的 11 次) | Wikipedia / 270towin 档案 |
| SAG 团体奖获奖者同时赢得最佳影片 | ~80% (自 1995 年以来 25 次中的 20 次) | SAG Awards / AMPAS 历史记录 |
| 某季节美国登陆的 4 级及以上飓风 | ~55% | NOAA HURDAT2 |
| 美联储在某次 FOMC 会议上加息 | ~22% 的会议(自 1994 年以来) | FRED FEDFUNDS 系列 |
| NBA 头号种子赢得首轮系列赛 | ~96% (自 1984 年七战四胜制时代以来) | basketball-reference |
| 奥斯卡最佳影片提名前的热门影片最终获奖 | ~58%(过去 20 年) | AMPAS 记录 |
| 标普 500 月度收益为正 | ~63%(自 1928 年以来) | Shiller 数据 / Yahoo Finance |
| 签署 90 天后停火依然维持(中东) | ~34% (CFR 跟踪器 1990-2024) | 外交关系委员会 |
如何使用基准率
- 在查看市场价格之前,先确定相关的基准率
- 根据当前的具体条件向上或向下调整(伤病、民调趋势、通胀读数)
- 结果就是你的概率估计
- 与市场价格比较。考虑手续费和价差后,这个差距是否足够大到值得交易?
经过验证的基准率来源
- 政治:270towin、Nate Silver 的 Silver Bulletin 档案、Cook Political Report、CBS YouGov 面板数据
- 经济:FRED (圣路易斯联储)、BLS、BEA、CME FedWatch、亚特兰大联储 GDPNow
- 体育:basketball-reference、Pro-Football-Reference、Baseball-Reference、nflfastR、Opta 数据
- 天气:飓风的 NOAA HURDAT2、NWS 气候常年值、IRI ENSO 档案
- 金融:Shiller 的耶鲁数据、Kenneth French 的达特茅斯因子库、CBOE VIX 历史数据
- 通用:Wikipedia 用于快速常识核查,Kaggle 用于原始数据集,Our World in Data 用于社会趋势
第 5 部分:贝叶斯更新 - 当新闻爆出时
随着新信息到来,你的概率估计应该改变。严谨地完成这一过程的框架是贝叶斯更新。
流程
- 从你的先验开始 - 你的初始概率(通常基于基准发生率)
- 新信息到来 - 民调结果、财报超预期、伤病公告、外交声明
- 问:这条具体信息会在多大程度上改变概率?
- 将你的估计更新为新的后验概率
- 与市场的新价格比较。还有优势吗?

典型的新闻回归模式 - 先是剧烈飙升,然后在 90-120 分钟内回撤约 60% 的过度反应。
新闻发布后的前 15 分钟是最差的交易时机
学术研究以及 Polymarket 相关研究表明,在 2-15 分钟的“信息发现”窗口内,价格尚未完全调整,随后会出现过冲,然后回归均值。大约60% 的均值回归发生在突发新闻后的 90-120 分钟内。市场先过度反应,然后才稳定下来。在过度反应窗口冲进去,就是把散户的利润送给专业人士。记下新闻,更新你的模型,等两小时,再重新评估。
一个简单的贝叶斯例子
先验:你认为美联储在下次会议上有 40% 的概率降息(基于点阵图、通胀轨迹)。
新闻:CPI 比预期低 0.3%。历史上,在重大通胀不及预期后的一个月里,美联储降息的可能性大约高 1.5 倍。
粗略更新:40% × 1.5 = 60% 的降息概率(忽略上限效应)。
市场:价格在前 10 分钟内从 40% 跳到 68%。你认为合理价格是 60%。市场过度反应了。建立一个小的 No 头寸可能有利润 - 但先等 2 小时,看看是否在入场前出现均值回归。
第6部分:校准 - 你真的准吗?
校准是你所陈述的信心与现实之间的一致性。如果你说某事有 70% 的概率,那么在大量预测中,它们实际发生的比例应该大约是 70%。

校准曲线 - 严肃交易者为自己建立的最重要的一张图表。
如何衡量你的校准
- 在每笔交易前,写下你的概率估计(例如,"55%")
- 在结果结算后记录实际结果
- 在 50 笔以上交易后,把你的估计分桶:50-60%、60-70%、70-80%,等等
- 在每个桶中,衡量实际命中率
- 校准良好的交易者的各个桶应该命中其标称概率(理想情况下在 ±5 个百分点以内)
| 信心区间 | 校准良好的命中率 | 常见的校准偏差模式 |
|---|---|---|
| 50-60% | ~55% | 信心不足的交易者命中率约为 ~65% |
| 60-70% | ~65% | 过度自信的交易者命中率约为 ~55% |
| 70-80% | ~75% | 过度自信的交易者命中率约为 ~60% |
| 80-90% | ~85% | 过度自信的交易者命中率约为 ~70% |
| 90-100% | ~95% | 极度过度自信 - 失败率达到 25% 以上的"确定性" |
常见的校准问题
- 过度自信:你说是 90%,实际命中率却是 70%。你对自己太有把握了。解决方法:除非你有压倒性的具体证据,否则把极端信心上限设为 85%。
- 信心不足:你说是 55%,实际命中率却是 75%。你没有相信自己的分析。解决方法:当你已经完成了该做的工作,就果断给出那个数字。
- 极端回避:即使有理由,你也从不说高于 85% 或低于 15%。解决方法:接受有些事情的确有 95% 的可能性。
- 网格吸附:你只用整数 - 50、60、80、95。解决方法:使用完整范围 - 62%、73%、88%。
样本量很重要
有了 50 个预测,你大致可以看出你的校准曲线形状。有了 100 个预测,你就可以把单个区间信赖到 ±7 个百分点。有了 500 个以上,你就能对特定概率区间做出有力判断。Tetlock 的 Good Judgment Project 预测者在他们的校准数字稳定下来之前,记录了 500-1,000+ 个问题。预计你至少需要六个月的纪律性记录,才能让你的曲线真正有意义。
第 7 部分:七种会害死交易者的概率错误

把这张贴在你的显示器上。每当你忘记这些时,所有这些错误每周都会让盈利交易者损失金钱。
1. 锚定
你看到市场价格是 $0.65,而“你自己”的独立估计神秘地落在 60-70%。你已经被市场锚定了。修正方法:在看价格之前先形成你的估计。如有必要,使用隐藏标签页。
2. 近因偏差
一支球队赢了最近三场比赛,于是你觉得他们势不可挡 - 却忽略了他们 20-40 的赛季战绩。修正方法:始终锚定基准率,而不是最近的连胜。
3. 叙事谬误
你为某个结果为什么必须发生编造了一个引人入胜的故事,并把故事的生动性误当成概率。"通胀正在上升,美联储别无选择 - 这显而易见。" 故事很有说服力,但不是证据。修正方法:在构建叙事之前先问“基准率是多少?”
4. 合取谬误
因为某个具体场景感觉更丰富,你就认为它比一个更一般的场景更可能发生。"民主党赢得参议院并且通过医疗改革"听起来比单纯的"民主党赢得参议院"更可能 - 但从数学上讲,它总是更不可能。修正方法:当一个场景涉及多个事件时,分别相乘它们各自的概率。
5. 动机性推理
你希望某个候选人或球队获胜,所以你的估计往上漂移。修正方法:如果你发现自己在为某个结果加油,就重新核对你的估计。考虑把对立一方拿来交易,以此作为一种纪律约束。
6. 可得性偏差
最近的戏剧性事件会显得比实际更可能。一次飞机失事后,人们会把未来发生空难的概率估得更高。在 Polymarket 上,这会在重大冷门("这种事总是发生")之后,或在像乌克兰矿产 700 万美元 UMA 争议这样的戏剧性结局之后表现出来 - 交易者会在无关市场上短暂地把争议风险定价过高。修正方法:锚定已发布的统计数据,而不是个人情绪冲击。
7. 基准率忽视
你完全关注当前的具体情境,而忽略历史频率。"这次具体选举不一样 - 民调不适用。" 有时是真的,但通常不是。修正方法:先看基准率,再进行调整。
第 8 部分:30 天练习方案
校准就像举重 - 它是通过重复训练建立起来的。以下就是盈利的 Polymarket 交易者一直在用的完整方案:
| 周 | 每日任务 | 目标 |
|---|---|---|
| 第 1 周 | 每天 5 个纸面预测,类别不同,不交易 | 学会在不交易的情况下写出概率 |
| 第 2 周 | 5 个纸面预测 + 每个市场 10 分钟研究记录 | 培养基准概率检索反射 |
| 第 3 周 | 5 个纸面预测 + 给任何已结算的预测打分 | 第一个校准反馈循环 |
| 第 4 周 | 回顾全部 140 个预测。绘制校准曲线。找出最差的类别。 | 产出你的第一个真实校准数值 |
为什么这有效
连续一个月每天记录 5 个估计值(150 个预测),比只读一年校准相关内容却不衡量自己的效果更有价值。几乎没有散户交易者真正会这样做 - 这也是为什么几乎没有散户交易者能进入有盈利的 7.6%。练习本身是免费的;结果不是。
可直接复制的模板
在电子表格或 Notion 表格中设置五列:
- 市场 & 结算截止时间
- 你的先验(研究前、看到价格前)
- 你的后验(研究后、仍未看到价格前)
- 你做决策时的市场价格(你最后填写的那一列)
- 结果(是/否/无效,以及结算日期)
从这个表计算校准、Brier 分数和平均边缘,只需要 10 行 Google Sheets 公式。完整模板见 交易策略。
第9部分:你需要多大的优势?
你的优势必须先覆盖三项成本,之后你才能获利:
- 买卖价差 - 在流动性好的市场通常为 1-3%,在流动性差的市场为 5-10%
- 平台费用 - 政治/地缘政治 0%,体育 0.75%,金融/科技 1.00%,经济 1.25%,加密货币 1.80%
- 你自己的噪音/误差 - 为不完美的校准预留约 3-5 个百分点的缓冲

按类别划分的最低优势。打印出来,过塑,放在交易屏幕旁边。
| 市场类型 | 典型价差 | 费用(吃单方) | 入场所需最低优势 |
|---|---|---|---|
| 流动性好的政治/地缘政治 | 1-2% | 0% | 5-6 pp |
| 流动性好的体育 | 1-3% | 0.75% | 6-8 pp |
| 流动性好的加密货币 | 2-4% | 1.80% | 8-10 pp |
| 流动性差的市场(任何类别) | 5-10% | 视情况而定 | 12-15 pp |
| 存在主观结果判定的市场 | 任意 | 任意 | 额外增加 3-5 pp 缓冲 |
在实践中,在流动性好的市场上,你在入场前最好至少有 5-8 个百分点 的表面优势;在流动性差的市场上则需要 10-15 个百分点。低于这个水平,你所谓的“优势”就会在执行成本和估计误差中消失。
第10部分:来自盈利交易者的经验证技巧
真正有效的专业技巧
- 先在评论里写下你的估计。 Polymarket 的评论框会自动起草 - 在看价格前输入“我的估计:54%”会迫使你做出承诺。
- 只交易同样的 3-5 个类别。 7.6% 的盈利交易者通常会专注于某一领域。样样通不如精通基础概率的人。
- 建立一个 10 个市场的观察清单。 每天早上在不看市场的情况下重新给每个市场定价。30 天后,你就会发现自己是在锚定、受情绪影响,还是确实校准得很好。
- 条件概率永远要相乘,绝不要相加。 “候选人赢得初选并且赢得大选”应当是初选 × 大选,而不是初选 + 大选。
- 使用 Brier 分数。 Brier = (概率 − 结果)²。越低越好。Brier 为 0.18 的交易者通常持续优于 0.22 的交易者。每周跟踪。
- 当你的 Brier 上升时,减少交易规模。 你的校准状态在告诉你一些事情。在恢复之前,把仓位减半 50%。
第11部分:何时完全忽略市场
在某些特定情况下,市场会系统性失真,而概率思维最能发挥作用:
- 流动性真空。 极薄的市场(<$50K 成交量),单个巨鲸在没有真实信息的情况下推动了价格。查看最近 10 笔交易 - 如果一笔 $20K 订单让市场移动了 10 个百分点,那就是噪音,不是信号。
- 结算规则歧义。 像“会有停火吗?”这类市场。市场参与者对定义有分歧。阅读规则,判断结算将采用哪种解释,然后再定价。
- 新闻发布后的前 15 分钟。 前面已经提到 - 但值得重复:过度反应窗口正是耐心的贝叶斯交易者收割有纪律但反应快的交易者的时候。
- 临近到期的体育市场。 比赛临近结束且只剩 5 分钟时,由于订单簿深度变薄,市场经常定价错误。严格纪律化地进行短线交易。
- 在相同市场之间套利。 如果 Polymarket 对同一事件给出 0.62,而 Kalshi 给出 0.55,那么其中一个就是错的。2026 年 4 月 24-25 日提取出的 4000 万美元以上无风险套利表明,这类价差在实时中确实存在。
关键要点
那些在 Polymarket 上持续盈利的交易者,把概率思维当作一个系统,而不是凭感觉。记住上面的数字 - 它们就是 7.6% 的盈利钱包与其他钱包之间的差别。
接下来是什么?
推荐阅读
如果你是新手,从这里开始;或者直接跳到与你所处阶段相匹配的页面:











