מדריך בוט Polymarket · פרק 14 מתוך 32
ארביטראז' חדשות ב־Polymarket: איך לנצח את השוק על כותרות, מקורות פיד (RSS/Twitter/AP), תקציבי שיהוי, מסנני false-positive, ומתי יתרון חדשותי מתמוסס לתוך מחיר השוק.
מה הפרק הזה מכסה
ארביטראז' חדשות הוא אסטרטגיה של מסחר במידע ציבורי מהר יותר מהשוק שמעדכן את התמחור שלו. היתרון קיים, אבל צר מאוד - רוב ה"חדשות" כבר מגולמות במחיר עד שבני אדם מספיקים לקרוא אותן. הפרק הזה מסביר אילו מקורות באמת מקדימים את השוק, מהו תקציב השיהוי שמגדיר את האסטרטגיה, ואיזה מסנן false-positive חיוני כדי שהבוט לא יסחור על כל retweet.
- איך נראה יתרון מידע
- מקורות חדשות: RSS, Twitter, AP, פידים רשמיים
- תקציב שיהוי: מהקריאה עד לביצוע בפחות מ־2 שניות
- מסנני false-positive
- מתי היתרון החדשותי מת
- קוד: סריקת פיד חדשות וביצוע FOK בשווקים רלוונטיים
- סיכון: חצאי אמיתות וכותרות שחזרו מהן
איך נראה יתרון מידע
ארביטראז' חדשות פירושו לסחור במידע ציבורי מהר יותר מהשוק שמעדכן את התמחור שלו. היתרון קיים בחלון צר - בדרך כלל 30-300 שניות - בין הרגע שבו עובדה הופכת לציבורית לבין הרגע שבו Polymarket משקף אותה.
כדי שהיתרון יהיה אמיתי, שלושה דברים צריכים להיות נכונים. ראשית, מקור החדשות חייב להיות מהיר יותר מהטריידר הממוצע ב־Polymarket (Twitter מהיר יותר מהעיתונות המיינסטרימית; פיד AP מהיר יותר מ־Twitter). שנית, החדשות חייבות להיות חד־משמעיות (הודעת פציעה, פסיקת בית משפט) - פרשנות אוכלת שיהוי. שלישית, השוק חייב להיות רחב מספיק כדי שהתנועה במחיר תהיה שווה את מס ההפרש.
בוטים שרודפים אחרי היתרון הזה מתחלקים לשני מחנות: כאלה שנרשמים למקורות ישירים ומנתחים אותם, וכאלה שמחפשים תנועה חריגה במחיר ב־Polymarket ומסיקים שקרה אירוע חדשותי. שניהם תקפים; הראשונים מובילים, השניים עוקבים.
מקורות חדשות: RSS, Twitter, AP, פידים רשמיים
דירוג מקורות לפי שיהוי עד מצב של מידע ציבורי, מהמהיר ביותר.
- מקורות ראשוניים ישירים: הגשות לבית משפט, הודעות לעיתונות ממשלתיות, הודעות של בנקים מרכזיים. לעיתים קרובות יש להם RSS ציבורי או API. המהירים ביותר, עם שיעור false-positive הנמוך ביותר.
- פיד AP / Reuters Eikon (בתשלום). הפיד שבו סוחרים מסורתיים משתמשים. יתרון של ~5-30 שניות על פני Twitter של צרכנים.
- Twitter (X, API בתשלום). רשימות של חשבונות מאומתים: חשבונות רשמיים של ארגונים, כתבים מסקרים. APIs חינמיים מוגבלים מדי בקצב; יש לשלם על שכבת Pro או להשתמש בשירות relay.
- ניוזלטרים / Discord מתמחים: Substack בתשלום, פידים תעשייתיים עם embargo. שימושיים לשווקים נישתיים (קריפטו, esports).
- אתרי עיתונות מיינסטרים: איטיים מדי ליתרון של news-arb.
RSS לכל מה שמפרסם RSS - זה חינמי, ומרווחי polling אמינים. Twitter לשאר. AP לחדרי חדשות ברמת ייצור.
תקציב שיהוי: מהקריאה עד לביצוע בפחות מ־2 שניות
הבוט צריך לקלוט, לסווג, להחליט ולבצע פקודה בתוך 1-2 שניות בסך הכול. התקציב:
- קליטה: 50-300ms (פיד websocket, סריקת RSS, stream של Twitter).
- סיווג: 50-200ms (regex / התאמת keyword, ובאופן אופציונלי LLM אם שומרים את ה־prompt במטמון).
- החלטה: 50ms (חיפוש בטבלת כללים; מיפוי מ־news tag ל־market slug).
- ביצוע: 200-500ms (פקודת FOK חתומה ל־CLOB).
המרכיב שהכי "אוכל" תקציב הוא סיווג באמצעות LLM. קריאה ל־GPT-4 עם 500 טוקנים מוסיפה 1-3 שניות; וזה כל חלון ה־arb שנעלם. לייצור, סווגו עם כללי keyword; השתמשו ב־LLM רק לכיול לא מקוון של סט ה־keyword.
מסנני false-positive
בוטי news-arb שלא מסננים false-positive סוחרים על כל retweet ומדממים דרך מס ההפרש. שלושה מסננים.
- רשימת מקורות מאושרת: לפעול רק על חשבונות/פידים ברשימה שאושרה מראש. הרשימה קטנה (10-30 מקורות).
- צמד keyword + אימות: התאמה של keyword בודד היא רעש; התאמות בשני מקורות בלתי תלויים בתוך 30 שניות הן אות.
- Guard למצב השוק: לדלג על שווקים שכבר זזו > 5% ב־60 השניות האחרונות - מישהו אחר כבר תפס את החדשות, והיתרון אבד.
שיעור ה־false-positive של מסננים מכוילים היטב: בערך 1 ל־5-10. שיעור false-positive של 90% הורס את האסטרטגיה; שיעור של 50% עדיין ניתן לעבודה עם גדלי פוזיציה קטנים.
מתי היתרון החדשותי מת
החלון מ"חדשות פורסמו" עד "המחיר משקף את החדשות" נסגר מהר יותר מדי שנה. ב־2020, שווקים פוליטיים במחיר בינוני לקחו דקות כדי לספוג כותרת. ב־2026, אותן כותרות נדחסות ל־30-90 שניות לפני שהמחיר זז במלואו.
סימנים שהיתרון מת: ה־PnL לכל עסקה על טריידים שסומנו יורד מ־+3c לאפס לאורך חלון של 30 טריידים; שיעור ה־false positives שמתבררות ככבר מגולמות במחיר עולה מעל 70%; השוק פוגע ב־FOK ask שלכם בתוך 200ms כי מישהו אחר הגיע לשם קודם.
הפיבוט הכנה כשהיתרון מת: לעבור לחדשות איטיות ופרשניות יותר (פסיקות בית משפט, פרוטוקולים של ישיבות בנק מרכזי) שבהן הבנת המשמעות לוקחת יותר זמן ממירוץ השיהוי. או פשוט להפסיק להפעיל את האסטרטגיה.
קוד: סריקת פיד חדשות וביצוע FOK בשווקים רלוונטיים
שלד ייצור: סרקו מקור חדשות, הריצו התאמות לכללים, הפעילו פקודות FOK על התאמות.
import feedparser, time, re
from py_clob_client.client import ClobClient
RULES = [
{"regex": re.compile(r"out for season|torn ACL", re.I), "tag":"injury-fade"},
{"regex": re.compile(r"federal reserve.*(rate cut|rate hike)", re.I), "tag":"fed-move"},
]
seen = set()
while True:
feed = feedparser.parse("https://example.com/news.rss")
for entry in feed.entries[:20]:
if entry.id in seen: continue
seen.add(entry.id)
for rule in RULES:
if rule["regex"].search(entry.title + " " + entry.summary):
# Look up relevant Polymarket markets, place FOK
fire(rule["tag"], entry)
break
time.sleep(15)
מרווחי polling: 5-15 שניות עבור RSS. WebSocket כאשר זמין (Twitter, פיד AP). תמיד לבצע dedup לפי מזהה שמסופק על ידי המקור; לעולם לא להניח ש־polling הוא בדיוק פעם אחת.
סיכון: חצאי אמיתות וכותרות שחזרו מהן
היום הגרוע ביותר של בוט news-arb הוא כשמתברר שכותרת הייתה שגויה. דוגמאות: ציוץ של Reuters אומר "Trump fires Yellen", השוק קופץ 8 סנט, 12 דקות אחר כך הציוץ נמחק ומתוקן. בוט שקנה ב־+8c מחזיק עכשיו מלאי ב־-3c בלי אפשרות ממשית לתיקון.
הגנות:
- אימות משני מקורות: לעולם לא לסחור על ציוץ יחיד; לדרוש אות מאמת ממקור עצמאי שני בתוך 60-180 שניות.
- גודל פוזיציה מותאם לרמת הביטחון במקור: פיד AP = גודל מלא; Twitter מכתב שטח מאומת = 50%; מקור שמועה = 25%.
- יציאה אוטומטית על אות חזרה מהכותרת: אם מקור שבו השתמשתם מפרסם תיקון בתוך 30 דקות, צאו לפי השוק ללא קשר ל־PnL.
בעיית ה־walk-back היא תקרת זכוכית קשה לגודל פוזיציה בארביטראז' חדשות. מסחר של $50 לכל אות מאפשר לשרוד שיעור false-positive של 30%; מסחר של $500 לא.





