מדריך בוט Polymarket · פרק 14 מתוך 32

ארביטראז' חדשות ב־Polymarket: איך לנצח את השוק על כותרות, מקורות פיד (RSS/Twitter/AP), תקציבי שיהוי, מסנני false-positive, ומתי יתרון חדשותי מתמוסס לתוך מחיר השוק.

מה הפרק הזה מכסה

ארביטראז' חדשות הוא אסטרטגיה של מסחר במידע ציבורי מהר יותר מהשוק שמעדכן את התמחור שלו. היתרון קיים, אבל צר מאוד - רוב ה"חדשות" כבר מגולמות במחיר עד שבני אדם מספיקים לקרוא אותן. הפרק הזה מסביר אילו מקורות באמת מקדימים את השוק, מהו תקציב השיהוי שמגדיר את האסטרטגיה, ואיזה מסנן false-positive חיוני כדי שהבוט לא יסחור על כל retweet.

  • איך נראה יתרון מידע
  • מקורות חדשות: RSS, Twitter, AP, פידים רשמיים
  • תקציב שיהוי: מהקריאה עד לביצוע בפחות מ־2 שניות
  • מסנני false-positive
  • מתי היתרון החדשותי מת
  • קוד: סריקת פיד חדשות וביצוע FOK בשווקים רלוונטיים
  • סיכון: חצאי אמיתות וכותרות שחזרו מהן

איך נראה יתרון מידע

ארביטראז' חדשות פירושו לסחור במידע ציבורי מהר יותר מהשוק שמעדכן את התמחור שלו. היתרון קיים בחלון צר - בדרך כלל 30-300 שניות - בין הרגע שבו עובדה הופכת לציבורית לבין הרגע שבו Polymarket משקף אותה.

כדי שהיתרון יהיה אמיתי, שלושה דברים צריכים להיות נכונים. ראשית, מקור החדשות חייב להיות מהיר יותר מהטריידר הממוצע ב־Polymarket (Twitter מהיר יותר מהעיתונות המיינסטרימית; פיד AP מהיר יותר מ־Twitter). שנית, החדשות חייבות להיות חד־משמעיות (הודעת פציעה, פסיקת בית משפט) - פרשנות אוכלת שיהוי. שלישית, השוק חייב להיות רחב מספיק כדי שהתנועה במחיר תהיה שווה את מס ההפרש.

בוטים שרודפים אחרי היתרון הזה מתחלקים לשני מחנות: כאלה שנרשמים למקורות ישירים ומנתחים אותם, וכאלה שמחפשים תנועה חריגה במחיר ב־Polymarket ומסיקים שקרה אירוע חדשותי. שניהם תקפים; הראשונים מובילים, השניים עוקבים.

מקורות חדשות: RSS, Twitter, AP, פידים רשמיים

דירוג מקורות לפי שיהוי עד מצב של מידע ציבורי, מהמהיר ביותר.

  • מקורות ראשוניים ישירים: הגשות לבית משפט, הודעות לעיתונות ממשלתיות, הודעות של בנקים מרכזיים. לעיתים קרובות יש להם RSS ציבורי או API. המהירים ביותר, עם שיעור false-positive הנמוך ביותר.
  • פיד AP / Reuters Eikon (בתשלום). הפיד שבו סוחרים מסורתיים משתמשים. יתרון של ~5-30 שניות על פני Twitter של צרכנים.
  • Twitter (X, API בתשלום). רשימות של חשבונות מאומתים: חשבונות רשמיים של ארגונים, כתבים מסקרים. APIs חינמיים מוגבלים מדי בקצב; יש לשלם על שכבת Pro או להשתמש בשירות relay.
  • ניוזלטרים / Discord מתמחים: Substack בתשלום, פידים תעשייתיים עם embargo. שימושיים לשווקים נישתיים (קריפטו, esports).
  • אתרי עיתונות מיינסטרים: איטיים מדי ליתרון של news-arb.

RSS לכל מה שמפרסם RSS - זה חינמי, ומרווחי polling אמינים. Twitter לשאר. AP לחדרי חדשות ברמת ייצור.

תקציב שיהוי: מהקריאה עד לביצוע בפחות מ־2 שניות

הבוט צריך לקלוט, לסווג, להחליט ולבצע פקודה בתוך 1-2 שניות בסך הכול. התקציב:

  • קליטה: 50-300ms (פיד websocket, סריקת RSS, stream של Twitter).
  • סיווג: 50-200ms (regex / התאמת keyword, ובאופן אופציונלי LLM אם שומרים את ה־prompt במטמון).
  • החלטה: 50ms (חיפוש בטבלת כללים; מיפוי מ־news tag ל־market slug).
  • ביצוע: 200-500ms (פקודת FOK חתומה ל־CLOB).

המרכיב שהכי "אוכל" תקציב הוא סיווג באמצעות LLM. קריאה ל־GPT-4 עם 500 טוקנים מוסיפה 1-3 שניות; וזה כל חלון ה־arb שנעלם. לייצור, סווגו עם כללי keyword; השתמשו ב־LLM רק לכיול לא מקוון של סט ה־keyword.

מסנני false-positive

בוטי news-arb שלא מסננים false-positive סוחרים על כל retweet ומדממים דרך מס ההפרש. שלושה מסננים.

  • רשימת מקורות מאושרת: לפעול רק על חשבונות/פידים ברשימה שאושרה מראש. הרשימה קטנה (10-30 מקורות).
  • צמד keyword + אימות: התאמה של keyword בודד היא רעש; התאמות בשני מקורות בלתי תלויים בתוך 30 שניות הן אות.
  • Guard למצב השוק: לדלג על שווקים שכבר זזו > 5% ב־60 השניות האחרונות - מישהו אחר כבר תפס את החדשות, והיתרון אבד.

שיעור ה־false-positive של מסננים מכוילים היטב: בערך 1 ל־5-10. שיעור false-positive של 90% הורס את האסטרטגיה; שיעור של 50% עדיין ניתן לעבודה עם גדלי פוזיציה קטנים.

מתי היתרון החדשותי מת

החלון מ"חדשות פורסמו" עד "המחיר משקף את החדשות" נסגר מהר יותר מדי שנה. ב־2020, שווקים פוליטיים במחיר בינוני לקחו דקות כדי לספוג כותרת. ב־2026, אותן כותרות נדחסות ל־30-90 שניות לפני שהמחיר זז במלואו.

סימנים שהיתרון מת: ה־PnL לכל עסקה על טריידים שסומנו יורד מ־+3c לאפס לאורך חלון של 30 טריידים; שיעור ה־false positives שמתבררות ככבר מגולמות במחיר עולה מעל 70%; השוק פוגע ב־FOK ask שלכם בתוך 200ms כי מישהו אחר הגיע לשם קודם.

הפיבוט הכנה כשהיתרון מת: לעבור לחדשות איטיות ופרשניות יותר (פסיקות בית משפט, פרוטוקולים של ישיבות בנק מרכזי) שבהן הבנת המשמעות לוקחת יותר זמן ממירוץ השיהוי. או פשוט להפסיק להפעיל את האסטרטגיה.

קוד: סריקת פיד חדשות וביצוע FOK בשווקים רלוונטיים

שלד ייצור: סרקו מקור חדשות, הריצו התאמות לכללים, הפעילו פקודות FOK על התאמות.

import feedparser, time, re
from py_clob_client.client import ClobClient

RULES = [
  {"regex": re.compile(r"out for season|torn ACL", re.I), "tag":"injury-fade"},
  {"regex": re.compile(r"federal reserve.*(rate cut|rate hike)", re.I), "tag":"fed-move"},
]

seen = set()
while True:
    feed = feedparser.parse("https://example.com/news.rss")
    for entry in feed.entries[:20]:
        if entry.id in seen: continue
        seen.add(entry.id)
        for rule in RULES:
            if rule["regex"].search(entry.title + " " + entry.summary):
                # Look up relevant Polymarket markets, place FOK
                fire(rule["tag"], entry)
                break
    time.sleep(15)

מרווחי polling: 5-15 שניות עבור RSS. WebSocket כאשר זמין (Twitter, פיד AP). תמיד לבצע dedup לפי מזהה שמסופק על ידי המקור; לעולם לא להניח ש־polling הוא בדיוק פעם אחת.

סיכון: חצאי אמיתות וכותרות שחזרו מהן

היום הגרוע ביותר של בוט news-arb הוא כשמתברר שכותרת הייתה שגויה. דוגמאות: ציוץ של Reuters אומר "Trump fires Yellen", השוק קופץ 8 סנט, 12 דקות אחר כך הציוץ נמחק ומתוקן. בוט שקנה ב־+8c מחזיק עכשיו מלאי ב־-3c בלי אפשרות ממשית לתיקון.

הגנות:

  • אימות משני מקורות: לעולם לא לסחור על ציוץ יחיד; לדרוש אות מאמת ממקור עצמאי שני בתוך 60-180 שניות.
  • גודל פוזיציה מותאם לרמת הביטחון במקור: פיד AP = גודל מלא; Twitter מכתב שטח מאומת = 50%; מקור שמועה = 25%.
  • יציאה אוטומטית על אות חזרה מהכותרת: אם מקור שבו השתמשתם מפרסם תיקון בתוך 30 דקות, צאו לפי השוק ללא קשר ל־PnL.

בעיית ה־walk-back היא תקרת זכוכית קשה לגודל פוזיציה בארביטראז' חדשות. מסחר של $50 לכל אות מאפשר לשרוד שיעור false-positive של 30%; מסחר של $500 לא.

שאלות נפוצות

האם בוט קמעונאי באמת יכול לנצח את השוק על חדשות?
כן - אבל רק אם יש לכם מקור חדשות מהיר ואמין ונתיב ביצוע עם שיהוי נמוך. Twitter (כיום X) היה הסטנדרט הזהב עד להגבלות API; RSS מ־Reuters/AP/Bloomberg הוא הדבר הבא הכי טוב. היתרון הקמעונאי הצטמצם ככל שיותר בוטים מתחרים; צפו ל־200-1000ms סה"כ מהקריאה עד לביצוע, לא ל־50ms.
לאילו מקורות חדשות כדאי להירשם?
פידי RSS של AP (apnews.com), Reuters (reuters.com) ו־BBC מספקים כיסוי רחב. עבור Polymarket במיוחד: חשבונות Twitter וערוצי Discord של הפלטפורמות עצמן לעיתים מכריזים מראש על שינויי שוק. לנושאים ספציפיים: הודעות לעיתונות של גופים ממשלתיים (Federal Reserve PDFs, CFTC, WHO).
כמה מהר הבוט שלי צריך להגיב לחדשות?
ליתרון קמעונאי: פחות מ־2 שניות מהרגע שבו החדשות מופיעות עד שההזמנה נשלחת. ליתרון ברמת HFT (לעומת בוטים אחרים): פחות מ־200ms. רוב הטריידרים הקמעונאיים יכולים להתחרות בחלון של 1-3 שניות כי רוב הבוטים הקמעונאיים האחרים אפילו איטיים יותר, או לא קיימים בסוגי פיד מסוימים.
איך נמנעים מטריגרים של false-positive בחדשות?
יש להתאים בזהירות בין החדשות לשוק הספציפי. "Ceasefire" עשוי להופיע ב־100 הקשרים; רק חלקם רלוונטיים לשוק הספציפי שלכם. השתמשו במסנני keyword AND market-tag: keyword "ceasefire" וגם market-tag "Israel-Hezbollah" לפני הטריגר. אפילו טוב יותר - לסווג את החדשות באמצעות LLM כרלוונטיות לפני המסחר.
מה קורה כשמאוחר יותר חוזרים בהם מהחדשות?
הפוזיציה שלכם יכולה להתהפך מרווח להפסד בתוך שניות. בוטי news-arb צריכים מדיניות יציאה מהירה: אם מקור המשך סותר את הכותרת בתוך N דקות, יש לסגור מיד את הפוזיציה גם במחיר הפסד. הכלל שלנו: לסגור ב־-3% עד -5% אם כל המשך מפחית את הביטחון באות המקורי.
האם ארביטראז' חדשות חוקי?
מסחר על חדשות ציבוריות הוא חוקי בכל מקום שאנחנו מכירים. מסחר על מידע מהותי שאינו ציבורי (טיפים פנימיים, הדלפות לפני פרסום רשמי) אינו חוקי. הישארו עם מקורות ציבוריים והמסחר תקין.