בניית מודל מסחר כמותי הופכת תצפית שוק לתוכנית מסחר מוגדרת לחלוטין, ניתנת לבדיקה ולמדידה, על ידי הגדרת כללים מפורשים לכניסה, יציאה, גודל פוזיציה וניהול סיכונים, ולאחר מכן אימות כללים אלה מול נתונים היסטוריים. מדריך זה עובר את התהליך המלא מהשערה ראשונית למודל מאומת, מכסה את טכניקות האימות הקריטיות שמפרידות בין מודלים חזקים לאשליות של התאמת-יתר, מציג דוגמה קונקרטית של מודל מומנטום ראשון, ומזהה את הטעויות שגורמות לרוב המודלים הראשונים להיכשל.
מהו מודל מסחר כמותי
מודל מסחר כמותי הוא מערכת כללים מוגדרת מתמטית המפרטת כל החלטה בתהליך המסחר ללא צורך בשיקול דעת אנושי בנקודת הביצוע. המודל חייב להגדיר חמישה מרכיבים: יקום המכשירים למסחר, האות שמזהה הזדמנויות, כלל הכניסה שמפעיל פוזיציה, כלל היציאה שסוגר אותה, וכלל גודל הפוזיציה שקובע כמה הון להקצות.
אם רכיב כלשהו דורש פרשנות שיקולית — "המגמה נראית חזקה," "הנפח נראה גבוה," "תבנית הגרף מתגבשת" — המערכת אינה מוגדרת ככמותית. המאפיין המגדיר של מודל כמותי הוא ששני אנשים שונים שמקבלים את אותו מודל ואותם נתונים יפיקו תוצאות זהות. שחזוריות זו היא מה שהופך בדיקה, אימות ושיפור שיטתיים לאפשריים.
התחלה פשוטה והוספת מורכבות רק כאשר הנתונים מצדיקים זאת היא הגישה בעלת הסיכוי הגבוה ביותר לייצר מודל שעובד במסחר חי.
מדריך שלב אחר שלב לבניית המודל הראשון שלך
בניית מודל מסחר כמותי עוברת שמונה שלבים רציפים. דילוג על שלבים או שינוי סדרם מכניס הטיות שפוגעות בתקפות המודל.
זהה תצפית שוק שמרמזת על דפוס חוזר. כל מודל מתחיל בהשערה המושרשת בהתנהגות שוק נצפית. התצפית עשויה לנבוע מקריאת גרפים, מחקר אקדמי, סינון כמותי או ניסיון שוק. דוגמאות: "מניות שעושות פער מעלה ביום דוחות נוטות להמשיך לעלות במשך מספר ימים," "מטבעות שסוטים מפערי ריבית נוטים לחזור," או "מניות קטנות עם חוזק יחסי עולה מציגות ביצועי יתר ברבעון הבא." התצפית חייבת להיות ספציפית מספיק כדי לתרגם לכלל מדיד.
בטא את התצפית כהשערה ניתנת לבדיקה עם משתנים מוגדרים. המר את התצפית האיכותית לאמירה כמותית מדויקת. "מניות שעושות פער מעלה ביום דוחות" הופכת ל"מניות שמחיר הפתיחה שלהן ביום הדוחות עולה על הסגירה הקודמת ביותר מ-2 סטיות תקן של תשואות יומיות אחרונות." כל משתנה חייב להיות מוגדר מספרית. כתוב את ההשערה המלאה לפני שאתה מסתכל על נתונים היסטוריים כלשהם.
הגדר את כללי המסחר המלאים לפני הבדיקה. פרט תנאי כניסה, תנאי יציאה (הן יעד רווח והן סטופ-לוס), שיטת גודל פוזיציה, מספר מקסימלי של פוזיציות מקבילות, וכל מסנני יקום. המשמעת הקריטית היא להתחייב לכללים לפני שרואים תוצאות כלשהן. התאמת כללים לאחר ראיית פלט הבדיקה לאחור היא תחילתה של התאמת-יתר.
אסוף והכן את הנתונים הנדרשים. השג נתוני מחירים היסטוריים כולל ניירות ערך שנמחקו כדי להימנע מהטיית שרידות. אמת את איכות הנתונים על ידי בדיקת פערים, פיצולים והתאמות דיבידנד. עבור רוב המודלים הראשונים, נתוני OHLCV יומיים מספיקים. מקורות כוללים Yahoo Finance ו-Alpha Vantage לנתונים חינמיים; CSI Data ו-Norgate לנתונים ברמה מקצועית.
יישם את המודל בקוד ואמת נכונות. תרגם את הכללים הכתובים למנוע בדיקה לאחור — גיליון אלקטרוני, Python, או פלטפורמה ייעודית כמו AmiBroker או QuantConnect. אמת על ידי בדיקה ידנית של 10-20 עסקאות מול נתוני מחירים גולמיים כדי לוודא שהקוד נכנס ויצא במחירים ובתאריכים הנכונים. באגים ביישום הם המקור הנפוץ ביותר לתוצאות בדיקה לאחור מנופחות.
הרץ את הבדיקה לאחור על נתוני in-sample ורשום את כל מדדי הביצועים. בצע את המודל מול חלק ה-in-sample (בדרך כלל 70%) של הנתונים ההיסטוריים. רשום את מערכת מדדי הסיכון המלאה: יחס Sharpe, יחס Sortino, ירידה מקסימלית, יחס Calmar, פקטור רווח, שיעור הצלחה, ומכפיל R ממוצע. אם המודל מייצר פחות מ-30 עסקאות, המדגם קטן מדי למסקנות אמינות.
אמת על נתוני out-of-sample באמצעות ניתוח walk-forward. בדוק את המודל על 30% הנתונים השמורים שלא שימשו בפיתוח. השווה מדדי out-of-sample למדדי in-sample. מודל שמציג ביצועים דומים בשני המדגמים יש לו יתרון אמיתי. מודל שמציג ביצועים גרועים משמעותית ב-out-of-sample הותאם-יתר לנתוני ה-in-sample ודורש פישוט או דחייה.
בצע סימולציית Monte Carlo וניתוח רגישות. הרץ סימולציית Monte Carlo על תוצאות העסקאות כדי לקבוע את הטווח הריאליסטי של ירידות ואת ההסתברות לפשיטת רגל. לאחר מכן בדוק רגישות פרמטרים: אם שינוי ממוצע נע מ-20 תקופות ל-22 גורם לאסטרטגיה לקרוס, המודל שביר ומותאם-יתר לערך פרמטר ספציפי. מודלים חזקים מציגים ביצועים עקביים על פני טווח של ערכי פרמטר סבירים.
יצירת השערה ניתנת לבדיקה מתצפית שוק
יצירת השערה ניתנת לבדיקה דורשת המרת תצפית שוק איכותית לאמירה כמותית עם משתנים, ספים ותוצאות צפויות מוגדרים. ההשערה חייבת להיות ניתנת להפרכה — חייב להיות אפשרי שהנתונים יוכיחו אותה שגויה. "מומנטום עובד" אינה ניתנת לבדיקה. "מניות בעשירון העליון של תשואה ל-12 חודשים, למעט החודש האחרון, מציגות ביצועי יתר על העשירון התחתון ב-5% שנתי לפחות ברבעון הבא" היא ניתנת לבדיקה.
השערות טובות מגיעות משלושה מקורות. מאמרי מחקר אקדמיים מספקים אנומליות מתועדות היטב עם ראיות שפורסמו: מומנטום, ערך, תנודתיות נמוכה ופקטורי איכות נהנים מתמיכה אקדמית נרחבת. תצפיות פרקטיקנים מזהות דפוסים הנראים במסחר יומיומי: פריצות טווח פתיחה, חזרה לממוצע אחרי תנועות קיצוניות, ודפוסי רוטציית סקטורים. חקירת נתונים שיטתית באמצעות כלי סינון וניתוח סטטיסטי חושפת קשרים שלא אקדמאים ולא קוראי גרפים פרסמו.
ההשערה צריכה לכלול רציונל כלכלי — סיבה מדוע הדפוס קיים ומדוע הוא צפוי להימשך. דפוס ללא רציונל כלכלי עשוי להיות ארטיפקט סטטיסטי שנעלם ברגע שמתגלה.
קידוד המודל — גישת גיליון אלקטרוני לעומת Python
קידוד המודל בגיליון אלקטרוני הוא הדרך המהירה ביותר לסוחרים ללא ניסיון בתכנות, בעוד Python מציע יותר גמישות וסקלביליות למי שמוכן להשקיע בלמידה. שתי הגישות תקפות למודל ראשון.
גישת הגיליון האלקטרוני עובדת היטב למודלים הסוחרים במכשיר בודד או ביקום קטן (פחות מ-20 מכשירים). הגדר עמודות לתאריך, נתוני OHLCV, אינדיקטורים מחושבים, תנאי אות, סטטוס פוזיציה והון. המגבלה היא שגיליונות הופכים מסורבלים עם יקומים גדולים או פוזיציות מקבילות מרובות.
גישת Python משתמשת בספריות כמו pandas לטיפול בנתונים, numpy לחישובים, ו-backtrader, zipline או vectorbt לתשתית בדיקה לאחור. Python מטפל ביקום בגודל בלתי מוגבל, ניהול פוזיציות מורכב, ומשתלב ישירות עם כלי ניתוח סטטיסטי וסימולציית Monte Carlo.
למודל ראשון, הבחירה חשובה פחות מהשלמת הפרויקט. התחל עם כל כלי שמביא אותך לתוצאה מוגמרת ומאומתת הכי מהר.
הרצת הבדיקה לאחור ורישום מדדי ביצועים
הרצת הבדיקה לאחור דורשת ביצוע המודל מול נתונים היסטוריים ולכידת כל מדד ברמת העסקה וברמת התיק הנדרש להערכה. הבדיקה לאחור צריכה לייצר שלושה פלטים: יומן עסקאות מלא, עקומת הון יומית, וטבלת סטטיסטיקות מסכמת.
יומן העסקאות רושם כל כניסה ויציאה: תאריך, מכשיר, כיוון, מחיר כניסה, מחיר יציאה, גודל פוזיציה, רווח/הפסד דולרי, תשואה באחוזים, מכפיל R ותקופת החזקה. יומן זה מאפשר ניתוח ברמת העסקה ומזין ישירות לסימולציית Monte Carlo.
עקומת ההון היומית עוקבת אחר ערך התיק לאורך זמן, כולל רווחים והפסדים לא ממומשים על פוזיציות פתוחות. שרטט את עקומת ההון ויזואלית והשווה למדד ייחוס (S&P 500 לאסטרטגיות מניות) כדי לאשר שהמודל מוסיף ערך מעבר לחשיפה פסיבית לשוק.
טבלת הסטטיסטיקות המסכמת צריכה לכלול את כל שבעת מדדי הסיכון החיוניים בתוספת מספר העסקאות, תקופת החזקה ממוצעת ואחוז הזמן המושקע. אם המודל אינו עומד בספי מינימום, תעד מדוע והתקדם הלאה במקום לכוונן פרמטרים כדי לאלץ תוצאה עוברת.
אימות המודל — בדיקת Out-of-Sample וניתוח Walk-Forward
אימות מפריד בין יתרונות מסחר אמיתיים לארטיפקטים סטטיסטיים שנוצרו על ידי התאמת-יתר. מודל שלא אומת על נתונים שלא נראו הוא השערה שלא נבדקה, ללא קשר למידת הרשמיות של הבדיקה לאחור שלו.
חלוקת 70/30 — הקצאת נתוני In-Sample לעומת Out-of-Sample
חלוקת 70/30 מחלקת נתונים היסטוריים לקטע in-sample גדול יותר לפיתוח וקטע out-of-sample קטן יותר לאימות. תקופת ה-in-sample (70%) משמשת לכל בדיקות ההשערות, בחירת פרמטרים ופיתוח כללים. תקופת ה-out-of-sample (30%) שמורה אך ורק לאימות סופי ולעולם אינה משמשת לשינוי המודל.
החלוקה חייבת להיות כרונולוגית, לא אקראית. לנתוני שוק יש מבנה זמני שחלוקה אקראית תשבש. תקופת ה-in-sample צריכה להיות החלק המוקדם יותר, ותקופת ה-out-of-sample החלק המאוחר יותר, בדומה לפיתוח על נתוני עבר ופריסה אל העתיד.
ירידה מסוימת ב-out-of-sample צפויה ומקובלת. כלל אצבע: אם יחס Sharpe ב-out-of-sample הוא לפחות 50% מיחס Sharpe ב-in-sample ופקטור הרווח נשאר מעל 1.2, למודל ככל הנראה יש יתרון אמיתי. אם ביצועי out-of-sample גרועים באופן דרמטי, המודל הותאם-יתר ויש לפשט או לנטוש אותו.
אופטימיזציית Walk-Forward — תקן הזהב לאימות מודלים
אופטימיזציית walk-forward היא שיטת האימות המחמירה ביותר, הבודקת ביצועים על פני מספר תקופות out-of-sample רציפות כדי לשלול את האפשרות שבדיקה בודדת הייתה חיובית במקרה.
התהליך מחלק נתונים לחלונות חופפים, מבצע אופטימיזציה על כל חלון in-sample ובודק על חלון ה-out-of-sample שמיד אחריו. התהליך פועל כך: בצע אופטימיזציה על חודשים 1-12, בדוק על חודשים 13-15. לאחר מכן בצע אופטימיזציה על חודשים 4-15, בדוק על חודשים 16-18. המשך בתהליך מתגלגל זה על פני כל מערך הנתונים. תוצאות ה-out-of-sample המשורשרות מכל החלונות מרכיבות את עקומת ההון של ה-walk-forward, המייצגת את הקירוב הטוב ביותר לביצועי מסחר חי שבדיקה היסטורית יכולה לספק.
יחס היעילות של walk-forward — היחס בין ביצועי out-of-sample ל-in-sample — מודד כמה מהיתרון שורד את המעבר מאופטימיזציה לתנאי שוק חיים. יחסים מעל 0.5 מעידים על מודל חזק. יחסים מתחת ל-0.3 מעידים על התאמת-יתר מופרזת בזמן האופטימיזציה.
דוגמה למודל ראשון — אסטרטגיית מומנטום פשוטה
אסטרטגיית מומנטום לדוגמה זו מגדירה מודל כמותי ראשון שלם עם כל מרכיב מפורט וללא צורך בשיקול דעת שיקולי. כל מרכיב מוגדר ללא צורך בשיקול דעת שיקולי.
| מרכיב | כלל |
|---|---|
| יקום | מרכיבי S&P 500 (מורכב מחדש חודשית כדי להימנע מהטיית שרידות) |
| אות | תשואה כוללת ל-12 חודשים למעט החודש האחרון (חודשים 2-12), מדורגת על פני כל חברי היקום |
| כניסה | באיזון מחדש החודשי, קנה את 20 המניות המובילות בדירוג מומנטום אם הן מעל הממוצע הנע ל-200 ימים שלהן |
| יציאה | מכור באיזון מחדש החודשי אם המניה יורדת מתוך 30 המובילות בדירוג מומנטום או נופלת מתחת לממוצע הנע ל-200 ימים שלה |
| גודל פוזיציה | משקל שווה: הקצה 5% מהון התיק לכל אחת מ-20 הפוזיציות; אזן מחדש חודשית |
| איזון מחדש | יום המסחר הראשון בכל חודש; בצע במחיר הסגירה |
מודל זה לוכד את אנומליית המומנטום המתועדת היטב תוך שימוש בממוצע הנע ל-200 ימים כמסנן מגמה. כלל "דלג על החודש האחרון" מטפל באפקט ההיפוך קצר-הטווח שמזהם אותות מומנטום גולמיים ל-12 חודשים.
ביצועים צפויים בהתבסס על מחקר שפורסם: תשואה שנתית של 10-14%, ירידה מקסימלית של 35-55%, יחס Sharpe של 0.4-0.7, ופקטור רווח של 1.3-1.6. נתונים אלה צנועים אך מייצגים יתרון אמיתי שהתמיד לאורך עשורים ושווקים.
מודל זה פשוט בכוונה. מודלים ראשונים צריכים להיות פשוטים כי מורכבות מגבירה את סיכון ההתאמת-יתר ומקשה על ניפוי באגים. לאחר אימות, ניתן להוסיף מורכבות בהדרגה — גודל פוזיציה מותאם תנודתיות, מגבלות סקטור, או פקטורים נוספים — כאשר כל תוספת נבדקת באופן עצמאי.
טעויות נפוצות במודל ראשון וכיצד להימנע מהן
טעויות במודל ראשון מתקבצות בחמש קטגוריות, שכל אחת מהן יכולה לייצר בדיקה לאחור שנראית רווחית אך נכשלת מיד במסחר חי.
התאמת-יתר באמצעות אופטימיזציית פרמטרים מופרזת. מודל עם שבעה פרמטרים מאופטמים ו-100 עסקאות כמעט בוודאות הותאם לרעש. היחס בין עסקאות לפרמטרים צריך לעלות על 30:1 לכל הפחות. מודל ראשון צריך לכלול לא יותר מ-2-3 פרמטרים, כאשר כל אחד עובד על פני טווח ערכים ולא מספר קסם אחד.
הטיית שרידות מנתונים לא שלמים. בדיקה על מרכיבי S&P 500 הנוכחיים מדירה חברות שהוסרו במהלך תקופת הבדיקה, רבות מהן הוסרו כי ירדו משמעותית. הטייה זו מנפחת תשואות ב-1-3% שנתית. השתמש בנתוני מדד מורכבים מחדש הכוללים את כל החברים ההיסטוריים.
הטיית מבט-קדימה משימוש במידע עתידי. זה קורה כאשר המודל משתמש בנתונים שלא היו זמינים בזמן העסקה: נתונים כלכליים מתוקנים במקום פרסומים ראשוניים, הרכב מדד עתידי, או אותות שחושבו באמצעות כל תקופת הנתונים ולא רק נתונים שהיו זמינים עד תאריך כל עסקה.
התעלמות מעלויות עסקה ואי-דיוק ביצוע. כלול עלויות עסקה ריאליסטיות בכל בדיקה לאחור: עמלות, מרווחי bid-ask והשפעת שוק. מודל שמייצר 500 עסקאות בשנה על מניות קטנות יאבד חלק ניכר מהתשואות הגולמיות לחיכוך. השתמש ב-0.05% אי-דיוק ביצוע למניות גדולות ו-0.1-0.3% למניות קטנות או מכשירים לא נזילים.
בלבול בין מובהקות סטטיסטית למובהקות כלכלית. אסטרטגיה עם t-statistic מובהק אך תשואה שנתית של רק 0.3% אחרי עלויות היא אמיתית סטטיסטית אך חסרת תועלת כלכלית. כל מודל חייב לעבור את שני המבחנים: ראיה סטטיסטית שהיתרון אינו אקראי, וראיה כלכלית שהוא גדול מספיק למסחר רווחי אחרי כל העלויות.
כיצד לשפר את המודל שלך לאורך זמן
שיפור מודל כמותי עוקב אחר תהליך משמעתי: זהה חולשה ספציפית, העלה השערה לשיפור ממוקד, יישם את השינוי, ובדוק האם השיפור מחזיק ב-out-of-sample. שיפור לא ממושמע — שינוי מספר משתנים בו-זמנית או אופטימיזציה עד שהבדיקה לאחור נראית טוב — אינו ניתן להבחנה מהתאמת-יתר.
התחל בניתוח יומן העסקאות כדי לזהות מתי ומדוע המודל מפסיד כסף. אם הפסדים מתרכזים בשוקי דובים, בדוק מסנן משטר שוק. אם הפסדים מגיעים מסקטור ספציפי, בדוק הדרה שלו. אם הפסדים מתקבצים בתקופות תנודתיות נמוכה, בדוק מסנן משטר תנודתיות. כל שינוי מטפל בחולשה אחת מזוהה עם שינוי ממוקד אחד.
לאחר יישום שינוי, בדוק אותו באמצעות אותו תהליך walk-forward שהוחל על המודל המקורי. אם השינוי משפר ביצועי out-of-sample, שמור אותו. אם הוא משפר in-sample אך מרע out-of-sample, זו התאמת-עקומה ויש להשליכו.
שמור על יומן כתוב של כל שינוי שנבדק, הרציונל שלו ותוצאותיו.
קצב השיפור חשוב. סקור ואולי שנה את המודל רבעונית, לא יומית. מינימום של 20-30 עסקאות חדשות צריכות להתרחש בין שינויים כדי לספק נתוני out-of-sample משמעותיים לכל שינוי.
מעבר ממודלים פשוטים למערכות כמותיות רב-פקטוריאליות
מעבר ממודל חד-פקטוריאלי למערכת רב-פקטוריאלית עוקב אחר נתיב טבעי: לאחר אימות פקטור אחד (מומנטום, ערך או חזרה לממוצע), הוסף פקטור שני שהוא שונה כלכלית ובלתי מתואם היסטורית עם הראשון. השילוב של שני פקטורים עם מתאם נמוך מייצר תיק עם תשואות מותאמות סיכון טובות יותר מכל פקטור בנפרד כי זרמי התשואה הבלתי מתואמים שלהם מחליקים את עקומת ההון המשולבת.
ההתקדמות הסטנדרטית היא: פקטור בודד עם גודל פוזיציה שווה, לאחר מכן פקטור בודד עם גודל פוזיציה מותאם תנודתיות, לאחר מכן שילוב דו-פקטוריאלי עם גודל פוזיציה מותאם תנודתיות, ולאחר מכן רב-פקטוריאלי עם הקצאה מותנית משטר. כל שלב מוסיף שכבה אחת של מורכבות ודורש אימות עצמאי.
מודלים רב-פקטוריאליים דורשים תשומת לב זהירה למתאם בין פקטורים. הוספת פקטור ערך למודל מומנטום מספקת גיוון משמעותי כי מומנטום וערך מתואמים היסטורית באופן שלילי. הוספת וריאנט מומנטום שני מספקת גיוון מינימלי כי הפקטורים מתואמים מאוד.
נקודת הסיום של התקדמות זו — מערכת רב-פקטוריאלית, מותנית משטר, מותאמת תנודתיות — מייצגת תשתית מסחר כמותי ברמה מקצועית. רוב הסוחרים הפרטיים לעולם אינם צריכים להגיע לרמה זו. פקטור בודד מאומת עם גודל פוזיציה נכון וניהול סיכונים מציג ביצועים טובים יותר מהרוב המוחלט של גישות המסחר הדיסקרציונריות.