שיטות אנסמבל - סקירה כללית, קטגוריות, סוגים עיקריים

שיטות אנסמבל הן טכניקות שמטרתן לשפר את דיוק התוצאות במודלים על ידי שילוב של מספר דגמים במקום שימוש במודל יחיד. המודלים המשולבים מעלים את דיוק התוצאות באופן משמעותי. זה הגביר את הפופולריות של שיטות אנסמבל בלימוד מכונה.

שיטות אנסמבל

סיכום קצר

  • שיטות אנסמבל מכוונות לשיפור החיזוי במודלים על ידי שילוב של מספר דגמים ליצירת מודל אחד מאוד אמין.
  • שיטות ההרכב הפופולריות ביותר הן הגברה, שקיות והערמה.
  • שיטות אנסמבל אידיאליות לנסיגה וסיווג, כאשר הן מפחיתות את ההטיה והשונות כדי להגביר את הדיוק של המודלים.

קטגוריות של שיטות אנסמבל

שיטות אנסמבל מתחלקות לשתי קטגוריות רחבות, כלומר טכניקות אנסמבל רציפות וטכניקות אנסמבל מקבילות. טכניקות אנסמבל רצף מייצרות לומדי בסיס ברצף, למשל, Boosting Adapting (AdaBoost). הדור הרציף של לומדי בסיס מקדם את התלות בין לומדי הבסיס. ביצועי המודל משופרים לאחר מכן על ידי הקצאת משקולות גבוהות יותר ללומדים שהוצגו בעבר כלא נכון.

בשנת טכניקות אנסמבל במקביל , לומד בסיס נוצרים בפורמט מקביל, למשל, יער אקראי יער אקראי יער האקראי היא טכניקה המשמשת במידול תחזיות וניתוח התנהגות והוא בנוי על עצי החלטה. יער אקראי מכיל עצי החלטה רבים. שיטות מקבילות משתמשות בדור המקביל של לומדי בסיס כדי לעודד עצמאות בין לומדי הבסיס. העצמאות של לומדי הבסיס מפחיתה משמעותית את הטעות עקב יישום הממוצעים.

רוב טכניקות ההרכב מיישמות אלגוריתם יחיד בלמידת בסיס, מה שמביא להומוגניות אצל כל לומדי הבסיס. לומדי בסיס הומוגניים מתייחסים לומדי בסיס מאותו סוג, בעלי תכונות דומות. שיטות אחרות מיישמות לומדי בסיס הטרוגניים, מה שמוליד הרכבים הטרוגניים. לומדי בסיס הטרוגניים הם לומדים מסוגים שונים.

הסוגים העיקריים של שיטות אנסמבל

1. שקיות

Bagging, הצורה הקצרה לצבירת bootstrap, מיושם בעיקר בסיווג ונסיגה ניתוח רגרסיה ניתוח רגרסיה הוא מערכת של שיטות סטטיסטיות המשמשות להערכת קשרים בין משתנה תלוי למשתנה עצמאי אחד או יותר. ניתן להשתמש בו כדי להעריך את חוזק הקשר בין משתנים ולמודל את הקשר העתידי ביניהם. . זה מגביר את הדיוק של המודלים באמצעות עצי החלטה, מה שמפחית במידה רבה את השונות. הפחתת השונות מגדילה את הדיוק, ומכאן ביטול התאמת יתר, המהווה אתגר למודלים חזויים רבים.

Bagging מסווג לשני סוגים, כלומר, bootstrapping וצבירה. Bootstrapping היא טכניקת דגימה שבה דגימות נגזרות מכלל האוכלוסייה (set) תוך שימוש בהליך ההחלפה. הדגימה בשיטת החלפה עוזרת להפוך את הליך הבחירה לאקראי. אלגוריתם הלמידה הבסיסי מופעל על הדגימות כדי להשלים את ההליך.

הצטברות בשקיות נעשית על מנת לשלב את כל התוצאות האפשריות של התחזית ולאקראי את התוצאה. ללא צבירה, התחזיות לא יהיו מדויקות מכיוון שלא לוקחים בחשבון את כל התוצאות. הצבירה מבוססת, אם כן, על נהלי ההסתברות לאתחול או על בסיס כל התוצאות של המודלים המנבאים.

שקית היא יתרון מאחר שלומדים בסיסים חלשים משולבים ליצירת לומד חזק אחד ויציב יותר מלומדים יחידים. זה גם מבטל כל שונות, ובכך מפחית את התאמת היתר של המודלים. מגבלה אחת של שקיות היא שהיא יקרה מבחינה חישובית. לפיכך, זה יכול להוביל להטיות נוספות במודלים כאשר מתעלמים מההליך הנכון של שקיות.

2. התגברות

Boosting היא טכניקת אנסמבל שלומדת מטעויות ניבוי קודמות לחזות טובות יותר בעתיד. הטכניקה משלבת מספר לומדי בסיס חלשים כדי ליצור לומד חזק אחד, ובכך משפרת משמעותית את החיזוי של המודלים. הגברה פועלת על ידי סידור לומדים חלשים ברצף, כך שלומדים חלשים לומדים מהלומד הבא ברצף כדי ליצור מודלים חזויים טובים יותר.

Boosting לובש צורות רבות, הכוללות הגברת שיפוע, Boosting Adaptive (AdaBoost) ו- XGBoost (Extreme Gradient Boosting). AdaBoost עושה שימוש בלומדים חלשים שהם בצורת עצי החלטה, הכוללים בעיקר פיצול אחד המכונה בפי העם גדמי החלטות. גדם ההחלטה העיקרי של AdaBoost כולל תצפיות הנושאות משקל דומה.

הגדלת שיפוע שיפוע שיפוע שיפוע שיפוע היא טכניקה המשמשת ליצירת מודלים לחיזוי. הטכניקה משמשת בעיקר בהליכי רגרסיה וסיווג. מוסיף מנבא ברצף לאנסמבל, שם מנבאים קודמים מתקנים את יורשיהם, ובכך מגדילים את דיוק המודל. מנבאים חדשים מתאימים להתמודד עם השפעות השגיאות במנבאים הקודמים. שיפוע הירידה מסייע למגבר השיפוע בזיהוי בעיות בתחזיות הלומדים ומתמודד איתם בהתאם.

XGBoost עושה שימוש בעצי החלטה בשיפוע מוגבר, המספק מהירות וביצועים משופרים. זה מסתמך במידה רבה על מהירות החישוב ועל הביצועים של מודל היעד. אימון המודל צריך לעקוב אחר רצף, ובכך להפוך את היישום של מכונות המועצמות בשיפוע לאיטי.

3. ערימה

ערימה, שיטת אנסמבל אחרת, מכונה לעתים קרובות הכללה מוערמת. טכניקה זו עובדת בכך שהיא מאפשרת לאלגוריתם אימונים להרכיב מספר תחזיות אחרות של אלגוריתם למידה. הערימה יושמה בהצלחה ברגרסיה, אומדני צפיפות, למידה מרחוק וסיווגים. ניתן להשתמש בו גם למדידת קצב השגיאה הכרוך במהלך האחסון.

הפחתת שונות

שיטות אנסמבל אידיאליות להפחתת השונות במודלים, ובכך להגדיל את דיוק התחזיות. השונות מתבטלת כאשר משולבים מספר דגמים ליצירת חיזוי יחיד שנבחר מכל שאר התחזיות מהמודלים המשולבים. אנסמבל של מודלים הוא פעולה של שילוב של מודלים שונים כדי להבטיח שהחיזוי המתקבל הוא הטוב ביותר האפשרי, בהתבסס על התחשבות בכל התחזיות.

משאבים נוספים

מימון הוא הספק הרשמי של הסמכת בנקאות ואשראי בנקאית מוסמכת (CBCA) ™ CBCA ™ העולמית. הסמכת הסמכת בנקאות ואשראי מוסמכת (CBCA) ™ הינה תקן עולמי לאנליסטים אשר מכסה פיננסים, חשבונאות, ניתוח אשראי, ניתוח תזרים מזומנים. , דוגמנות ברית, החזר הלוואות ועוד. תוכנית הסמכה, שנועדה לעזור לכל אחד להיות אנליסט פיננסי ברמה עולמית. כדי להמשיך ולקדם את הקריירה שלך, משאבי האוצר הנוספים להלן יהיו שימושיים:

  • רשת אלסטית נטו אלסטי נטו אלסטי משתמש באופן לינארי בקנסות מהטכניקות של לאסו ורכס כדי להסדיר מודלים של רגרסיה. הטכניקה משלבת גם את הלאסו וגם
  • התאמת יתר Overfitting Overfitting הוא מונח המשמש בסטטיסטיקה המתייחס לשגיאת דוגמנות המתרחשת כאשר פונקציה תואמת יותר מדי למערכת נתונים מסוימת.
  • מדרגיות מדרגיות מדרגיות יכולה ליפול הן בהקשרים אסטרטגיים פיננסיים והן בהקשרים אסטרטגיים. בשני המקרים, זה מייצג את היכולת של הישות לעמוד בלחץ של
  • Spoofing Spoofing Spoofing הוא שיטת מסחר אלגוריתמית משבשת הכוללת הצבת קנייה או הצעה למכירת חוזים עתידיים וביטול ההצעות או ההצעות לפני ביצוע העסקה. התרגול מתכוון ליצור תמונה כוזבת של ביקוש או פסימיות שקרית בשוק.