גורם אינפלציה של שונות (VIF) - סקירה כללית, נוסחה, שימושים

גורם האינפלציה השונות (VIF) מודד את חומרת הרב-קולינאריות בניתוח רגרסיה ניתוח רגרסיה ניתוח רגרסיה הוא קבוצה של שיטות סטטיסטיות המשמשות לאמידת היחסים בין משתנה תלוי למשתנה עצמאי אחד או יותר. ניתן להשתמש בו כדי להעריך את חוזק הקשר בין משתנים ולמודל את הקשר העתידי ביניהם. . זהו מושג סטטיסטי המעיד על עליית השונות של מקדם רגרסיה כתוצאה מקולינריות.

גורם אינפלציה של שונות

סיכום

  • גורם אינפלציה של שונות (VIF) משמש לאיתור חומרת הרב-קולינאריות בניתוח הרגרסיה הרגילה (OLS) הרגילה.
  • רב קולינאריות מנפחת את השונות ואת שגיאת סוג II. זה הופך את המקדם של המשתנה לעקבי אך לא אמין.
  • VIF מודד את מספר השונות המנופחת הנגרמת כתוצאה מרב-קולינאריות.

גורם אינפלציה של שונות ורב-קולינאריות

בניתוח רגרסיה רגיל לפחות ריבועי (OLS), קיימת רב-קולינאריות כאשר שניים או יותר מהמשתנים הבלתי תלויים משתנה עצמאי משתנה עצמאי הוא קלט, הנחה או מניע שמשתנים במטרה להעריך את השפעתו על משתנה תלוי (התוצאה) . להדגים קשר לינארי ביניהם. לדוגמא, כדי לנתח את הקשר בין גדלי חברות והכנסות למחירי מניות במודל רגרסיה, שווי שוק והכנסות הם המשתנים הבלתי תלויים.

שווי שוק של חברה שווי שוק שווי שוק (שווי שוק) הוא שווי השוק האחרון של מניות החברה המצטיינות. שווי השוק שווה למחיר המניה הנוכחי כפול מספר המניות המצטיינות. קהילת המשקיעים משתמשת לעתים קרובות בערך שווי השוק כדי לדרג חברות וסך הכנסותיה בקורלציה גבוהה. מכיוון שחברה מרוויחה הכנסות גדלות, היא גם גדלה בגודלה. זה מוביל לבעיה רב-קולינארית בניתוח הרגרסיה של OLS. אם המשתנים הבלתי תלויים במודל רגרסיה מראים קשר ליניארי צפוי לחלוטין, זה ידוע כרב-קולינאריות מושלמת.

עם מולטי קולינאריות, מקדמי הרגרסיה עדיין עקביים אך אינם אמינים עוד מכיוון שהשגיאות הסטנדרטיות מנופחות. פירוש הדבר שכוח הניבוי של המודל אינו מופחת, אך ייתכן שהמקדמים אינם מובהקים סטטיסטית עם שגיאת סוג II שגיאה מסוג II בבדיקת השערה סטטיסטית, שגיאה מסוג II היא מצב בו מבחן השערה אינו מצליח לדחות את השערת האפס לפיה הוא שקר. באחר .

לכן, אם מקדמי המשתנים אינם משמעותיים באופן אינדיבידואלי - לא ניתן לדחותם במבחן t, בהתאמה - אך יכולים להסביר במשותף את השונות של המשתנה התלוי עם דחייה במבחן ה- F ומקדם קביעה גבוה (R2), רב-קולינאריות עשויה להתקיים. זו אחת השיטות לאיתור רב-קולינאריות.

VIF הוא כלי נפוץ נוסף כדי לזהות אם מולטי-קולינאריות קיימת במודל רגרסיה. הוא מודד עד כמה מנופח השונות (או השגיאה הסטנדרטית) של מקדם הרגרסיה המשוער בגלל קולינריות.

שימוש בפקטור אינפלציה שונות

ניתן לחשב את VIF לפי הנוסחה הבאה:

גורם אינפלציה לשונות - פורמולה

כאשר R i 2 מייצג את מקדם הקביעה הבלתי מותאם לנסיגה של המשתנה העצמאי ith על הנותרים. ההדדיות של VIF מכונה סובלנות . ניתן להשתמש ב- VIF או בסובלנות לזיהוי רב-קולינרי, בהתאם להעדפה האישית.

אם R i 2 שווה ל- 0, לא ניתן לחזות את המשתנה של המשתנים הבלתי תלויים הנותרים מהמשתנה הבלתי תלוי. לכן, כאשר VIF או סובלנות שווה ל- 1, המשתנה הבלתי תלוי אינו מתואם לשאר הנותרים, מה שאומר שרב-קולינאריות אינה קיימת במודל רגרסיה זה. במקרה זה השונות של מקדם הרגרסיה ה- I אינה מנופחת.

באופן כללי, VIF מעל 4 או סובלנות מתחת ל- 0.25 מצביעים על כך שקיימת מולטי-קולינריות, ונדרשת חקירה נוספת. כאשר ה- VIF גבוה מ -10 או הסובלנות נמוכה מ- 0.1, יש לתקן רב-קולינאריות משמעותית.

עם זאת, ישנם גם מצבים בהם ניתן להתעלם מבטחי VFI גבוהים מבלי לסבול מרב-קולינאריות. להלן שלושה מצבים כאלה:

1. VIF גבוהים קיימים רק במשתני בקרה, אך לא במשתנים מעניינים. במקרה זה, המשתנים המעניינים אינם קולינריים זה לזה או למשתני הבקרה. מקדמי הרגרסיה אינם מושפעים.

2. כאשר נגרמים VIF גבוהים כתוצאה מהכללת המוצרים או הכוחות של משתנים אחרים, רב-קולינאריות אינה גורמת להשפעות שליליות. לדוגמא, מודל רגרסיה כולל את x ו- x2 כמשתנים הבלתי תלויים שלו.

3. כאשר למשתנה דמה המייצג יותר משתי קטגוריות יש VIF גבוה, מולטי-קולינריות אינה קיימת בהכרח. המשתנים תמיד יהיו בעלי VIF גבוה אם יש חלק קטן מהמקרים בקטגוריה, ללא קשר אם המשתנים הקטגוריים קשורים למשתנים אחרים.

תיקון ריבוי קולינאריות

מאחר שרב-קולינאריות מנפחת את שונות המקדמים וגורמת לשגיאות סוג II, חיוני לאתר ולתקן. ישנן שתי דרכים פשוטות ונפוצות לשימוש לתיקון מולטי קולינרי, כמפורט להלן:

1. הראשון הוא להסיר אחד (או יותר) מהמשתנים המתואמים מאוד. מכיוון שהמידע שמספק המשתנים מיותר, מקדם הקביעה לא ייפגע מאוד מההסרה.

2. השיטה השנייה היא להשתמש בניתוח רכיבים עיקריים (PCA) או רגרסיה חלקית לפחות מרובעת (PLS) במקום רגרסיה של OLS. רגרסיה של PLS יכולה להפחית את המשתנים לסט קטן יותר ללא מתאם ביניהם. ב- PCA נוצרים משתנים חדשים שלא מתואמים. זה ממזער את אובדן המידע ומשפר את החיזוי של מודל.

משאבים נוספים

מימון הוא הספק הרשמי של הסמכת בנקאות ואשראי בנקאית מוסמכת (CBCA) ™ CBCA ™ העולמית. הסמכת הסמכת בנקאות ואשראי מוסמכת (CBCA) ™ הינה תקן עולמי לאנליסטים אשר מכסה פיננסים, חשבונאות, ניתוח אשראי, ניתוח תזרים מזומנים. , דוגמנות ברית, החזר הלוואות ועוד. תוכנית הסמכה, שנועדה לעזור לכל אחד להיות אנליסט פיננסי ברמה עולמית. כדי להמשיך ולקדם את הקריירה שלך, המשאבים הנוספים להלן יהיו שימושיים:

  • מושגים סטטיסטיים בסיסיים במימון מושגים סטטיסטיים בסיסיים למימון הבנה מוצקה של סטטיסטיקה חשובה ביותר לסייע לנו להבין טוב יותר את המימון. יתר על כן, מושגים סטטיסטיים יכולים לעזור למשקיעים לפקח
  • שיטות חיזוי שיטות חיזוי שיטות חיזוי מובילות. במאמר זה נסביר על ארבעה סוגים של שיטות חיזוי הכנסות בהן אנליסטים פיננסיים משתמשים כדי לחזות הכנסות עתידיות.
  • רגרסיה לינארית מרובה רגרסיה לינארית מרובה רגרסיה לינארית מרובה מתייחסת לטכניקה סטטיסטית המשמשת לחיזוי התוצאה של משתנה תלוי בהתבסס על ערך המשתנים הבלתי תלויים
  • משתנה אקראי משתנה אקראי משתנה אקראי (משתנה סטוכסטי) הוא סוג של משתנה בסטטיסטיקה שערכיו האפשריים תלויים בתוצאות של תופעה אקראית מסוימת