מדוע ערך R-Squared לא מעיד על סיבתיות?

מדוע ערך R-Squared לא מעיד על סיבתיות?
Anonim

תשובה:

R-squared מציין עד כמה הנתונים הנצפים מתאימים לנתונים הצפויים, אבל זה רק נותן לך מידע על קורלציה.

הסבר:

ערך R-squared מציין עד כמה הנתונים הנצפים שלך, או הנתונים שאספת, מתאימים למגמה הצפויה. ערך זה אומר לך את עוצמת הקשר, אבל, כמו כל המבחנים הסטטיסטיים, אין דבר נתון זה אומר לך את הסיבה מאחורי הקשר או כוחו.

בדוגמה הבאה, אנו יכולים לראות את התרשים בצד שמאל אין מערכת יחסים, כפי שצוין על ידי ערך נמוך R- ריבוע. לתרשים מימין יש קשר חזק מאוד, כפי שמציין הערך R-squared של 1. אף אחד מהגרפים הללו לא ניתן לדעת מה גורם בסופו של דבר למערכת יחסים זו.

המתאם אינו אומר סיבתיות. ערכי X שלך עשוי להשפיע מאוד על ערכי Y שלך, אבל גורמים אחרים עשויים להיות במשחק או את הקשר יכול להיות בגלל סיכוי. אתה יכול הסקר סיבתיות, אבל זה הפרשנות שלך וזה לא יכול להיות מוכח על ידי בדיקה סטטיסטית. לאחר ערך גבוה R- ריבוע עדיין רק אומר לך את הכוח של מערכת היחסים, אבל לא הסיבה שלה.

להוכיח סיבתיות היא משימה גדולה מאוד. אם אתה רוצה להבין סיבתיות, ההימור הטוב ביותר שלך הוא באמצעות ניסויים.