מקדם המתאם של פירסון

מקדם המתאם של פירסון או מדד פירסון הוא מדד לקשר לינארי בין שני משתנים.

מדד זה יגיד לנו על כמה הקשר בין שני משתנים הוא קשר לינארי חזק או חלש.

תכונות מדד פירסון

1.טווח הערכים

מקדם המתאים של פירסון מסומן ב r וטווח ערכי המדד הוא בין 1- ל 1.

2.משמעות הערכים

כאשר ערך של מדד פירסון מקבל ערך הקרוב ל 1 : המשמעות היא שיש קשר לינארי חיובי חזק בין x ל y.

כאשר ערך של מדד פירסון מקבל ערך הקרוב ל 1- : המשמעות היא שיש קשר לינארי שלילי חזק בין x ל y.

כאשר ערך של מדד פירסון מקבל ערך הקרוב ל 0 : המשמעות היא שאין קשר לינארי (או שיש קשר חלש) בין x ל y.

נהוג לסווג את עוצמת הקשר על פי התחומים הבאים:

0.7 ≤ r ≤ 1
קשר לינארי חיובי חזק בין המשתנים

0.4 ≤ r < 0.7
קשר לינארי חיובי בינוני בין המשתנים

0 ≤ r < 0.4
קשר לינארי חיובי חלש בין המשתנים

ובאופן דומה ניתן לרשום את הקשרים השליליים.

ובגרף זה נראה כך:

3.הוספת ערכים 

כאשר מוספים או מחסירים ערך קבוע מקדם המתאם אינו משתנה.

4.סימטריות ביחס למשתנים

מקדם המתאם סימטרי ביחס לשני המשתנים.

5.כאשר מכפילים את ערכי המדגם

אם נגדיל את כל ערכי המדגם פי ערך קבוע.

או פי אחוז קבוע.

מקדם המתאם לא ישתנה.

נוסחת מקדם המתאם של פירסון

נתונות הנקודות:

x y
1 2
2 3
3 5
4 6
5 9

אם נרצה לדעת האם יש קשר לינארי בין ערכי הנקודות הללו עלינו לחשב את מקדם המתאם של פירסון.

כיצד נעשה זאת?

למקדם המתאם יש מספר נוסחאות:

הנוסחה המופיעה בדף הנוסחאות של הבגרות:

ואת הנוסחה הזו ניתן לרשום גם כך:

כאשר Sx , Sנתונים לנו כדאי להשתמש בנוסחה הראשונה.

כאשר נתונות הנקודות הגולמיות – הנוסחה השנייה קלה יותר.

כמו כן בנוסחה:

N הוא מספר הנקודות.

Sx , Sy אלו הם השוניות של ערכי x והשונות של ערכי y.

חישוב מקדם המתאם של פירסון

נתונות הנקודות:

x y
1 2
2 3
3 5
4 6
5 9

על מנת לחשב את מקדם המתאם על פי הנוסחה עלינו:

למצוא את הממוצע של ערכי x והממוצע של ערכי y.

x‾ = 3

y‾ = 5

כמו כן בנוסחה:

N הוא מספר הנקודות (במקרה זה N = 5).

Sx , Sy אלו הם השוניות של ערכי x והשונות של ערכי y.

ולאחר מיכן עלינו למלא את הטבלה עם העמודות הבאות:

x y x – x‾ y – y‾ (x – x‾) (y – y‾) (x – x‾)2 (y – y‾)2
1 2 2- 3- 6 4 9
2 3 1- 2- 2- 1 4
3 5 0 0 0 0 0
4 6 1 1 1 1 1
5 9 2 4 8 4 16

הסבר לעמודות:

x – x‾

זה חיסור ערך ה x של הנקודה מהממוצע של x.

בשורה הראשונה זה:

1 – 3 = -2

y – y‾

זה חיסור ערך ה y של הנקודה מהממוצע של y.

בשורה הראשונה זה:

2 – 5 = -3

(x – x‾) (y – y‾)

זו מכפלה של שתי הטורים הקודמים.

בשורה הראשונה זה:

-2 *  -3 = 6

(x – x‾)2

זו העלאה בריבוע של הטור הראשון שיצרנו.

בשורה הראשונה זה:

(-2)2  = 4

 Sנמצא בנוסחה וטור זה יעזור לנו לחשב אותו משום ש:

(y – y‾)2

זו העלאה בריבוע של הטור השני שיצרנו.

בשורה הראשונה זה:

(-3)2  = 9

 Sy נמצא בנוסחה וטור זה יעזור לנו לחשב אותו משום ש:

נחזור לחישוב

זו הנוסחה:

החלק של:

(x1 – x‾) (y1 – y‾) + ….. + (xn – x‾) (yn – y‾)

הוא בעצם הסכום של הטור השלישי:

6 – 2 + 0 + 1 + 8 = 13

נחשב:

נציב את הנתונים הללו בנוסחה:

r = 0.75
ותוצאה זו מלמדת על קשר לינארי חיובי גבוה לנקודות שבטבלה.

עוד באתר:

 

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *