სტატისტიკა, რომელიცზომავს ორ ცვლადს შორის წრფივი დამოკიდებულების ხარისხს და გვიჩვენებს ამ კავშირის მიმართულებას. სტატისტიკურ კვლევებში გამოიყენება სხვადასხვა სახის კორელაციისკოეფიციენტები. პირსონის კორელაციის კოეფიციენტი ზომავ სრაოდენობრივ ცვლადებს შორის წრფივი კავშირის სიძლიერეს და ამ კავშირის მიმართულებას.
ამ კოეფიციენტის გამოსათვლელი ფორმულა მიიღო ბრიტანელმა სტატისტიკოსმა კარლ პირსონმა (1857-1936). პირსონის კორელაციის კოეფიციენტი ასოთი აღინიშნება და მოიცემა შემდეგი ფორმულით:
\[r = \frac{{\sum\limits_{i = 1}^n {({X_i} - \bar X)({Y_i} - \bar Y)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^2}{{({Y_i} - \bar Y)}^2}} } }}.\]
ჩამოვთვალოთ კორელაციის კოეფიციენტის თვისებები:
1.
2. r=1 ან r=-1 მაშინ და მხოლოდ მაშინ, როცა X და Y ცვლადებს შორის არსებობს ზუსტი ( სრული ) წრფივი კავშირი ანუ მოიძებნება ისეთი a და b მუდმივები, რომ Y=aX+b. ამ შემთხვევაში წერტილები გაბნევის დიაგრამაზე ზუსტად განლაგდება ამ წრფეზე. ამასთანავე, თუ a>0, მაშინ r=1 და თუ a<0 , მაშინ r=-1.3. რაც უფრო კონცენტრირებულია მონაცემები რაიმე წრფის მიდამოში, მით უფრო დიდია კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობა.
ტერმინებს სუსტი, საშულო, ძლიერი, სრული, იყენებენ წრფივი კავშირის ხარისხის დახასიათებლად. ითვლება, რომ
- კავშირი სუსტია თუ
- კავშირი საშუალოა თუ
- კავშირი ძლიერია თუ
- კავშირი სრულია თუ r=1 ან r=-1.
r-ის მცირე სიდიდე ყოველთვის არ ნიშნავს, რომ ცვლადებს შორის არ არის კავშირი. მაგალითად, ცვლადებს შორის შეიძლება. არ იყოს წრფივი კავშირი, მაგრამ იყოს ძლიერი არაწრფივი კავშირი.
პირსონისკოეფიციენტი არ გამოიყენება თუ ცვლადებს შორის არ არის მოსალოდნელი წრფივი კავშირი ან, როცა ცვლადები გაზომილოა სახელდების, ან რიგის სკალაზე.
***
გამოყენებული ლიტერატურა:
Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.
კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი. თბილისის უნივერსიტეტის გამომცემლობა