კერძო კორელაციის კოეფიციენტი

Partial Correlation

მარტივი რეგრესიის შემთხვევაში, ადვილად მყარდება კავშირი რეგრესიის კოეფიციენტის შეფასებასა და შერჩევითი კორელაციის კოეფიციენტს შორის. სახელდობრ:

b=rSSySSx,  r=(x-x)(y-y)(x-x)2(y-y)2,  SSr=(y-y)2n-1,  SSx=(x-x)2n-1, სადაც r შერჩევითი (შერჩევაზე დაყრდნობით გამოთვლილი) კორელაციის კოეფიციენტია, SSx და  წარმოადგენს შესაბამისად X  და Y  ცვლადების შერჩევით სტანდარტულ გადახრებს. დეტერმინაციის კოეფიციენტი ტოლია შერჩევითი კორელაციის კოეფიციენტის კვადრატისა: R2=r2. ამრიგად, მარტივი რეგრესიის შემთხვევაში, საჭირო სიდიდეები გამოითვლება  X  და Y ცვლადების დაკვირვებული მნიშვნელობებით. 

განვიხილოთ ეხლა ერთზე მეტი დამოუკიდებელი ცვლადი (სიმარტივისათვის განვიხილოთ ორი X და Y დამოუკიდებელი ცვლადი და ერთი დამოკიდებული ცვლადი Z), გვაქვს შემდეგი მონაცემები: X1,X2,...,Xn; Y1,Y2,...,Yn; Z1,Z2,...,Zn შეიძლება გამოვთვალოთ rxz,ryz,rxy კორელაციის კოეფიციენტები შემდეგი ფორმულებით: 

rxz=(x-x)(z-z)(x-x)2(z-z)2,  ryz=(y-y)(z-z)(y-y)2(z-z)2,  rxy=(x-x)(z-z)(x-x)2(y-y)2

თუმცა კორელაციური ანალიზი - ურთიერთკავშირის ანალიზი არ ამოიწურება მხოლოდ წყვილთა კორელაციების ჩამოთვლით.

მაგალითი: ვთქვათ X შრომის პროდუქტიულობაა, Y - ფირმის კომპიუტერიზაციის დონე, Z - თანამშრომლების განათლების დონე. ვთქვათ, შეგროვილი იყო სხვადასხვა ფირმის მონაცემები და დათვლილი იყო კორელაციის კოეფიციენტები:  rxy=0.5,rxz=0.6,ryz=0.8 

როგორც ვხედავთ, განათლების დონე და კომპიუტერიზაციის დონე მნიშვნელოვნად მოქმედებენ  შრომის პროდუქტიულობაზე, მაგრამ ყურადღება უნდა მივაქციოთ იმას, რომ Y და Z შორის არსებობს ძლიერი კორელაცია. ხომ არ არის გამოწვეული Y-ის გავლენა X-ზე Z-ით? საჭიროა ისეთი კოეფიციენტის შემოღება, რომელიც გაზომავს ორ ცვლადს შორის კავშირს მესამე ცვლადის გავლენის გამორიცხვით. ასეთი კოეფიციენტი არის კერძო კორელაციის კოეფიციენტი, რომელიც გამოითვლება ფორმულით: 

rxy/z=rxy-rxyryz(1-rxz2)(1-ryz2), სადაც rxy/z=0.5-0.6×0.8(1-0.62)(1-0.82)=0.04

კომპიუტერიზაციის გავლენა შრომის პროდუქტიულობაზე გამოდგა დეზინფორმაციული, მთელი ეს კავშირი გამოწვეულია განათლების დონით. რეგრესიის განტოლებას სამი ცვლადის შემთხვევაში ექნება შემდეგი სახე: Z=a+bX+cY

a, b, c - რეგრესიის კოეფიციენტებს, მონაცემთა დაყრდნობით, ეძებენ უმცირეს კვადრატთა მეთოდით.

დეტერმინაციის კოეფიციენტი გამოითვლება ფორმულით: Rzxy2=rxz2+ryz2-2rxzryzrxy1-rxy2სადაც კორელაციის კოეიციენტები  rxz,ryz,rxy გამოითვლება შემდეგი ფორმულებით:

rxz=(x-x)(z-z)(x-x)2(z-z)2,  ryz=(y-y)(z-z)(y-y)2(z-z)2,  rxy=(x-x)(y-y)(x-x)2(y-y)2

Rzxy მრავლობითი კორელაციის კოეფიციენტი გამოსახავს კავშირის ხარისხს Z ცვლადისა X და Y ცვლადებთან. აღვნიშნოთ, რომ Rzxy2rzx2  და Rzxy2rzy2, ანუ ახალი ცვლადის (ფაქტორის) დამატება ამცირებს განუსაზღვრელობას Z-ის შეფასებაში.

 

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: