რანგობრივი კორელაციის კენდალის T-კოეფიციენტი

Kendall’s T

ამოწმებს ორი ნიშნის დამოუკიდებლობას და წარმოადგენს დამოკიდებულების სიძლიერის  საზომს. ვთქვათ, ობიექტები ხასიათდებიან ორი Xდა Y ნიშნით და (xi,yi) არის ამ ორი ნიშნის მნიშვნელობები i-ური ობიექტისათვის, i=1,2,...,n. X ნიშნის მნიშვნელობებს მივანიჭოთ რანგები და დავალაგოთ ისინი ზრდის მიხედვით 1,2,...,n, შესაბამისი რანგები Y ნიშნით იყოს r1,r2,...rn. ამგვარად, ri არის რანგი მეორე ნიშნით იმ ობიექტისა, რომელსაც პირველი ნიშნით აქვს რანგი i.

τ-კოეფიციენტი გამოითვლება ფორმულით τ=4Nn(n-1)-1

სადაც N იმ წყვილების რაოდენობაა, რომელთათვისაც j>i და ამავდროულად rj> ri. ამ კოეფიციენტის მნიშვნელობათა სიმრავლეა [-1,1].

პრაქტიკულად N ასე გამოითვლება. განვიხილოთ რანგების ცხრილი (1, 2,..., nri, r2,..., rn)

დავთვალოთ იმ ri-ების რიცხვი, რომლებიც განლაგებულია r1-ის მარჯვნივ და მეტია r1-ზე, შემდეგ იმ ri-ების რიცხვი, რომლებიც მდებარეობენ r2-ის მარჯვნივ და მეტია r2-ზე და ა.შ. N იქნება ყველა ამ რიცხვების ჯამი.

მაგალითი: დღის და საღამოს განყოფილებების სტუდენტები  გამოკითხეს, თუ როგორ აფასებენ ისინი სხვადასხვა პროფესიის პრესტიჟულობას. ყველაზე პრესტიჟულ სპეციალობას მათ უნდა მიუწერონ რანგი 1, შემდეგ 2 და ა.შ. მიიღეს შედეგების ცხრილი

პროფესია/ დღის საღამოს

ბუღალტერი                            6                                     3

პროგრამისტი                          7                                     2

ბანკის მენეჯერი                      2                                     6

ადმინისტრატორი                    5                                     4 

სტატისტიკოსი                        1                                     7

მარკეტის მენეჯერი                  4                                     8

ფინანსისტ-ანალიტიკოსი          3                                     5

წარმოების მენეჯერი                8                                     1

პირველი ნიშნის (დღის)რანგები    1   2   3   4   5   6   7   8

მეორე ნიშნის (საღამოს) რანგები    7   6   5   8   4   3   2  1

აქედან მივიღებთ, რომ N = 3 და

τ=4Nn(n-1)-1=4·38·7-1=-0.785

τ - კოეფიციენტისათვის შესაძლებელია ჰიპოთეზების შემოწმებაც.

H0: ცვლადები დამოუკიდებელია, ე.ი. τ=0

H1:τ<0.

H0 ჰიპოთეზას უარვყოფთ α

მნიშვნელოვნობის დონით ყველა ისეთი შერჩევითი მნიშვნელობებისათვის, რომლებისთვისაც N<N(a, n). აქ N(a, n) არის ის რიცხვითი მნიშვნელობა, რომლისათვისაც P{N<N(a, n)}a ხოლო P{N<N(a, n)+1}>a. N(a, n)-ის რიცხვითი მნიშვნელობაგან ისაზღვრება ცხრილიდან (კენდალის სტატისტიკის ზედა α კრიტიკული მნიშვნელობები).

თუ H0:τ=0 ჰიპოთეზის ალტერნატივაა H0:τ>0,მაშინ H0 ჰიპოთეზას უარვყოფთ H1-ის სასარგებლოდ α მნიშვნელოვნობის დონით, თუ N>N(1-a, n),წინააღმდეგ შემთხვევაში H0-ის უარყოფის საფუძველი არა გვაქვს. აქ N(1-a, n)=2E(N)-N(a, n) (იხილეთ კენდალის სტატისტიკის ცხრილი).

ზემოთ განხილული მაგალითისათვის ბუნებრივია განვიხილოთ ჰიპოთეზები: 

H0:τ=0,H1:τ<0.

a=0.05-ის შემთხვევაში ცხრილიდან N(0.05, 8)=6 კრიტიკული არეა N<N(a, n). რადგანაც N = 3 < 6 ამიტომ ნულოვან ჰიპოთეზას უარვყოფთ ალტერნატივის სასარგებლოდ. ნიშნებს შორის აღინიშნება უარყოფითი კავშირი.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი. თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: