კოლმოგოროვის თანხმობის კრიტერიუმი

Kolmogorov’s Test Goodness of Fit

შერჩევის დროს X2- კრიტერიუმის გამოყენებისას ხდება მონაცემების დაჯგუფება დონების მიხედვით. ამის გამო, იკარგება შერჩევიდან მისაღები ინფორმაციის დიდი ნაწილი. ასეთ დროს მიზანშეწონილია ისეთი კრიტერიუმების გამოყენება, რომლებიც დაეყრდნობა ინდივიდუალურ და არა დაჯგუფებულ მონაცემებს. ერთ-ერთ უმნიშვნელოვანეს ასეთ კრიტერიუმს წარმოადგენს კოლმოგოროვის კრიტერიუმი, რომელიც ეფუძნება ემპირეულ და თეორიულ განაწილების ფუნქციებს შორის მაქსიმალურ Dn გადახრას (იხ. ემპირეული  განაწილების ფუნქცია და თეორიული განაწილების ფუნქცია), n- შერჩევის მოცულობაა. Dn სტატისტიკას აქვს შემდეგი შესანიშნავი თვისება: არც Dn სტატისტიკის განაწილების ფუნქცია და არც  nDn  ნორმირებული სტატისტიკის ზღვრული განაწილება არ არის დამოკიდებული თეორიული განაწილების ფუნქციაზე (ცხადია, იმ პირობით, რომ შერჩევის მონაცემები განაწილებულები არიან ამ დასახელებული კანონით). ასეთ სტატისტიკებს განაწილებისგან თავისუფალ სტატისტიკებს უწოდებენ. მათ დიდი მნიშვნელობა ენიჭება ჰიპოთეზების შემოწმების დროს, რადგან ასეთი სტატისტიკების განაწილების გამოთვლა და შესაბამისი ცხრილების შედგენა (კრიტიკული წერტილების მოსაპოვებლად) საკმარისია რომელიმე ერთი (მაგალითად თანაბარი) ჰიპოთეტური  განაწილებისათვის, რის შემდეგაც ამ ცხრილების გამოყენება შეიძლება ნებისმიერი ჰიპოთეტური განაწილების შემთხვევაში.   

მაგალითი: ავიაკომპანიას თვითმფრინავების ფრენის განრიგის შედგენამდე სურს განსაზღვროს, არის თუ არა ნორმალურად განაწილებული თვითმფრინავთა გაფრენის დაგვიანების დრო. 10 წლის განმავლობაში მხოლოდ 11 გაუთვალისწინებულ დაგვიანება იყო და ამ დაგვიანებათა ხანგრძლივობა დალაგებული ზრდის მიხედვით, მოყვანილია ცხრილის პირველ სვეტში.

დაგვიანება

საათებში x

ემპ.განაწ.

ფუნქცია Fn(x)

ნორმირ.

სიდიდეები

Z=(x-µ)/σ

ჰიპოთეტური განაწ.ფუნქცია

F(x)

გადახრები

Fn(x)-F(x)

0.9

1.0

1.9

2.1

2.7

2.8

3.2

3.6

3.9

4.2

5.1

0.0909

0.1818

0.2727

0.3636

0.4545

0.5454

0.6363

0.7272

0.8181

0.9090

0.9999

-2.1

-2.0

-1.1

-0.9

-0.3

-0.2

0.2

0.6

09

1.2

2.1

0.0179

0.0228

0.1357

0.1841

0.3821

0.4207

0.5793

0.7257

0.8159

0.8849

0.9841

0.0730

0.1590

0.1370

0.1795

0.0724

0.1247

0.0570

0.0015

0.0022

0.0241

0.0178

სხვა შემთხვევების შესწავლის საფუძველზე, კომპანიას გაუჩნდა ჰიპოთეზა, რომ ამ დაგვიანებებს უნდა ჰქონდეს 3 საათის ტოლი საშუალო და 1 საათის ტოლი სტანდარტული გადახრა. ანუ ნულოვანი ჰიპოთეზა ნიშნავს, რომ დაგვიანებები განაწილებულია ნორმალურად პარამეტრებით 3 და 1. ცხრილის მეორე სვეტში მოცემულია ემპირიული განაწილების ფუნქციის მნიშვნელობები (მაგალითად 0.2727 არის დაგვიანებათა რაოდენობა, რომელიც არ აღემატება 1.9 საათს გაყოფილი 11-ზე, 3/11 0.2727). ცხრილის მეოთხე სვეტში მოცემულია  ჰიპოთეტური განაწილების ფუნქციის მნიშვნელობები, გამოთვლილი სტანდარტული ნორმალური განაწილების ცხრილის მიხედვით მესამე სვეტში მოყვანილი ნორმირებული სიდიდეების შესაბამისად. ბოლო სვეტში მოცემულია ემპირეულ და ჰიპოთეტურ განაწილების ფუნქციებს შორის გადახრები. ცხრილის მიხედვით მაქსიმალური გადახრა უდრის 0.1795.  Dn სტატისტიკის კრიტიკული მნიშვნელობების ცხრილის მიხედვით, როცა α=0.05 და n=11  კრიტიკული მნიშვნელობა უდრის 0.35242-ს და ის აღემატება 0.1795. ამიტომ, შერჩევის მონაცემებზე დაყრდნობით  არ არის ჰიპოთეზის უარყოფის საფუძველი.    

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: