ნდობის ინტერვალი

Confidence Interval

პოპულაციის უცნობი პარამეტრის ინტერვალური შეფასება, პოპულაციის θ პარამეტრისათვის X=(X1,X2,....Xn) შერჩევაზე დაყრდნობით გამოთვლილი ისეთი ინტერვალი T1(X);T2(X), რომლისთვისაც მოცემული γ(0,1) ნდობის ალბათობისათვის შესრულებულია პირობა PT1(X)<θ<T2(X)γ.T1(X)  და T2(X) სიდიდეებს ნდობის ინტერვალის საზღვრები ეწოდება.

რას ნიშნავს პრაქტიკული თვალსაზრისით ეს პირობა? წარმოვიდგინოთ, რომ ჩატარებულია ცდათა დიდი რაოდენობა და მიღებულია ერთი და იმავე n მოცულობის N რაოდენობის შერჩევა. ვთქვათ, ყოველი შერჩევისათვის აგებულია ნდობის ინტერვალები (N რაოდენობის ნდობის ინტერვალი). მაშინ, იმ შემთხვევათა რაოდენობა, როცა პარამეტრის ჭეშმარიტი მნიშვნელობა არ იქნება დაფარული აგებული ინტერვალით საშუალოდ (1-γ)N -ის ტოლი იქნება. თუ მაგალითად N=100, γ=0.9, მაშინ (1-γ)100=10 და მოსალოდნელია, რომ ამ 100 აგებული ინტერვალიდან საშუალოდ 90=100-10 დაფარავს პოპულაციის საშუალოს. 

ნდობის ინტერვალის საზღვრები შერჩევაზე დაყრდნობით გამოთვლილი სტატისტიკებია T1(X); T2(X) და არ არიან დამოკიდებული θ -ზე. როცა ცდა მეორდება მიღებულ მონაცემებზე დაყრდნობით აგებული ნდობის ინტერვალების საზღვრები ღებულობენ სხვადასხვა რიცხვით მნიშვნელობას, მაგრამ საშუალოდ, მათი 100γ% მოიცავს პარამეტრის ჭეშმარიტ მნიშვნელობას.

მაგალითი 1: ვთქვათ, μ პოპულაციის უცნობი საშუალოა. თუ შერჩევის მოცულობა დიდია ანუ n>30, ძალაშია ცენტრალური ზღვარითი თეორემა. ეს ნიშნავს რომ სტანდარტიზებულ შერჩევის საშუალოს აქვს სტანდარტული ნორმალური განაწილება

Z=X¯-μσ/nN(0;1)

ხშირ შემთხვევაში σ არაა ცნობილი, მაგრამ როცა n დიდია მას ვანაცვლებთ შერჩევის შესწორებული სტანდარტული გადახრით (s)

Z=X¯-μs/nN(0;1)

სტანდარტული ნორმალური განაწილების თვისებებიდან ვიცით, რომ Z-ის მნიშვნელობების 95% კონცენტრირებულია ინტერვალში (-1.96; + 1.96), და შესაბამისად გვექნება:

0.95=P(-1.96<Z<1.96)=P(-1.96<X¯-μs/n=P(X¯-1.96σn<μ<X¯+1.96σn).

ეს კი ნიშნავს, რომ μ უცნობი პარამეტრის მნიშვნელობა იქნება ინტერვალში (X¯-1.96σn; X¯+1.96σn) ალბათობით 0.95. ამავე დროს, არსებობს რისკის ალბათობა 0.05, რომ ეს ინტერვალი არ მოიცავს μ-ს.

როგორც ვხედავთ ნდობის ინტერვალის სიგრძე დამოკიდებულია ნდობის დონეზე, პოპულაციის ქულების ცვალებადობასა და შერჩევის მოცულობაზე. სიგრძის შესამცირებლად, ანუ რაც იმავეს გულისხმობს, რომ შეფასების სიზუსტის გაზრდისათვის საჭიროა შერჩევის მოცულობის გაზრდა.

სიდიდეს l=σnZ შეფასების სიზუსტე ეწოდება, სადაც Z სტანდარტული ნორმალური განაწილების ზედა α/2 კრიტიკული წერტილია და α=1-γ ზემოთ განხილულ შემთხვევაში Z=1.96 ცხადია, რაც ნაკლებია l მით უკეთესია ნდობის ინტერვალი. ბუნებრივია, რომ ნდობის ფიქსირებული γ დონისათვის შერჩევის ის მინიმალური მოცულობა n*, რომელიც უზრუნველყოფს შეფასების წინასწარ ფიქსირებულ l სიზუსტეს, გამოითვლება ტოლობიდან l=σnZ , საიდანაც n*=σ2l2z2+1 აქ კვადრატული ფრჩხილები ნიშნავს რიცხვის მთელ ნაწილს.

ცხადია, რომ პოპულაციის სხვა პარამეტრებისათვის, როგორებიცაა, მაგალითად პოპულაციის დისპერსია, წარმატების უცნობი ალბათობა, ნდობის ინტერვალს განსხვავებული ფორმა ექნება, ვიდრე ზემოთ აგებულს. თუმცა შინაარსი და ინტერპრეტაცია ყველა ნდობის ინტერვალისათვის ერთნაირია.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: