შერჩევის მოცულობა

Sample Size

შერჩევაში შემავალი მონაცემების რაოდენობა.

ექსპერიმენტის დაგეგმვისას ყოველთვის დგება მომენტი, როცა უნდა განსაზღვროთ რისი ტოლი უნდა იყოს შერჩევის მოცულობა. დიდი მოცულობა ხშირად დიდ ხარჯებთან და დიდ დროსთანაა დაკავშირებული, ძალიან პატარა მოცულობა ამცირებს რეზულტატების სარგებლიანობას.

მოვიყვანოთ მაგალითი: ანტროპოლოგი კუნძულის მოსახლეობის შესწავლას აპირებს.

ვთქვათ,  ბევრ ნიშანთან ერთად მას აინტერესებს, მოსახლეობის რამდენ პროცენტს აქვს პირველი ჯგუფის სისხლი. რამდენი კაცის სისხლის ანალიზი უნდა მოიპოვოს? ასეთ და ამდაგვარ ამოცანაზე პასუხის გასაცემად, პირველად უნდა იყოს მიღებული სხვა კითხვებზე პასუხი, კერძოდ 1) ნებისმიერი გადაწყვეტილება შეცდომასთან არის დაკავშირებული, წინასწარ უნდა გადავწყვიტოთ რა შესაძლო შეცდომაზე მივდივართ და 2) რა სიზუსტით  გვინდა შევაფასოთ ასეთი ადამიანების პროცენტი.

დავუშვათ, რომ არასწორი გადაწყვეტილების (შეცდომის) შანსი შეადგენს  ოციდან ერთს (1:20),  სასურველი სიზუსტეა 5% და იგულისხმება, რომ  პირველი ჯგუფის სისხლის მქონე პირების ფარდობითი სიხშირე P¯ ნორმალურადაა განაწილებული P საშუალოთი (პოპულაციაში პირველი ჯგუფის სისხლის მქონე პირების ალბათობა) და P(1- P)/n დისპერსიით. მაშინ 19/20 ალბათობით მოსაძებნი P უნდა იყოს ინტერვალში P¯±1.96P(1-P¯)¯n აქედან 1.96P¯(1-P¯)N=0.05 ანუ n=(1.96)2 ·P(1-p)/0.0025=3.8416·P(1-P)/0.0025

აქ არსებობს სირთულე დაკავშირებული მოცულობის განსაზღვრის ნებისმიერ ამოცანასთან: n - ის ფორმულა მიღებულია, მაგრამ ის მოიცავს უცნობ P - ს. გვჭირდება ან წინა კვლევებიდან ან ლიტერატურიდან მიღებული ინფორმაცია P - ს შესახებ. თუ ასეთი ინფორმაცია არ გაგვაჩნია P - ს მაგივრად უნდა ჩავსვათ 0.5.

თუ ამოცანა ეხება პოპულაცის საშუალოს შეფასებას და გვინდა განსაზღვროთ ის მინიმალური მოცულობა n', რომელიც ნდობის ფიქსირებული (1 -α) დონისათვის უზრუნველყოფს შეფასების ფიქსირებულ სიზუსტეს ანუ რაც იგივეა, (1 -α) ნდობის ინტერვალის ფიქსირებულ l სიგრძეს, სასურველი მოცულობა მოიძებნება შემდეგი განტოლებიდან 2σnzα/2=l სადაც σ პოპულაციის სტანდარტული გადახრაა, ხოლო Zα/2 სტანდარტული ნორმალური განაწილების ზედა α/2 კრიტიკული წერტილი.

ვღებულობთ: n'=2σlzα/22 იმის გამო, რომ 2σlzα/22შეიძლება მთელი რიცხვი არ იყოს, უფრო ზუსტი იქნებოდა გვეთქვა, რომ არის ის უმცირესი მთელი რიცხვი, რომელიც მეტია   2σlzα/22-ზე. მინიმალური მოცულობა წარმოადგენს დისპერსიისა და ნდობის დონის ზრდად ფუნქციას. რაც უფრო მცირეა ნდობის ინტერვალის სიგრძე (დიდია სიზუსტე), მით უფრო დიდია მინიმალური მოცულობა.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: