ექსტრემალური მონაცემები

Extremal Data

„ამოვარდნილი“ დაკვირვებები ანუ ის დაკვირვებები (მონაცემები), რომლებიც მკვეთრადაა განსხვავებული მონაცემთა ძირითადი მასივისგან. მაგალითად, მონაცემებისათვის 4, 1, 1, 5, 3, 3, 3, 100, რიცხვი 100 ამოვარდნილი მონაცემია.

არითმეტიკული საშუალო ზედმეტად მგრძნობიარეა ექსტრემალური დაკვირვებების მიმართ. მედიანა კი მდგრადია ასეთი დაკვირვებების მიმართ,  მაგრამ არ უნდა ვიფიქროთ, რომ მედიანას ყოველთვის უნდამიენიჭოს უპირატესობა საშუალოსთან შედარებით. საშუალო გამოითვლება ყველა მონაცემით და შეიცავს მეტ ინფორმაციას, მედიანა კი მხოლოდ შუა მონაცემებს ითვალისწინებს. არსებობს მრავალი სტატისტიკური პოპულაცია, რომელთათვისაც ექსტრემალური დაკვვირვება ნაკლებად მოსალოდნელია.

როცა საშუალო მკვეთრადაა წანაცვლებული „ამოვარდნილი“ დაკვირვებების მიმართულებით და არ წარმოადგენს ცენტრალური ტენდენციის საიმედო საზომს, ცენტრალური ტენდენციის დასახასიათებლად ირჩევენ მედიანას ან მონაცემებს აშორებენ ექსტრემალურ დაკვირვებას.

მაგალითი: ავსტრალიის  ერთ-ერთი უნივერსიტეტის თანამშრომელთა წლიური შემოსავალი 28000, 109000, 26000, 32000, 30000, 26000, 29000. აქ 109000 - ექსტრემალური მონაცემია.

გვაქვს x¯=40000, მედიანა არის 29000. ყველა მონაცემი გარდა, ერთისა საშუალოზე ანუ 40000-ზე გაცილებით ნაკლებია, ამრიგად x¯=40000 არ აღწერს ტიპურ შემოსავალს, მედიანა კი, ამ შემთხვევაში კარგი შეფასებაა. თუ შერჩევიდან ამოვიღებთ 109000, საშუალო ძლიერ შეიცვლება და იქნება 28500, მედიანა კი, მხოლოდ ოდნავ შეიცვალა და გახდა 28500.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: