შესწორებული შერჩევითი დისპერსია

Adjusted Sample Variance

მოსახერხებელია გაფანტულობის ოდნავ მოდიფიცირებული საზომის განხილვა, რომელსაც შესწორებულ შერჩევით დისპერსიას უწოდებენSn2=nb-1Sn2=1n-1(xi-x)2=1n-1i=1nxi2-n(x)2i=1n

შენიშვნა: აღსანიშნავია, რომ შერჩევითი საშუალოპოპულაციის საშუალოს საუკეთესო შეფასებაა, კერძოდ, იგი არის ე.წ. ჩაუნაცვლებელი შეფასება. ჩაუნაცვლებლობა გულისხმობს შემდეგს: მიუხედავად იმისა, რომ სხვადასხვა შერჩევის მიხედვით გამოთვლილი პარამეტრის შეფასება საზოგადოდ სხვადასხვა შედეგს იძლევა, ის საშუალოდ ემთხვევა პარამეტრის ჭეშმარიტ მნიშვნელობას. შერჩევითი დისპერსია არ არის პოპულაციის დისპერსიის საუკეთესო შეფასება, რადგან ის არ არის ჩაუნაცვლებელი. იმისათვის, რომ მიიღონ ჩაუნაცვლებელი შეფასება 1/n -ს ცვლიან 1/(n-1) -ით.

მოვიყვანოთ საილუსტრაციო მაგალითი იმისა, რომ შერჩევითი საშუალო ჩაუნაცვლებელი შეფასებაა, ხოლო შერჩევითი დისპერსია კი არ არის ჩაუნაცვლებელი. დავუშვათ, რომ პოპულაცია 3 მონაცემს შეიცავს {0, 2, 4} და მისგან ვაკეთებთ 2 მონაცემიან (n=2 მოცულობის) შერჩევებს. ცხადია, რომ პოპულაციის საშუალო იქნება μ=0+2+43=2 ხოლო დისპერსია კი σ2=13(x1-μ)2+(x2-μ)2+(x3-μ)2=13(0-2)2+(2-2)2+(4-2)2=83 ყველა შესაძლო ორმოცულობიანი შერჩევების რაოდენობა იქნება (შერჩევის როგორც პირველი, ისე მეორე ელემენტის შესაძლო მნიშვნელობათა რაოდენობა 3-ის ტოლოა). ამოვწეროთ ეს შერჩევები და გამოვთვალოთ მათი საშუალოები და დისპერსიები. ვისარგებლოთ ქვემოთმოყვანილი ცხრილით. 

აქედან გამომდინარე, შერჩევითი საშუალოების საშუალო 0+1+2+1+2+3+2+3+49=2 იქნება, ხოლო დისპერსიების საშუალო კი 0+1+4+1+0+1+4+1+09=43 როგორც ვხედავთ, შერჩევითი საშუალო პოპულაციის საშუალოს ჩაუნაცვლებელი შეფასებაა, შეჩევითი დისპერსია კი პოპულაციის დისპერსიის არა. სინამდვილეში  43=2-12·83=n-1n·83 და შესწორება ხდება სწორედ n-1n-ის შებრუნებული სიდიდით nn-1 რათა მივიღოთ ჩაუნაცვლებელი შეფასება 83=nn-143 შევნიშნოთ, რომ თუ პოპულაციის საშუალო μ ცნობილია, მაშინ შერჩევითი დისპერსია განისაზღვრება ფორმულით Sn2=1ni=1n(xi-μ)2. უცნობი საშუალოს შემთხვევაში კი ვსარგებლობთ შერჩევითი საშუალოთი. მაგრამ როგორც ცნობილია (საშუალოს თვისება) i=1n(xi-x)2i=1n(xi-μ)2 ანუ xi-ები უფრო ახლოსაა x¯-თან, ვიდრე μ-სთან. ამის საკომპენსაციოდ  Sn2-ის ფორმულაში n-ის ნაცვლად გამოიყენება  n-1.

მოვიყვანოთ შერჩევითი დისპერსიის თვისებები:

1. თუ არსებული x1,x2...xn  მონაცემებიდან შევქმნით ახალ მონაცემებს  yi=axi+b,i=1,2...,n მაშინ Sγ2=α2Sx2 დაS2y=a2S2x

2. თუ  x1, x2, ...xn და y1,y2,...ym ორი შერჩევაა. მაშინ გაერთიანებული შერჩევისათვის x1,x2,...xn, y1, y2, ....ym  შერჩევითი დისპერსია და შესწორებული დისპერსია გადაითვლება შემდეგნაირად:  Sn,m2=nn+mSx2+mm+nSy2+mn(m+n)2(x-y)2  და Sn,m2=n-1n+mSx2+m-1m+nSy2+mn(m+n-1)(m+n)(x-y)2

იმ კერძო შემთხვევაში, როცა n=m და x¯=y¯ გაერთანებული შერჩევის შერჩევითი დისპერსია იქნება S2=(Sx2+Sγ2)/2.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

 

კატეგორია: 
ავტორები: