მრავლობითი დისპერსიული ანალიზი
დისპერსიული ანალიზი სიტუაციებში, როცა საქმე გვაქვს რამოდენიმე დამოკიდებულ ცვლადთან (ANOVA-ში განიხილება ერთი დამოკიდებული ცვლადი სამი ან მეტი დონით).
დისპერსიული ანალიზი სიტუაციებში, როცა საქმე გვაქვს რამოდენიმე დამოკიდებულ ცვლადთან (ANOVA-ში განიხილება ერთი დამოკიდებული ცვლადი სამი ან მეტი დონით).
მოდელი, რომელშიც Y ცვლადის ცვლადებზე დამოკიდებულების მათემატიკური წესი მოცემულია წრფივი განტოლებით (კავშირით).
მრავლობითი რეგრესიის შემთხვევაში, ხშირად რამოდენიმე რეგრესორს შორის ზუსტი ან მიახლოებით წრფივი დამოკიდებულებაა.
რიცხვითი ცვლადი, რომელიც იღებს მხოლოდ ორ მნიშვნელობას 0 ან 1, იმისათვის, რომ მიუთითოს გარკვეული კატეგორიული ეფექტის ყოფნა არ ყ
P(A და B)=P(AB)=P(A)P(B/A)=P(B)P(A/B). თუ A და B დამოუკიდებელი ხდომილებებია P(AB)=P(A)P(B). დამოუკიდებელი ხდომილობებისათვის ხდომილობათა ერთდროულად განხორციელების ალბათობა უდრის ხდომილობათა ალბათობების ნამრავლს.
გამოიყენება წრფივი რეგრესიის მოდელის ადეკვატურობის შესამოწმებლად.
რეგრესიულ ანალიზში განსხვავება დამოკიდებული ცვლადის დაკვირვებულ შერჩევით მნიშვნელობასა (Y) და რეგრესიით პროგნოზირებულ მნიშვნელ
ალბათობა იმისა, რომ ნდობის ინტერვალი ფარავს პარამეტრის ჭეშმარიტ მნიშვნელობას.
ვთქვათ, და ორი ნორმალური პოპულაციის უცნობი საშუალოებია. და შესაბამისად პირველი და მეორე პოპულაციებიდან აღებული და მოცულობის შერჩევების საშუალოებია, პოპულაციების დისპერსიიები ცნობილია.
პოპულაციის უცნობი პარამეტრის ინტერვალური შეფასება, პოპულაციის პარამეტრისათვის შერჩევაზე დაყრდნობით გამოთვლილი ისეთი ინტერვალი , რომლისთვისაც მოცემული ნდობის ალბათობისათვის შესრულებულია პირობა და სიდიდეებს ნდობის ინტერვალის საზღვრები ეწოდება.
ორი თვისებრივი ცვლადის (სახელდების ან რიგის სკალის ცვლადი) ერთობლივი განაწილების წარმოდგენის საშუ
ზარისებური ფორმის სიხშირეთა ალბათური განაწილება მიიღება მაშინ, თუ მონაცემთა უმრავლესობა გროვდება განაწილების ცენტრში და იკლებს ცენტრიდან მოშორებით.
კრიტიკული არე, რომელიც განლაგებულია კრიტერიუმის სტატისტიკის განაწილების ორივე კუდში.
თუ პოპლაციის განაწილების ფუნქციის ფორმა ცნობილია, მაგრამ განაწილება შეიცავს უცნობ პარამეტრს და ჰიპოთეზა ეხება განაწილების ამ უცნობ პარამეტრს (მაგალითად, პოპულაციის საშუალოს ან დისპერსიას), ასეთ ჰიპოთეზას პარამეტრული ეწოდება.
გამოიყენება მაშინ, თუ საჭიროა ორი პოპულაციის შედარება რაიმე თეორიული პარამეტრის (რიცხვითი მახასიათებლის) მიხედვით.
A ხდომილობის განხორციელების ალბათობა პირობაში, რომ B ხდომილება უკვე მოხდა (B პირობით, P(B)>0) ეწოდება.
სტატისტიკა, რომელიცზომავს ორ ცვლადს შორის წრფივი დამოკიდებულების ხარისხს და გვიჩვენებს ამ კავშირის მიმართულებას.
გამოიყენება სიხშირეთა განაწილების გრაფიკული წარმოდგენისათვის როგორც დაუჯგუფებელი მონაცემებისათვის
სოციოლოგიურ ამოცანებში ხშირად დამოკიდებულება X და Y ცვლადს შორის არაა წრფივი, არამედ უფრო რთული ხ
სამიზნე ჯგუფის წევრებს, რომლებზეც უნდა ჩატარდეს კვლევა ეწოდებათ კვლევის სუბიექტები.
პოპულაციის მონაცემთა გაფანტულობის საზომი გამოითვლება ფორმულით სადაც - პოპულაციის საშუალოა, N- პოპულაციის მოცულობა.
რეგრესიის მოდელში დამოუკიდებელი (ამხსნელი) ცვლადი.
არის ლოგისტიკური რეგრესიის კერძო შემთხვევა, როდესაც გამოიყენება ნორმალური განაწილება.
სტატისტიკაში პროგნოზის სიზუსტე ეწოდება სიახლოვის ხარისხს შეფასებასა და შესაფასებელ პარამეტრს შორი
შერჩევის მონაცემთა განლაგებისა და განფენილობის (გაფანტულობის) დასახასიათებლად გამოიყენება.
ქულის პროცენტული რანგი ეწოდება იმ მონაცემთა პროცენტს შერჩევაში, რომელიც ნაკლები ან ტოლია განხილულ ქულაზე.
ალბათური დისკრეტული განაწილება ორშედეგიანი ცდების წარმატებათა რაოდენობისათვის, როცა ცდათა რიცხვი n ძალიან დიდია, წარმატების ალბათობა p კი პატარა ( ) და .
ვთქვათ, შერჩევის ყველა მონაცემი ერთმანეთისაგან განსხვავებულია და ისინი დალაგებულია ზრდის მიხედვით. x მონაცემის რანგი (rank) ეწოდება ამ მონაცემის ნომერს (რიგით მერამდენეა ამ დალაგებაში) ზრდის მიხედვით დალაგებულ მწკრივში.
ამოწმებს ორი ნიშნის დამოუკიდებლობას და წარმოადგენს დამოკიდებულების სიძლიერის საზომს.
ადგენს კავშირს ინდივიდთა ან ობიექტთა ორ ნიშანს (მახასიათებელს) შორის.
ფსიქოლოგიაში, როგორც მრავალ სხვა დარგში ხშირად აუცილებელი ხდება ორ (ან რამოდენიმე) სიდიდეს შორის დამოკიდებულების შესწავლა.
კორელაციურ ანალიზთან მჭიდროდ დაკავშირებული მეთოდია, რომლით
მიიღება მაშინ, როცა გასაზომი ობიექტები განსხვავდებიან რაიმე დამახასიათებელი თვისების ხარისხის მიხედვით, მაგრამ შეუძლებელია იმის განსაზღვრა, რამდენით ან რამდენჯერ აღემატება ერთი ობიექტი მეორეს ამ თვისების მიხედვით.
მეთოდები, რომლებიც ამცირებენ ანომალიური მონაცემების გავლენას პარამეტრების შეფასებებზე.
შერჩევის საშუალო იგივეა, რაც მონაცემთა მნიშვნელობების საშუალო არითმეტიკული და გამოითვლება ფორმული
შერჩევის ქულათა ცვალებადობის ერთ-ერთი საზომია და გამოითვლება როგორც შერჩევის მონაცემების არითმეტი
ცვალებადობის საზომი, რომელიც მიიღება განაწილებაში შემავალი თითოეული ქულისა და ამ განაწილების საშუალოს შორის სხვაობის კვადრატში აყვანით, მიღებული სიდიდეების დაჯამებითა და მიღებული ჯამის გაყოფით განაწილებაში შემავალი ქულების რაოდენობაზე
ამბობენ, რომ X შემთხვევით სიდიდეს აქვს k რიგის საწყისი მომენტი და ამას აღნიშნავენ , თუ , სადაც E - მათემატიკური ლოდინია და k ნატურალური რიცხვია.
მიიღება საგნების (ობიექტების, პირების) იმგვარი კლასიფიკაციისას, როდესაც ერთ კატეგორიაში მოთავსებული საგნები იდენტურია ან თითქმის იდენტურია გარკვეული თვისების ან ნიშნის მიხედვით.
თვისებრივ მონაცემთა განაწილების გრაფიკული წარმოდგენა (კატეგორიული ცვლადებისათვის).
ნაერთი სიმეტრიის კერძო შემთხვევაა.
ნულოვანი ჰიპოთეზის უარყოფის ალბათობა, როცა ჭეშმარიტია ალტერნატიული ჰიპოთეზა.
გაზომვის შედეგად მიღებული მონაცემები, სხვადასხვა მიზეზის მოქმედების გამო, გარდაუვალ შეცდომებს შეიცავენ.
მონაცემთა სიმრავლის დასახასიათებლად პირველადი დამუშავების მიზნით გამოიყენება სიხშირეთა განაწილების ცხრილი. ქულის სიხშირე არის შერჩევაში ერთმანეთის ტოლი ქულების რაოდენობა.
ცხრილი, რომელშიც მოცემულია შერჩევის ყველა განსხვავებული ელემენტის სიხშირე (რაოდენობა) და ფარდობითი სიშირე.
ვთქვათ, B ხდომილობა ხორციელდება მხოლოდ მაშინ, თუ მოხდება ერთი მაინც უთავსებად
მეცნიერება სტატისტიკა მათემატიკის ნაწილია, რომელიც გვაწვდის კვლევის მეთოდებს:
შერჩევის მონაცემთა ნებისმიერი ფუნქცია, ამასთან, ამ ფუნქციის გამოსახულებაში არ უნდა მონაწილეობდეს რაიმე სხვა პარამეტრი.