ლოგისტიკური რეგრესია

Logistic Regression

გამოიყენება მაშინ, როცა საჭიროა X1,X2,...Xn რედიქტორების (რეგრესორების) მნიშვნელობებზე დაყრდნობით რაიმე ხდომილობის განხორციელების ალბათობის წინასწარმეტყველება. ამისათვის შემოდის დამოკიდებული ცვლადი Y, რომელიც იღებს მხოლოდ ორ მნიშვნელობას 0-ს, თუ ხდომილება არ განხორციელდა, და 1-ს, თუ განხორციელდა. ამ მეთოდის გამოყენებით შესაძლებელია, გამოვიკვლიოთ ბინარული (ორ დონიანი კატეგორიული ცვლადი, დიხოტომიური ცვლადი) ცვლადების დამოკიდებულების ხასიათი ნებისმიერ სკალაზე მიღებულ დამოუკიდებელ ცვლადებზე. Y=1 ხდომილობის განხორციელების ალბათობა გამოითვლება ფორმულით p=11+e-z, სადაც Z=b1 X1+b2X2+....+bn Xn. ლოგისტიკური რეგრესიის ამოცანა სწორედ ამ bi კოეფიციენტების გამოთვლაა. თუ p-ს მნიშვნელობა გამოვა 0.5-ზე ნაკლები, შეიძლება ჩავთვალოთ, რომ განხილული ხდომილობა არ განხორციელდება, წინააღმდეგ შემთხვევაში კი ითვლება, რომ ხდომილობა განხორციელდება. ლოგისტიკურ რეგრესიაში bi კოეფიციენტების შესაფასებლად გამოიყენება მხოლოდ მაქსიმალური დასაჯერობის მეთოდი. 

მაგალითი: გასარკვევია ცხოვრების წესის რა ფაქტორები არიან გულის იშიმიური დაავადების რისკ-ფაქტორები. თუ თქვენს განკარგულებაშია პაციენტების შერჩევა მოწევის, კვების, ფიზიკური აქტივობის და ალკოჰოლის მონაცემებით, შეიძლება ლოგისტიკური რეგრესიის მოდელის აგება ამ დაავადების წინასწარმეტყველებისათვის (უნდა შეხვდეს პაციენტს ეს დაავადება თუ არა). ამ მოდელის გამოყენება შეიძლება თითოეული ფაქტორის მოქმედების შანსის შესაფასებლად. მაგალითად, დადგენა, რამდენად უფრო სავარაუდოა მწეველებისათვის გულის იშიმური დაავადება, ვიდრე არამწეველებისათვის.

***

გამოყენებული ლიტერატურა:

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Ltd.

კისი, ჰ. (2008). სტატისტიკა სოციალურ მეცნიერებებში. სოციალურ მეცნიერებათა ცენტრი.  თბილისის უნივერსიტეტის გამომცემლობა

კატეგორია: 
ავტორები: