კრიტერიუმის ვალიდობა შეეხება ფსიქოლოგიური ინსტრუმენტის უნარს, იწინასწარმეტყველოს კრიტერიუმი ანუ სხვა ინსტრუმენტით გაზომილი ცვლადი. სხვა სიტყვებით, კრიტერიუმი ვალიდობა გვიჩვენებს, რამდენად შეუძლია მოცემულ ინსტრუმენტს პროგნოზირება. კრიტერიუმი, შესაძლოა, მნიშვნელოვანი შედეგი იყოს, როგორიცაა სამეცნიერო წამოწყების წარმატებულობა, ექიმის დიაგნოზი, სხვა ტესტის შესრულების ხარისხი ანდა ამ ინდივიდუალური შესაძლებლობების გარკვეული კომბინაციაც კი. მოცემული ინსტრუმენტისგან დამოუკიდებელი ნებისმიერი ცვლადი, რომლის მნიშვნელობაც უნდა იწინასწარმეტყველოს ამ ინსტრუმენტმა, პოტენციურად, რელევანტური კრიტერიუმია.
საზომის კრიტერიუმის ვალიდობის შეფასებისას ყოველთვის უნდა გვახსოვდეს, რომ არსებობს კრიტერიუმის კონტამინაციის ალბათობა. მაგალითად, მასწავლებლების მიერ მოცემული აკადემიური მიღწევების მიხედვით რეიტინგები შეგვიძლია სტუდენტების აკადემიური უნარების საზომი ტესტის ვალიდაციის კრიტერიუმად გამოვიყენოთ. ზოგადად, ასეთი სქემა ლოგიკური და მართებული იქნება, თუმცა თუ მასწავლებლებს, რეიტინგების შედგენამდე, მათი სტუდენტების აკადემიური მიღწევების ქულებს გავაცნობთ, ამ ინფორმაციამ, შესაძლოა, რეიგინგის შედგენის პროცესი მიკერძოებული გახადოს. სხვა სიტყვებით, კრიტერიუმი ანუ მასწავლებლების რეიტინგები შეიძლება მიღწევის ტესტის შესახებ ინფორმაციით „გაჭუჭყიანდეს“/“ დაბინძურდეს“ და, შესაბამისად, დიდი ალბათობით, მივიღებთ ცრუ კორელაციას უნარების ტესტის ქულასა და მასწავლებლების მიერ მოწოდებულ რეიტინგებს შორის. კრიტერიუმის კონტამინაციის აღმოსაფხვრელად აუცილებლად უნდა დავრწმუნდეთ, რომ კრიტერიუმის ქულების მინიჭება ტესტის ქულებისგან დამოუკიდებლად ხდება.
კონკურენტული და პრედიქტული ვალიდობა
კრიტერიუმის ვალიდობა ორ ძირითად ფორმად — კონკურენტულ და პრედიქტულ ვალიდობად — შეიძლება დაიშალოს, თავად ტესტსა და მიერ მიერ ნაწინასწარმეტყველებ/წინასწარ მოსალოდნელ/ შედეგს შორის დროითი მიმართების მიხედვით.
კონკურენტული ვალიდობა გვიჩვენებს, რამდენად შეუძლია მოცემულ ინსტრუმენტს კრიტერიუმის პროგნოზირება, რომელიც სხვა ინსტრუმენტით გაიზომა დროის იმავე მონაკვეთში, როდესაც მოცემული ინსტრუმენტის ადმინისტრირება მოხდა. სხვა სიტყვებით, კონკურენტული ვალიდობის საჩვენებლად ერთი ინსტრუმენტით მოპოვებული მონაცემები მჭიდროდ უნდა კორელირებდეს სხვა ინსტრუმენტით მიღებულ მონაცემებთან. მაგალითად, დავუშვათ, სტუდენტების მიერ პრობლემების გადაჭრის უნარს ვიკვლევთ. ჩვენ შეგვიძლია, პრობლემაზე მუშაობისას დავაკვირდეთ სტუდენტებს; გავესაუბროთ მათ იმის თშესახებ, როგორ უმკლავდებიან პრობლემას; ან ვთხოვოთ, დაწერონ, როგორ გადაჭრეს მოცემული პრობლემა. ამ შემთხვევაში ჩვენ მონაცემების შეგროვების სამი ინსტრუმენტი გვაქვს: დაკვირვება, ინტერვიუ და სტუდენტების მიერ წარმოდგენილი ნარატივი. თუ სამივე ინსტრუმენტით მიღებული შედეგები შეთანხმებულია ანუ თანხვდება ერთმანეთს და პრობლემის გადაჭრის უნარის მოცემული კრიტერიუმის მიხედვით, სტუდენტები პრობლების გადაჭრის კარგ უნარს ავლენენ, მაშინ მეტი დარწმუნებით ვიტყვით, რომ სტუდენტები კარგად ართმევენ თავს პრობლემის გადაწყვეტას. სხვა სიტყვებით, ჩვენი ინსტრუმენტების კონკურენტული ვალიდობა მიღწეულია.
კონკურენტული ვალიდობა ძირითადი კონცეფციით ანუ მეორე საზომთან თანხმობით ძალიან ჰგავს პრედიქტულ ვალიდობას. მათ, როგორც ზემოთ ითქვა, ერთმანეთისგან განასხვავებს ის, რომ კონკურენტულ ვალიდობაში არ არის წარმოდგენილი დროის მომენტი: სხვა ინსტრუმენტებით მიღებულ შედეგებთან მოცემული ინსტრუმენტის შედეგების თანხვედრის ჩვენება ერთდროულად, დროის ერთ მოცემულ მომენტში მათი ადმინისტრირებით არის შესაძლებელი.
პრედიქტული ვალიდობა გვიჩვენებს, რამდენად ახერხებს შეფასების მოცემული ინსტრუმენტი კრიტერიუმის წინასწარმეტყველებას, რომლის გაზომვაც მოცემული ინსტრუმენტის ადმინისტრირების შემდეგ ხდება. სხვაგვარად რომ ვთქვათ, პრედიქტული ვალიდობა მიღწეულია, თუ კვლევის ერთ ეტაპზე მიღებული მონაცემები მჭიდროდ კორელირებს შემდეგ ეტაპზე მიღებულ მონაცემებთან. მაგალითად თუ 16 წლის ასაკში ჩაბარებულ გამოცდაში მიღებული ქულები მჭიდროდ კორელირებს 18 წლის ასაკში იმავე სტუდენტების მიერ ნაჩვენებ შედეგებთან, მაშინ შეგვიძლია ვთქვათ, რომ პირველმა გამოცდამ ძლიერი პრედიქტული ვალიდობა აჩვენა.
პრედიქტული ვალიდობა ხშირად უაღრესად მნიშვნელოვანია ფსიქოლოგიურ შეფასებაში. მაგალითად, აკადემიური უნარების ტესტების სარგებლიანობა, უპირველეს ყოვლისა, პრედიქტული ვალიდობის მიხედვით ფასდება, რადგან მათი ძირითადი ფუნქცია სამომავლო აკადემიური მოსწრების წინასწარმეტყველებაა. კლინიკურ სიტუაციებში ფსიქოლოგიური ტესტირების მნიშვენლობასაც ხშირად პრედიქტული ვალიდობის მიხედვით ადგენენ: რამდენად იძლევა ტესტი ისეთ ინფორმაციას, რომელსაც მნიშვნელოვანი კლინიკური ცვლადების, მაგალითად, მკურნალობის ხანგრძლივობის, პროგნოზირებისთვის გამოვიყენებთ? რამდენადაც შეუძლია მოცემულ ტესტს მნიშვნელოვანი კლინიკური შედეგის წინასწარმეტყველება, იმდენად შეგვიძლია ვთქვათ, რომ მას აქვს პრედიქტული ვალიდობა კლინიკურ სიტუაციებში.
პრედიქტული ვალიდობის შეფასებისას მუდმივად, დგება საკითხი: რამდენად ოპტიმალურია შერჩეული კრიტერიუმი? ბევრი რელევანტური კრიტერიუმი უბრალოდ ძალიან შორსაა მომავალში ან ძალზე ამორფულია იმისათვის, რომ გამოვიყენოთ. მაგალითად, უნარების ტესტები შეიძლება იდეალურად წინასწარმეტყველებდეს წარმატებას მოცემულ პროფესიაში, თუმცა, ვიღაც იტყვის, რომ ამ ტესტების უფრო პრაგმატული მიზანი იქნებოდა იმის განსაზღვრა, თუ რომელ პოტენციურ სტუდენტებს აქვთ მოცემულ დარგში სიახლეების აღმოჩენის შანსები. მიუხედავად იმისა, რომ შესაძლებელია ასეთი კონსტრუქტის გაზომვა (მაგალითად, ამ სფეროში დასაქმებული ადამიანების გამოკითხვით), დროის შუალედი უნარების ტესტირებასა და დარგში წვლილის შეტანას შორის, შესაძლოა, უსაშველოდ დიდი იყოს. ამგვარად, ხშირად სასარგებლო, მაგრამ იდეალურისგან შორს მყოფი კრიტერიუმის პროგნოზირება გვიწევს. ასე მაგალითად, აკადემიური უნარების ტესტების ვალიდაცია ხშირად ისეთი საზომების გამოყენებით ხდება, რომელთათვის თვალის მიდევნება გაცილებით მარტივია, ვიდრე „დარგში შეტანილი უაღრესად მნიშვნელოვანი წვლილი“.
***
გამოყენებული ლიტერატურა:
Cohen, L., Manion, L., Morrison, K. (2007). Research Methods in Education. London, New York: Routledge.
Kazdin, A. E. (Ed.) (2000). Encyclopedia of psychology. 8 Volume Set.