Jakie są rodzaje walidacji? Co to jest? Odpowiedzi na te i inne pytania znajdziesz w artykule. Trafność jest z natury pojedynczą cechą, która obejmuje z jednej strony dane o tym, czy technologia nadaje się do pomiaru tego, do czego została stworzona, az drugiej, jaka jest jej skuteczność, przydatność praktyczna, wydajność. Sprawdzanie poprawności technologii nazywa się walidacją. Rozważymy to bardziej szczegółowo poniżej.
Wyświetlenia
Wiele osób pyta: „Co to jest walidacja?” Mówi się, że wyrafinowany umysł nie ma granic. Metodolodzy zdają się konkurować ze sobą w kwestii tego, kto odkryje lub wymyśli więcej typów i typów trafności. Jakie tylko nazwiska nie pojawiły się ostatnio! Okazuje się, że istnieje:
- ważność zewnętrzna i wewnętrzna;
- zbieżne;
- dyskryminujący;
- oczywiste;
- silnia;
- przewidywanie;
- konstruktywny;
- kryterium;
- znaczące i tak dalej.
Nie ma sposobu, aby zrozumieć, a tym bardziej sensownie odróżnić jedną odmianę od drugiej. Zamieszanie w definicjach i klasyfikacjach prowadzi do tego, że różni autorzy tej samej formie ważności przypisują zupełnie różne sposoby jej ulepszania.
Kryteria zewnętrzne
Do przeprowadzenia pragmatycznej walidacji metodologii, czyli oceny jej praktycznego znaczenia, skuteczności, wydajności, zwykle stosuje się zewnętrzne niezależne kryterium – wskaźnik pokazujący badaną jakość w życiu codziennym. Takim kryterium mogą być zarówno osiągnięcia produkcyjne (w przypadku technologii o orientacji zawodowej), jak i wyniki w nauce (w przypadku testów inteligencji, osiągnięć lub zdolności uczenia się), a także skuteczność rzeczywistych działań – modelowanie, rysowanie itp. (w przypadku testów z specjalne umiejętności), osobiste oceny (w celu weryfikacji tożsamości).
Typy zewnętrznych kryteriów walidacji są następujące:
- miary wydajności (mogą one obejmować ilość wykonanej pracy, czas poświęcony na szkolenie, wyniki w nauce, tempo wzrostu kwalifikacji itp.);
- znaki fizjologiczne (używane podczas badania wpływu środowiska i innych zmiennych sytuacyjnych na ludzką psychikę i ciało);
- mierzy się ciśnienie krwi, tętno, objawy zmęczenia, opór elektryczny skóry itd.następny;
- miary subiektywne (obejmują różnego rodzaju odpowiedzi, które odzwierciedlają stosunek osoby do kogoś lub czegoś, jej poglądy, opinie, preferencje; z reguły takie pomiary uzyskuje się za pomocą kwestionariuszy, kwestionariuszy, wywiadów);
- objawy wypadków (stosowane, gdy cel badania dotyczy np. problemu wyboru do pracy osób mniej narażonych na wypadki).
Ważność empiryczna. O co chodzi?
Niewiele osób wie, czym jest walidacja empiryczna. W przypadku poprawności treści test jest oceniany przez ekspertów (stwierdzenie zgodności zadań testowych z treścią przedmiotu pomiaru). A empiryczną mierzy się zawsze za pomocą korelacji statystycznej: obliczana jest korelacja dwóch rodzajów wartości - wyników testów i wskaźników dla zewnętrznego parametru wybranego jako kryterium rzetelności.
Konstruktywny
Nie wszyscy znają rodzaje metod walidacji. Czym jest zasadność konstruktu? Ma to związek z samą konstrukcją teoretyczną i polega na szukaniu czynników wyjaśniających zachowanie wydajności testu.
Jako specyficzny typ, trafność konstruktu jest usankcjonowana w artykule Mila i Cronbacha (1955). Korzystając z tej formy trafności, autorzy ocenili wszystkie ankiety testowe, które nie miały na celu bezpośrednio przewidywania pewnych istotnych kryteriów. Badanie zawierało informacje o konstruktach psychologicznych.
Ważność treści
Ty nadalpytasz: „Walidacja – co to jest”. Rozważ ważność treści. Wymaga, aby każdy problem, pytanie lub zadanie należące do danego obszaru miały identyczne szanse na stanie się przedmiotem testu.
Content Validity ocenia przydatność obiektu testowego do mierzonego obszaru zachowania. Weryfikacje tworzone przez dwie grupy programistów przeprowadzane są na próbie sprawdzanych. Wiarygodność testów jest obliczana poprzez podział pytań na dwie strefy, co daje w wyniku indeks trafności treści.
Przewidywanie
Nadal rozważamy metody walidacji. Trafność predykcyjna jest również ustalana przez zewnętrzne, dość wiarygodne kryterium. Ale informacje o nim są zbierane jakiś czas po weryfikacji.
Zewnętrzną miarą jest zwykle zawód jednostki, wykazywany w każdej ocenie, dla rodzaju zawodu, do którego został wybrany na podstawie wyników testów diagnostycznych.
Chociaż ta metoda jest najbardziej odpowiednia do zadania narzędzi diagnostycznych - przewidywania przyszłego sukcesu, jest bardzo trudna do zastosowania. Dokładność prognozy jest odwrotnie zależna od czasu przeznaczonego na taką prognozę. Im więcej czasu mija po pomiarze, tym więcej czynników należy wziąć pod uwagę przy ocenie wartości predykcyjnej technologii. Jednak prawie niemożliwe jest uwzględnienie wszystkich czynników, które wpływają na prognozę.
Retrospektywa
Zgadzam się, sprawdzanie poprawności to bardzo skomplikowany proces. Wiadomo, że trafność retrospektywna ujawnia się na podstawie kryterium,odzwierciedlające stan jakości lub wydarzenia w przeszłości. Może być używany do natychmiastowego uzyskiwania predykcyjnych źródeł technologii. Tak więc, aby zrewidować, w jakim stopniu dobre wyniki testu umiejętności odpowiadają szybkiemu uczeniu się, można porównać wcześniejsze opinie ekspertów, oceny wydajności itd. u osób z niskimi i wysokimi w tej chwili wskaźnikami diagnostycznymi.
Dyskryminacyjne i zbieżne
Rodzaje walidacji są interesujące dla wielu. Dowiedzmy się, czym jest ważność dyskryminacyjna i zbieżna. Strategia wprowadzania ustalonych pozycji do testu zależy od tego, w jaki sposób psycholog ujawnia konstrukt diagnostyczny. Jeśli Eysenck definiuje jakość „neurotyzm” jako niezależną od introwersji-ekstrawersji, oznacza to, że jego kwestionariusz powinien w równym stopniu reprezentować stanowiska, które zostaną zatwierdzone przez neurotycznych ekstrawertyków i introwertyków.
Jeżeli w praktyce okaże się, że w zadaniu przeważać będą pozycje z kwadrantu „introwersja-neurotyzm”, to z pozycji teorii Eysencka oznacza to, że wskaźnik „neurotyzm” jest obciążony wskaźnikiem nieistotnym - „introwersja”. Identyczny efekt pojawia się, gdy w próbce występuje błąd systematyczny – jeśli jest w niej więcej neurotycznych introwertyków niż tych samych ekstrawertyków.
Aby uniknąć takich zawiłości, psychologowie chętnie zajmują się kwestiami empirycznymi, które informują tylko o jednym czynniku. Ale w rzeczywistości warunek ten nigdy nie jest spełniony: każdy wskaźnik empiryczny okazuje się być określony nietylko przez czynnik, którego potrzebujemy, ale także przez inne - nieistotne dla problemu pomiaru.
Tak więc, dla czynników, które są koncepcyjnie zdefiniowane jako ortogonalne do mierzonego (występujące z nim we wszystkich kombinacjach), twórca testu jest zobowiązany, przy wyborze pozycji, do stosowania strategii nieautentycznego równoważenia.
Zbieżność punktów z mierzonym wskaźnikiem gwarantuje zbieżną ważność testu. Spójność pozycji w odniesieniu do nieistotnych źródeł zapewnia trafność dyskryminacyjną. Empirycznie objawia się to brakiem istotnej korelacji z testem, który mierzy koncepcyjnie unikalną jakość.
Zestaw narzędzi
W ogólnym zestawie metod walidacji autorzy zwykle obejmują:
- niesformalizowane (od prostych sztuczek do dokładnego przejrzenia listy alternatyw w kwestionariuszu do bardziej wyrafinowanych procedur teoretycznej analizy krok po kroku);
- sformalizowane, które obejmują procedury i technologie statystyki matematycznej: testowanie hipotez statystycznych, obliczanie szacunków, analizę korelacji, konstruowanie przedziałów ufności, ocenę relacji między zmiennymi, analizę rozproszenia, czynnikową, regresyjną i strukturalną itd. wł.
Narzędzia do tworzenia
A jednak, czym jest walidacja? Wyrafinowane narzędzia walidacji zostały najpierw stworzone przez psychologów. W 1959 r. D. Fiske i D. Campbell (USA) opracowali specjalną technikę. Otrzymała całkowicie naturalny dla angielskiego, ale nieprzetłumaczalny nanasz język, nazwa: multi-method-multi-damn matrix (MTMM). Ta macierz była tabelą korelacji. Składał się z dwóch bardzo atrakcyjnych wynalazków, z których jeden miał na celu ujawnienie prawdy zbieżnej, a drugi prawdy dyskryminacyjnej.
Jego autorzy argumentowali, że każdy może udowodnić wewnętrzną akceptację, jeśli:
- wartości, pomiędzy którymi zakłada się wysoki poziom teoretycznego powiązania, znajdą identyczny poziom w empirycznym (zbieżność);
- wartości, które są teoretycznie niepowiązane, po wykonaniu testu okażą się niepowiązane empirycznie (dyskryminacja).
Z grubsza rzecz biorąc, zasadność zbieżna powinna wskazywać, że istnieje znacznie większe podobieństwo między dwoma zespołami pracowników, na przykład robotnikami budowlanymi i pracownikami linii montażowych, pod względem szans na rynku pracy niż między właścicielami i pracownikami. Jeśli teoretycznie zamierzona zależność zostanie znaleziona empirycznie, twoja próbka jest prawidłowa.
Trafność dyskryminacyjna pokazuje stopień identyfikacji różnych zjawisk. Biorąc ten sam przykład z rynku pracy, można by oczekiwać, że dobrze uformowana teoria mogłaby za jej pomocą odróżnić szanse właścicieli i pracowników na rynku pracy. Nie możesz ich pomylić, a Twoja teoria może je rozróżnić.
Jeżeli stworzyłeś skalę mierzącą zdolności matematyczne, to w przypadku trafności zbieżnych wskaźników zdolności matematycznych powinny dobrze korelować z ogólnymi umiejętnościami osoby, jeśli na poziomie teoretycznym taka zależnośćjest, i to źle - ze zdolnościami estetycznymi, które wymagają od osoby zupełnie innych talentów niż umiejętności liczenia, jeśli oczywiście twoja teoria głosi niską korelację.
Typy
Walidacja to proces dostrajania, doskonalenia tworzonych metod psychodiagnostycznych. Jej podstawowym zadaniem jest zapewnienie, że technologia dokładnie diagnozuje to, czego potrzebuje deweloper. Rozróżnia się walidację teoretyczną i pragmatyczną.
Dla pierwszego rodzaju problemem kardynalnym jest związek między zjawiskami psychicznymi a ich wskaźnikami, za pomocą których zjawiska te starają się poznać. Pokazuje, że wyniki metodologii i abstrakcyjna intencja autora są takie same.
Aby ustalić trafność abstrakcyjną, bardzo trudno jest znaleźć jakiekolwiek niezależne kryterium, które wykracza poza metodologię. Dlatego w historii psychodiagnostyki na wczesnych etapach polegano na instynktownej koncepcji, którą mierzy test:
- Metoda została uznana za prawidłową, jeśli była po prostu "oczywista".
- Dowód prawdziwości opierał się na przekonaniu poszukiwacza, że jego technologia może „zrozumieć testowanego”.
- Schemat uznano za ważny tylko dlatego, że teoria stojąca za technologią była „całkiem dobra”.
Następnie rozpoczęto poszukiwania dowodów uzasadnionych naukowo. Należy w tym miejscu zauważyć, że niedostrzegalne nagromadzenie arsenału technologii o już ugruntowanej i znanejważność. Jeśli psychodiagnosta stworzy schemat oceny jakości i wiadomo, że inne, ważne technologie mają na celu tę samą ocenę, wtedy można zbadać korelację, porównać wyniki według cudzej i własnej metody.
Jeśli współczynnik korelacji jest zbyt wysoki, wygenerowany schemat ma imponującą ważność abstrakcyjną. Jeśli masz wątpliwości, co dokładnie ocenia technologia, porównaj wyniki dla niej z wynikami dla innych prawidłowych schematów, które rozpoznają sąsiadujące (podejrzane) właściwości. Jeśli wartości korelacji okażą się nieoczekiwanie duże, można stwierdzić, że metoda nie szacuje tego, czego oczekiwano.
Tak więc, jeśli istnieją już inne schematy mające na celu pomiar dokładnie tych samych lub pokrewnych norm, możemy określić trafność dyskryminacyjną i zbieżną.
Nuanse
Co to jest walidacja? W prostych słowach jest to rewizja produktu, aby zobaczyć, jak pasuje do deklarowanych właściwości. Oznacza to, że do tego czasu żadna walidacja smartfona nie przejdzie. Dopóki klienci nie upewnią się, że ma aparat i pamięć masową, za które są gotowi zapłacić.
Kryterium walidacji jest miarą jakości psychicznej, która jest niezależna i bezpośrednia od walidowanego testu i do której skierowany jest schemat psychodiagnostyczny.
Trafność aktualna – cecha testu, odzwierciedlająca jego zdolność do rozróżniania badanych na podstawie cechy diagnostycznej będącej przedmiotem badań w tymmetoda.
Trafność konkurencyjna jest szacowana przez korelację utworzonego testu z innymi, których trafność względem mierzonego parametru jest ustalana. Trafność różnicową można wyjaśnić na przykładzie testów zainteresowań.