Ustandaryzowany test - Standardized test

Młodzi dorośli w Polsce przystępują do matury . Matura jest ustandaryzowana, dzięki czemu uczelnie mogą łatwo porównywać wyniki studentów z całego kraju.

Standaryzowane testy to testy , które są podawane i strzelił w spójny, lub „standardowy”, sposób. Testy standaryzowane są zaprojektowane w taki sposób, aby pytania, warunki podawania, procedury oceniania i interpretacje były spójne oraz były podawane i oceniane w ustalony z góry, standardowy sposób.

Każdy test, w którym ten sam test jest podawany w ten sam sposób wszystkim uczestnikom testu i oceniany w ten sam sposób dla wszystkich, jest testem standardowym. Testy standaryzowane nie muszą być testami wysokiej stawki , testami ograniczonymi czasowo lub testami wielokrotnego wyboru . Test standaryzowany może być dowolnym rodzajem testu: testem pisemnym, ustnym lub testem umiejętności praktycznych . Pytania mogą być proste lub złożone. Przedmiotem wśród uczniów w wieku szkolnym są często umiejętności akademickie, ale ustandaryzowany test można przeprowadzić na prawie każdy temat, w tym na egzaminy na prawo jazdy , kreatywność, atletykę , osobowość , etykę zawodową lub inne cechy.

Przeciwieństwem testów standaryzowanych jest testowanie niestandaryzowane , w którym różnym osobom testującym podaje się znacząco różne testy lub ten sam test jest przydzielany w znacząco różnych warunkach (np. jedna grupa ma znacznie mniej czasu na ukończenie testu niż grupa w następnej grupie) lub oceniane inaczej (np. ta sama odpowiedź jest liczona w przypadku jednego ucznia, a błędna u innego ucznia).

Większość codziennych quizów i testów zdawanych przez uczniów w szkole spełnia definicję standardowego testu: wszyscy w klasie przystępują do tego samego testu, w tym samym czasie, w tych samych okolicznościach, a wszyscy uczniowie są oceniani przez nauczyciela w tym samym sposób. Jednak termin test standaryzowany jest najczęściej używany w odniesieniu do testów przeprowadzanych w większych grupach, takich jak test zdawany przez wszystkich dorosłych, którzy chcą uzyskać licencję na wykonywanie określonego rodzaju pracy, lub przez wszystkich uczniów określonej wiek.

Ponieważ każdy dostaje ten sam test i ten sam system oceniania, standaryzowane testy są często postrzegane jako bardziej sprawiedliwe niż testy niestandaryzowane. Takie testy są często uważane za bardziej sprawiedliwe i bardziej obiektywne niż system, w którym niektórzy uczniowie dostają test łatwiejszy, a inni trudniejszy. Testy standaryzowane mają na celu umożliwienie wiarygodnego porównania wyników wszystkich osób testujących, ponieważ wszyscy biorą udział w tym samym teście. Jednak zarówno testowanie w ogóle, jak i testowanie standaryzowane w szczególności, są krytykowane przez niektórych. Na przykład niektórzy uważają, że niesprawiedliwe jest zadawanie wszystkim uczniom tych samych pytań, jeśli szkoły niektórych uczniów nie mają takich samych standardów nauczania .

Definicja

Dwóch mężczyzn wykonuje resuscytację krążeniowo-oddechową na lalce do resuscytacji krążeniowo-oddechowej
Dwóch mężczyzn przystępuje do autentycznego , niepisanego , standardowego testu opartego na kryteriach. Jeśli wykonają resuscytację krążeniowo-oddechową na manekinie z odpowiednią prędkością i ciśnieniem, zdadzą ten egzamin.

Definicja standardowego testu zmieniła się nieco z biegiem czasu. W 1960 roku standaryzowane testy zdefiniowano jako takie, w których warunki i treść były równe dla wszystkich przystępujących do testu, niezależnie od tego, kiedy, gdzie i przez kogo test został wykonany lub oceniony. Celem tej standaryzacji jest upewnienie się, że wyniki rzetelnie wskazują mierzone zdolności lub umiejętności, a nie inne rzeczy, takie jak różne instrukcje dotyczące tego, co zrobić, jeśli zdający nie zna odpowiedzi na pytanie.

Na początku XXI wieku uwaga odeszła od ścisłej identyczności warunków w kierunku równej sprawiedliwości warunków. Na przykład osoba testowana ze złamanym nadgarstkiem może pisać wolniej z powodu kontuzji, co byłoby bardziej sprawiedliwe i bardziej rzetelne zrozumienie rzeczywistej wiedzy osoby testowanej, gdyby ta osoba miała jeszcze kilka minut na pisanie odpowiedzi na ograniczony czasowo test. Zmiana warunków badania w sposób, który poprawia sprawiedliwość w odniesieniu do trwałej lub czasowej niepełnosprawności, ale bez podważania głównego punktu oceny, nazywa się przystosowaniem . Gdyby jednak celem testu było sprawdzenie, jak szybko uczeń potrafi pisać, wówczas przyznanie zdającemu dodatkowego czasu stałoby się modyfikacją treści, a nie standardowym testem.

Przykłady testów standaryzowanych i niestandaryzowanych
Podmiot Format Ustandaryzowany test Test niestandardowy
Historia Doustny Każdy uczeń otrzymuje te same pytania, a ich odpowiedzi są punktowane w ten sam sposób. Nauczyciel chodzi po sali i zadaje każdemu uczniowi inne pytanie. Niektóre pytania są trudniejsze niż inne.
Napędowy Praktyczne umiejętności Każdy uczeń jazdy jest proszony o wykonanie tych samych czynności i wszyscy są oceniani według tych samych standardów. Niektórzy studenci jazdy muszą jeździć autostradą, ale inni muszą jeździć tylko powoli wokół bloku. Jeden pracownik odbiera punkty za „złe nastawienie”.
Matematyka Pisemny Każdy uczeń otrzymuje te same pytania, a ich odpowiedzi są punktowane w ten sam sposób. Nauczyciel zadaje różne pytania różnym uczniom: łatwy test dla biednych uczniów, inny test dla większości uczniów i trudny test dla najlepszych uczniów.
Muzyka Przesłuchanie Wszyscy muzycy grają ten sam utwór muzyczny. Sędziowie z góry ustalili, na ile liczą się czynniki, takie jak wyczucie czasu, ekspresja i muzykalność. Każdy muzyk wybiera inny utwór muzyczny do grania. Sędziowie wybierają muzyka, który najbardziej im się podoba. Jeden sędzia przyznaje dodatkowe punkty muzykom, którzy noszą kostiumy.

Historia

Chiny

Najwcześniejsze dowody standaryzowanych testów miały miejsce w Chinach , za panowania dynastii Han, gdzie cesarskie egzaminy obejmowały sześć sztuk, które obejmowały muzykę, łucznictwo, jeździectwo, arytmetykę, pisanie oraz znajomość rytuałów i ceremonii zarówno publicznych, jak i prywatnych. Egzaminy te służyły do ​​selekcji pracowników do państwowej biurokracji.

Później do testów dodano sekcje dotyczące strategii wojskowych, prawa cywilnego, dochodów i podatków, rolnictwa i geografii. W tej formie egzaminy były zinstytucjonalizowane przez ponad tysiąc lat.

Obecnie standaryzowane testowanie pozostaje szeroko stosowane, najbardziej znane w systemie Gaokao .

Wielka Brytania

Standaryzowane testy została wprowadzona do Europy na początku 19 wieku, na wzór chińskiego mandaryna badań, poprzez rzecznictwo brytyjskich administratorów kolonialnych, najbardziej „trwałe”, którego był konsul brytyjski w Guangzhou , Chiny , Thomas Taylor Meadows. Meadows ostrzegł przed upadkiem Imperium Brytyjskiego, jeśli standardowe testy nie zostaną natychmiast wdrożone w całym imperium.

Przed ich przyjęciem standaryzowane testy nie były tradycyjnie częścią zachodniej pedagogiki. Opierając się na sceptycznej i otwartej tradycji debaty odziedziczonej po starożytnej Grecji, zachodnie środowiska akademickie preferowały niestandardowe metody oceniania przy użyciu esejów napisanych przez studentów. Z tego powodu pierwsze europejskie wdrożenie standaryzowanych testów nie miało miejsca w samej Europie, ale w Indiach Brytyjskich . Zainspirowani chińskim stosowaniem standaryzowanych testów, na początku XIX wieku brytyjscy „kierownicy firm zatrudniali i awansowali pracowników na podstawie egzaminów konkursowych, aby zapobiegać korupcji i faworyzowaniu”. Ta praktyka standaryzowanych testów została później przyjęta pod koniec XIX wieku przez Brytyjczyków na kontynencie. W debatach parlamentarnych, które się wywiązały, pojawiło się wiele odniesień do „chińskiego systemu mandaryńskiego”.

To właśnie z Wielkiej Brytanii standardowe testy rozprzestrzeniły się nie tylko w całej Wspólnocie Brytyjskiej , ale także w Europie, a następnie w Ameryce. Jego rozprzestrzenianie się było napędzane przez rewolucję przemysłową . Wzrost liczby uczniów w czasie rewolucji przemysłowej i po niej , w wyniku przepisów o obowiązkowym szkolnictwie , zmniejszył stosowanie oceniania otwartego, które było trudniejsze do masowej produkcji i oceny obiektywnej ze względu na swój z natury subiektywny charakter.

Mężczyzna sortuje małe przedmioty na drewnianej tacy
Brytyjscy żołnierze przeszli standardowe testy podczas II wojny światowej. Ten nowy rekrut sortuje części mechaniczne, aby sprawdzić swoją wiedzę na temat maszyn. Na jego mundurze nie widać nazwiska, rangi ani innego znaku, który mógłby wpływać na ocenę jego pracy.

Ujednolicone testy, takie jak War Office Selection Boards, zostały opracowane dla armii brytyjskiej podczas II wojny światowej, aby wybrać kandydatów do szkolenia oficerów i innych zadań. Testy dotyczyły zdolności umysłowych żołnierzy, umiejętności mechanicznych, zdolności do pracy z innymi i innych cech. Poprzednie metody były stronnicze i skutkowały doborem niewłaściwych żołnierzy do szkolenia oficerów.

Stany Zjednoczone

Standaryzowane testy są częścią amerykańskiej edukacji od XIX wieku, ale powszechne poleganie na standaryzowanych testach w szkołach w Stanach Zjednoczonych jest w dużej mierze fenomenem XX wieku.

Imigracja w połowie XIX wieku przyczyniła się do rozwoju standaryzowanych testów w Stanach Zjednoczonych. Standaryzowane testy były stosowane, gdy ludzie po raz pierwszy przybyli do USA, aby przetestować role społeczne i znaleźć siłę i status społeczny.

College Entrance Examination Board nie oferują standardowych testów dla uniwersytetu i dopuszczenia kolegium aż 1900. Ich pierwsze badania podawano w 1901 roku, w dziewięciu przedmiotów. Ten test został wdrożony z myślą o stworzeniu standaryzowanych przyjęć dla Stanów Zjednoczonych na północno-wschodnich elitarnych uniwersytetach. Pierwotnie test był przeznaczony również dla najlepszych szkół z internatem , w celu ujednolicenia programu nauczania. Pierwotnie standaryzowany test składał się z esejów i nie był przeznaczony do szeroko zakrojonych testów.

Podczas I wojny światowej The Army Alpha i Beta testy zostały opracowane, aby pomóc miejsce nowych rekrutów w odpowiednich zadań w oparciu o ich ocenianych poziomach inteligencji. Pierwsza edycja nowoczesnego znormalizowanego testu na IQ , Stanforda-Binet Intelligence Test , pojawiła się w 1916. College Board następnie zaprojektował SAT (Scholar Aptitude Test) w 1926. Pierwszy test SAT był oparty na testach Army IQ, z cel, jakim jest określenie inteligencji osoby badanej, umiejętności rozwiązywania problemów i krytycznego myślenia . W 1959 roku Everett Lindquist po raz pierwszy zaoferował ACT (American College Testing). Od 2020 r. ACT zawiera cztery główne sekcje z pytaniami wielokrotnego wyboru do testowania języka angielskiego, matematyki, czytania i nauk ścisłych, a także opcjonalną sekcję pisania.

Poszczególne stany rozpoczęły testowanie dużej liczby dzieci i nastolatków w systemach szkół publicznych w latach siedemdziesiątych. W latach 80. szkoły amerykańskie oceniały na poziomie krajowym. W 2012 roku 45 stanów płaciło średnio 27 dolarów na studenta i 669 milionów dolarów ogółem za coroczne testy akademickie na dużą skalę. Jednak inne koszty, takie jak płacenie nauczycielom za przygotowanie uczniów do testów oraz za czas zajęć poświęcony na przeprowadzanie testów, znacznie przewyższają koszt samego testu.

Konieczność dokonania przez rząd federalny miarodajnych porównań w wysoce zdecentralizowanym (lokalnie kontrolowanym) systemie edukacji publicznej zachęciła do stosowania standaryzowanych testów na dużą skalę. Act of 1965 Elementary i Secondary Education wymaga trochę standardowych testów w szkołach publicznych. Ustawa No Child Left Behind z 2001 roku powiązała niektóre rodzaje finansowania szkół publicznych z wynikami standaryzowanych testów.

Celem No Child Left Behind była poprawa systemu edukacji w Stanach Zjednoczonych poprzez rozliczanie szkół i nauczycieli z osiągnięć uczniów, w tym różnic w osiągnięciach edukacyjnych między dziećmi z mniejszości i dzieci spoza mniejszości w szkołach publicznych . Dodatkowym czynnikiem w amerykańskim systemie edukacji jest pochodzenie społeczno-ekonomiczne badanych uczniów. Według National Center for Children in Poverty 41 procent dzieci poniżej 18 roku życia pochodzi z rodzin o niższych dochodach. Uczniowie ci wymagają specjalnej uwagi, aby dobrze radzić sobie w szkole i na standardowych testach.

Zgodnie z tymi przepisami federalnymi program szkolny nadal był ustalany przez każdy stan, ale rząd federalny wymagał od stanów oceny, jak dobrze szkoły i nauczyciele uczą wybranego przez stan materiału za pomocą standardowych testów. Wyniki uczniów uzyskane w standardowych testach na dużą skalę zostały wykorzystane do przydzielania funduszy i innych zasobów szkołom oraz do zamykania szkół o słabych wynikach. Ustawa Every Student Succeeds Act zastąpiła NCLB pod koniec 2015 r. Do tego czasu te standaryzowane testy na dużą skalę stały się kontrowersyjne w Stanach Zjednoczonych, ponieważ były to testy wysokiej stawki dla systemów szkolnych i nauczycieli.

Australia

Australijski Narodowy Program Oceny – Umiejętność czytania i liczenia (NAPLAN) standaryzowane testy zostały zapoczątkowane w 2008 roku przez Australian Curriculum, Assessment and Reporting Authority, niezależny organ „odpowiedzialny za opracowanie krajowego programu nauczania, krajowy program oceniania i ogólnokrajowe zbieranie danych oraz program raportowania, który wspiera naukę XXI wieku dla wszystkich australijskich uczniów”.

Test obejmuje wszystkich uczniów klas 3, 5, 7 i 9 w australijskich szkołach, którzy mają być oceniani za pomocą testów ogólnokrajowych. Tematy objęte tymi testami obejmują czytanie, pisanie, konwencje językowe (pisownia, gramatyka i interpunkcja) oraz liczenia.

Program przedstawia raporty na poziomie uczniów, które mają umożliwić rodzicom obserwowanie postępów ich dziecka w trakcie ich życia szkolnego i pomóc nauczycielom poprawić indywidualne możliwości uczenia się swoich uczniów. Uczniowie i dane na poziomie szkoły są również przekazywane do odpowiedniego systemu szkolnego przy założeniu, że można je wykorzystać w celu ukierunkowania konkretnego wsparcia i zasobów do szkół, które najbardziej ich potrzebują. Nauczyciele i szkoły wykorzystują te informacje w połączeniu z innymi informacjami, aby określić, jak dobrze radzą sobie ich uczniowie i zidentyfikować obszary wymagające pomocy.

Koncepcja sprawdzania osiągnięć uczniów nie jest nowa, chociaż można powiedzieć, że obecne podejście australijskie ma swoje korzenie w obecnych strukturach polityki edukacyjnej zarówno w USA, jak iw Wielkiej Brytanii. Istnieje kilka kluczowych różnic między australijską strategią NAPLAN a strategią z Wielkiej Brytanii i USA. Szkoły, które osiągają słabe wyniki w kontekście australijskim, otrzymają pomoc finansową w ramach obecnej polityki rządu federalnego.

Kolumbia

W 1968 powstał Kolumbijski Instytut Oceny Edukacji - ICFES, który miał regulować szkolnictwo wyższe. Wdrożony został dotychczasowy system oceny publicznej w zakresie autoryzacji działalności i prawnego uznania instytucji i programów uczelni.

Kolumbia ma kilka standardowych testów, które oceniają poziom edukacji w kraju. Egzaminy te są przeprowadzane przez ICFES.

Uczniowie klasy trzeciej, piątej i dziewiątej przystępują do egzaminu „Sabre 3°5°9°”. Test ten jest obecnie prezentowany na komputerze w próbkach kontrolowanych i spisowych.

Po skończeniu liceum uczniowie prezentują „Szablę 11”, która umożliwia im wejście na różne uczelnie w kraju. Uczniowie studiujący w domu mogą przystąpić do tego egzaminu, aby ukończyć szkołę średnią i uzyskać dyplom i dyplom.

Studenci opuszczający uczelnię muszą przystąpić do egzaminu „Sabre Pro”.

Kanada

Kanada pozostawia edukację, a w rezultacie standaryzowane testy, pod jurysdykcją prowincji. Każda prowincja ma własny, obejmujący całą prowincję, ustandaryzowany system egzaminacyjny, od niewymaganych ustandaryzowanych testów dla uczniów w Ontario po egzaminy warte 50% ocen końcowych w szkole średniej w Nowej Fundlandii i Labradorze.

Projekt i punktacja

Projekt

Najczęściej główny test akademicki obejmuje sekcje oceniane zarówno przez ludzi, jak i komputerowo.

Standardowy test może składać się z pytań wielokrotnego wyboru, pytań typu prawda-fałsz, pytań opisowych, ocen autentycznych lub prawie każdej innej formy oceny. Pozycje wielokrotnego wyboru i prawda-fałsz są często wybierane do testów, które są wykonywane przez tysiące osób, ponieważ można je wydać i ocenić niedrogo, szybko i niezawodnie za pomocą specjalnych arkuszy odpowiedzi, które można odczytać na komputerze lub za pomocą adaptacji komputerowej testowanie . Niektóre standaryzowane testy zawierają krótkie odpowiedzi lub elementy pisania esejów, które są oceniane przez niezależnych ewaluatorów, którzy wykorzystują rubryki (zasady lub wytyczne) i prace porównawcze (przykłady artykułów dla każdego możliwego wyniku) w celu określenia oceny, jaka zostanie przyznana za odpowiedź.

Dowolny temat

Pusty formularz z wieloma polami wyboru
Formularz oceny do egzaminów na prawo jazdy w Wielkiej Brytanii. Każda osoba, która chce mieć prawo jazdy, przechodzi ten sam test i otrzymuje taką samą punktację.

Nie wszystkie standaryzowane testy wymagają odpowiedzi na pytania. Autentyczna ocena umiejętności sportowych może przybrać formę biegania przez określony czas lub dryblingu piłki na określonym dystansie. Pracownicy służby zdrowia muszą przejść testy potwierdzające, że potrafią wykonywać zabiegi medyczne. Kandydaci na prawa jazdy muszą zdać ustandaryzowany test pokazujący, że potrafią prowadzić samochód. Standardowego badania kanadyjskie zdatności został wykorzystany w badaniach medycznych w celu ustalenia, w jaki sposób fizycznie zmieścić testu są chętnych.

Punktacja maszyn i ludzi

Niektóre standaryzowane testy wykorzystują testy wielokrotnego wyboru, które są stosunkowo niedrogie w ocenie, ale można zastosować dowolną formę oceny.

Od drugiej połowy XX wieku standaryzowane testy na dużą skalę zostały ukształtowane częściowo przez łatwość i niski koszt komputerowej oceny testów wielokrotnego wyboru. Większość ocen krajowych i międzynarodowych nie jest w pełni oceniana przez ludzi.

Ludzie są przyzwyczajeni do oceniania elementów, których nie można łatwo ocenić komputerowo (takich jak eseje). Na przykład Graduate Record Exam to egzamin z adaptacją komputera, który nie wymaga punktacji od innych osób, z wyjątkiem części pisemnej.

Ocena ludzi jest stosunkowo droga i często zmienna, dlatego jeśli to możliwe, preferowana jest ocena komputerowa. Na przykład niektórzy krytycy twierdzą, że słabo opłacani pracownicy źle ocenią testy. Porozumienie między punktami może wahać się od 60 do 85 procent, w zależności od testu i sesji punktacji. W przypadku egzaminów na dużą skalę w szkołach niektórzy egzaminatorzy płacą za to, aby dwóch lub więcej oceniających przeczytało każdy artykuł; jeśli ich wyniki się nie zgadzają, kartka jest przekazywana dodatkowym sekretarzom.

Chociaż proces ten jest trudniejszy niż elektroniczne ocenianie testów wielokrotnego wyboru, eseje można również oceniać komputerowo. W innych przypadkach eseje i inne otwarte odpowiedzi są oceniane zgodnie z wcześniej ustaloną rubryką oceny przez przeszkolonych oceniających. Na przykład w Pearson wszyscy oceniający eseje mają czteroletnie stopnie naukowe, a większość z nich to obecni lub byli nauczyciele klas.

Używanie rubryk dla uczciwości

Korzystanie z rubryk ma na celu zwiększenie uczciwości podczas oceniania wyników ucznia. W standaryzowanych testach błąd pomiaru (spójny wzorzec błędów i błędów systematycznych w ocenie testu) jest łatwy do ustalenia w standaryzowanych testach. W ocenie niestandardowej oceniający mają więcej indywidualnej swobody, a zatem są bardziej skłonni do uzyskiwania niesprawiedliwych wyników poprzez nieświadome uprzedzenia . Gdy wynik zależy od indywidualnych preferencji oceniających, to wynik, jaki otrzyma uczeń, zależy od tego, kto oceni test. Standaryzowane testy usuwają również stronniczość nauczycieli w ocenie. Badania pokazują, że nauczyciele tworzą rodzaj samospełniającej się przepowiedni w swojej ocenie uczniów, przyznając tym, których spodziewają się osiągnąć z wyższymi wynikami, a tym, którym spodziewają się niepowodzenia, niższe oceny.

Przykładowa punktacja dla otwartego pytania historycznego: Co spowodowało II wojnę światową ?
Odpowiedzi uczniów Klasyfikacja standaryzowana Ocena niestandardowa
Klasyfikacji Rubryki : Odpowiedzi muszą być oznakowane poprawne, jeśli wspomnieć przynajmniej jedną z następujących czynności: niemiecką inwazję Polski, Japonii inwazji Chin lub kwestie ekonomiczne. Brak standardów oceniania. Każdy nauczyciel ocenia tak, jak chce, biorąc pod uwagę wybrane przez niego czynniki, takie jak odpowiedź, nakład pracy, wykształcenie ucznia, umiejętności językowe lub nastawienie.
Student #1: II wojna światowa została wywołana przez Hitlera i Niemcy najeżdżające Polskę.

Nauczyciel 1: Ta odpowiedź wymienia jeden z wymaganych elementów, więc jest poprawna.
Nauczyciel #2: Ta odpowiedź jest prawidłowa.

Nauczyciel 1: Czuję, że ta odpowiedź jest wystarczająco dobra, więc zaznaczę ją jako poprawną.
Nauczyciel #2: Ta odpowiedź jest prawidłowa, ale ten dobry uczeń powinien być w stanie zrobić coś lepszego, więc dam tylko częściowe uznanie.

Student #2: II wojna światowa była spowodowana wieloma czynnikami, w tym Wielkim Kryzysem i ogólną sytuacją gospodarczą, wzrostem narodowego socjalizmu, faszyzmu i imperialistycznego ekspansjonizmu oraz nierozwiązanymi resentymentami związanymi z I Wojną Światową. Wojna w Europie rozpoczęła się wraz z najazdem Niemców na Polskę.

Nauczyciel 1: Ta odpowiedź wymienia jeden z wymaganych elementów, więc jest poprawna.
Nauczyciel #2: Ta odpowiedź jest prawidłowa.

Nauczyciel 1: Czuję, że ta odpowiedź jest poprawna i kompletna, więc podam pełne uznanie.
Nauczyciel #2: Ta odpowiedź jest prawidłowa, więc dam pełną liczbę punktów.

Student #3: II wojna światowa została spowodowana zabójstwem arcyksięcia Ferdynanda.

Nauczyciel 1: Ta odpowiedź nie wymienia żadnego z wymaganych elementów. Brak punktów.
Nauczyciel #2: Ta odpowiedź jest błędna. Brak kredytu.

Nauczyciel 1: Ta odpowiedź jest błędna. Brak punktów.
Nauczyciel #2: Ta odpowiedź jest błędna, ale ten uczeń bardzo się starał i zdanie jest poprawne gramatycznie, więc dam jeden punkt za wysiłek.

Wykorzystanie wyników do porównań

Istnieją dwa rodzaje interpretacji wyników standaryzowanych testów : interpretacja wyniku w oparciu o normy lub interpretacja wyniku w oparciu o kryteria .

  • Interpretacje wyników oparte na normach porównują osoby przystępujące do testu z próbą rówieśników . Celem jest uszeregowanie uczniów jako lepszych lub gorszych od innych uczniów. Interpretacje wyników testów w oparciu o normy są związane z tradycyjną edukacją . Uczniowie, którzy radzą sobie lepiej niż inni, zdają test, a uczniowie, którzy radzą sobie gorzej niż inni, nie zdają testu.
  • Interpretacje wyników oparte na kryteriach porównują zdających do kryterium (formalna definicja treści), niezależnie od wyników innych osób zdających. Można je również opisać jako oceny oparte na standardach , ponieważ są one zgodne z ruchem reformy edukacji opartej na standardach . Interpretacje punktacji w oparciu o kryteria dotyczą wyłącznie tego, czy odpowiedź tego konkretnego ucznia jest poprawna i kompletna. W systemach opartych na kryteriach możliwe jest, aby wszyscy uczniowie zdali test lub wszyscy uczniowie nie zdali testu.

Każdy z tych systemów może być używany w standaryzowanych testach. Dla standaryzowanych testów ważne jest to, czy wszystkim uczniom zadaje się równoważne pytania, w takich samych okolicznościach i otrzymuje jednakową ocenę. W teście standaryzowanym, jeśli dana odpowiedź jest poprawna dla jednego ucznia, jest poprawna dla wszystkich uczniów. Oceniający nie akceptują odpowiedzi jako wystarczająco dobrej dla jednego ucznia, ale odrzucają tę samą odpowiedź jako nieodpowiednią dla innego ucznia.

Termin ocena normatywna odnosi się do procesu porównywania jednego zdającego do jego rówieśników. Badanie Norma odnośnikami (NRT) to rodzaj próby, oceny , czy ocenie co daje przybliżoną pozycję badanego osobnika w określonym populacji. Szacunek pochodzi z analizy wyników testów i innych istotnych danych z próbki pobranej z populacji. Ten rodzaj testu określa, czy osoba badana wypadła lepiej czy gorzej niż inni uczniowie biorący udział w tym teście. Test oparty na kryteriach (CRT) to rodzaj testu, który wykorzystuje wyniki testu, aby pokazać, czy uczestnicy testu dobrze wykonali dane zadanie, a nie jak dobrze wykonali w porównaniu z innymi uczestnikami testu. Większość testów i quizów napisanych przez nauczycieli szkolnych to testy oparte na kryteriach. W tym przypadku celem jest po prostu sprawdzenie, czy uczeń potrafi poprawnie odpowiedzieć na pytania. Nauczyciel zwykle nie próbuje porównywać wyników każdego ucznia z innymi uczniami.

To sprawia, że ​​standaryzowane testy są przydatne do celów rekrutacyjnych w szkolnictwie wyższym, gdzie szkoła próbuje porównać uczniów z całego kraju lub z całego świata. Przykłady takich międzynarodowych testów porównawczych obejmują badanie Trends in International Mathematics and Science ( TIMMS ) oraz Progress in International Reading Literacy Study ( PIRLS ). Spekuluje się, że wyniki tych egzaminów zmienią się w oparciu o sposób, w jaki standardy, takie jak Common Core State Standards (CCSS), są zgodne z najlepszymi krajami na całym świecie.

Ponieważ wyniki można porównywać w różnych szkołach, wyniki ogólnokrajowego standaryzowanego testu można wykorzystać do określenia obszarów wymagających poprawy. Testy, które zdają wszyscy, mogą pomóc rządowi określić, które szkoły i którzy uczniowie mają największe trudności. Dzięki tym informacjom mogą wdrażać rozwiązania, które rozwiążą problem, umożliwiając uczniom naukę i rozwój w środowisku akademickim.

Normy

Rozważania dotyczące trafności i rzetelności są zazwyczaj postrzegane jako zasadnicze elementy określające jakość każdego standaryzowanego testu. Jednak stowarzyszenia zawodowe i praktyków często umieszczały te obawy w szerszym kontekście podczas opracowywania standardów i dokonywania ogólnych osądów na temat jakości każdego standaryzowanego testu jako całości w danym kontekście.

Standardy oceny

W dziedzinie ewaluacji , aw szczególności ewaluacji edukacyjnej , Wspólny Komitet ds. Standardów Ewaluacji Edukacyjnej opublikował trzy zestawy standardów ewaluacji. Standardy oceny personelu zostały opublikowane w 1988 r., Standardy oceny programu (wydanie drugie) zostały opublikowane w 1994 r., a Standardy oceny uczniów zostały opublikowane w 2003 r.

Każda publikacja przedstawia i opracowuje zestaw standardów do wykorzystania w różnych sytuacjach edukacyjnych. Standardy zawierają wytyczne dotyczące projektowania, wdrażania, oceny i doskonalenia zidentyfikowanej formy ewaluacji. Każdy ze standardów został umieszczony w jednej z czterech podstawowych kategorii, aby promować prawidłowe, użyteczne, wykonalne i dokładne oceny edukacyjne. W tych zestawach standardów kwestie dotyczące ważności i niezawodności są omówione w temacie dotyczącym dokładności. Testy mają jednak na celu zapewnienie, że oceny uczniów dostarczą rzetelnych, dokładnych i wiarygodnych informacji o nauce i wynikach uczniów; standaryzowane testy dostarczają zawężonych informacji na temat wielu form inteligencji, a poleganie na nich szkodzi uczniom, ponieważ niedokładnie mierzą potencjał ucznia do sukcesu.

Standardy testowania

W dziedzinie psychometrii , że Standardy edukacyjne i testów psychologicznych miejsce standardów dotyczących prawdziwości i rzetelności, wraz z błędów pomiaru i zagadnień związanych z zakwaterowania osób z niepełnosprawnością . Trzeci i ostatni główny temat obejmuje standardy związane z testowaniem aplikacji, uwierzytelnianiem oraz testowaniem w ocenie programów i polityce publicznej .

Ważność statystyczna

Jedną z głównych zalet standaryzowanych testów jest to, że wyniki mogą być udokumentowane empirycznie; dlatego można wykazać, że wyniki testu mają względny stopień trafności i rzetelności , a także wyniki, które można uogólnić i powtórzyć. Często kontrastuje to z ocenami ze szkolnego wykazu, które są przydzielane przez poszczególnych nauczycieli. Wyjaśnienie różnic w kulturze edukacyjnej w różnych szkołach, trudności programu nauczania danego nauczyciela, różnic w stylu nauczania oraz technikach i uprzedzeniach wpływających na ocenianie może być trudne.

Kolejną zaletą jest agregacja. Dobrze zaprojektowany, standaryzowany test zapewnia ocenę opanowania danej dziedziny wiedzy lub umiejętności, która na pewnym poziomie agregacji dostarczy przydatnych informacji. Oznacza to, że podczas gdy indywidualne oceny mogą nie być wystarczająco dokładne dla celów praktycznych, średnie wyniki klas, szkół, oddziałów firmy lub innych grup mogą dostarczyć przydatnych informacji ze względu na redukcję błędów uzyskiwanych dzięki zwiększeniu wielkości próby.

Zdający

Sami uczniowie krytykują, że testy, chociaż ustandaryzowane, są niesprawiedliwe w stosunku do poszczególnych uczniów. Niektórzy uczniowie są „złymi testerami”, co oznacza, że ​​denerwują się i nie skupiają się na testach. Dlatego też, chociaż test jest standardowy i powinien dawać uczciwe wyniki, zdający są w niekorzystnej sytuacji, ale nie mają możliwości udowodnienia swojej wiedzy w inny sposób, ponieważ nie ma innej alternatywy testowania, która pozwoliłaby uczniom udowodnić swoją wiedzę i umiejętności rozwiązywania problemów .

Niektórzy uczniowie cierpią na lęk przed testem . Lęk przed testem dotyczy również testów standaryzowanych, w których uczniowie, którzy mogą nie odczuwać lęku przed testem, regularnie odczuwają ogromną presję, aby wykonać zadanie, gdy stawka jest tak wysoka. Standaryzowane testy wysokiej stawki obejmują egzaminy takie jak SAT, PARCC i ACT, gdzie dobre wyniki są wymagane do zaliczenia klasy lub przyjęcia na studia.

Coroczne standaryzowane testy w szkole

Standardowe testy to bardzo powszechny sposób określania przeszłych osiągnięć w nauce i przyszłego potencjału ucznia. Jednak testy wysokiej stawki (wystandaryzowane lub niestandaryzowane) mogą powodować niepokój. Kiedy nauczyciele lub szkoły są nagradzani za lepsze wyniki w testach, nagrody te zachęcają nauczycieli do „ uczenia do testu ” zamiast zapewniania bogatego i szerokiego programu nauczania. W 2007 roku badanie jakościowe przeprowadzone przez Au Wayne'a wykazało, że standaryzowane testowanie zawęża program nauczania i zachęca do nauczania skoncentrowanego na nauczycielu zamiast uczenia się skoncentrowanego na uczniu .

Pomimo ich powszechnego stosowania, ważność, jakość lub stosowanie testów, zwłaszcza corocznych standaryzowanych testów w edukacji, nadal cieszy się szerokim poparciem lub krytyką. Podobnie jak same testy, wsparcie i krytyka testów są często zróżnicowane i mogą pochodzić z różnych źródeł, takich jak rodzice, osoby testujące, instruktorzy, grupy biznesowe, uniwersytety lub rządowe organy nadzorcze.

Zwolennicy standaryzowanych testów na dużą skalę w edukacji często podają następujące powody promowania testów w edukacji:

  • Informacja zwrotna lub diagnoza wyników osoby badanej
  • Uczciwie i wydajnie
  • Promuje odpowiedzialność
  • Przewidywanie i selekcja
  • Poprawia wydajność

Krytycy standaryzowanych testów w edukacji często podają następujące powody zmiany lub usunięcia standaryzowanych testów w edukacji:

  • Zawęża program nauczania i zachęca do nauczania do testu .
  • Słaba jakość predykcyjna.
  • Stopniowe zwiększanie wyników testów lub ocen.
  • Stronniczy kulturowo lub społeczno-ekonomicznie.
  • Szkodliwe psychicznie.
  • Słaby wskaźnik inteligencji lub zdolności.

Wpływ na szkoły

Poprzednia ustandaryzowana praca testowa wykorzystująca pytania wielokrotnego wyboru i odpowiadająca na nie w formie pokazanej powyżej.

Standaryzowane testy są wykorzystywane jako strategia polityki publicznej w celu ustanowienia silniejszych środków odpowiedzialności za edukację publiczną . Chociaż National Assessment of Education Progress (NAEP) służy jako barometr edukacyjny od około trzydziestu lat, regularnie przeprowadzając standaryzowane testy w losowych szkołach w całych Stanach Zjednoczonych, wysiłki podejmowane w ciągu ostatniej dekady na poziomie stanowym i federalnym nakazywały coroczne znormalizowana administracja testami dla wszystkich szkół publicznych w całym kraju.

Ideą ruchu polityki standaryzowanych testów jest to, że testowanie jest pierwszym krokiem do poprawy szkół, praktyki nauczania i metod edukacyjnych poprzez zbieranie danych. Zwolennicy argumentują, że dane generowane przez standardowe testy działają jak karta raportu dla społeczności, pokazując, jak dobrze radzą sobie lokalne szkoły. Krytycy tego ruchu wskazują jednak na różne rozbieżności, które wynikają ze znormalizowanych praktyk testowych w obecnym stanie, w tym problemy z trafnością i rzetelnością testów oraz fałszywymi korelacjami (patrz paradoks Simpsona ).

Oprócz administrowania i oceniania samych testów, w niektórych przypadkach nauczyciele są oceniani na podstawie tego, jak dobrze ich uczniowie radzą sobie z testami. Nauczyciele są pod presją ciągłego podnoszenia wyników, aby udowodnić, że są godni utrzymania swojej pracy. Takie podejście zostało skrytykowane, ponieważ istnieje wiele czynników zewnętrznych, takich jak przemoc domowa, głód i bezdomność wśród uczniów, które wpływają na wyniki uczniów.

Wynagrodzenie oparte na wynikach to idea, że ​​nauczyciele powinni otrzymywać więcej, jeśli uczniowie radzą sobie dobrze na testach, a mniej, jeśli uczniowie radzą sobie słabo. Gubernator New Jersey, Chris Christie, zaproponował reformę edukacyjną w New Jersey, która wywiera presję na nauczycieli, aby nie tylko „uczyli do testu”, ale także aby ich uczniowie występowali kosztem ich pensji i bezpieczeństwa pracy. Reforma wzywała do wynagrodzenia zależnego od wyników, które zależy od wyników uczniów na standardowych testach i ich osiągnięć edukacyjnych.

Szkoły, które uzyskały słabe wyniki, kończą się zamykaniem lub redukcją, co daje bezpośredni wpływ na administrację, która prowadzi do niebezpiecznych taktyk, takich jak zastraszanie, oszukiwanie i drążenie informacji w celu podniesienia wyników.

Bezkrytyczne stosowanie standaryzowanych wyników testów do oceny wyników nauczyciela i szkoły jest niewłaściwe, ponieważ na wyniki uczniów wpływają trzy rzeczy: to, czego uczniowie uczą się w szkole, czego uczniowie uczą się poza szkołą oraz wrodzona inteligencja uczniów . Szkoła ma kontrolę tylko nad jednym z tych trzech czynników. Zaproponowano modelowanie wartości dodanej, aby poradzić sobie z tą krytyką poprzez statystyczną kontrolę wrodzonych zdolności i pozaszkolnych czynników kontekstowych. W systemie wartości dodanej interpretowania wyników testów analitycy szacują oczekiwany wynik dla każdego ucznia na podstawie takich czynników, jak jego poprzednie wyniki testów, język podstawowy lub status społeczno-ekonomiczny. Zakłada się, że różnica między oczekiwanym wynikiem ucznia a wynikiem rzeczywistym wynika głównie z wysiłków nauczyciela.

Wpływający na to, co jest nauczane

  • Oferuje wskazówki dla nauczycieli. Standaryzowane testy pozwolą nauczycielom zobaczyć, jak ich uczniowie radzą sobie w porównaniu z innymi w kraju. Pomoże im to w razie potrzeby zrewidować metody nauczania, aby pomóc uczniom w spełnieniu standardów.
  • Pozwala uczniom zobaczyć własne postępy. Uczniowie będą mieli możliwość zastanowienia się nad swoimi wynikami i zobaczenia, gdzie są ich mocne i słabe strony.
  • Podaj rodzicom informacje o ich dziecku. Wyniki mogą pozwolić rodzicom zorientować się, jak ich dziecko radzi sobie w nauce w porównaniu z innymi osobami w tym samym wieku w kraju.

Krytycy zarzucają również, że standaryzowane testy zachęcają do „ uczenia do testu ” kosztem kreatywności i dogłębnego omówienia tematów, których nie ma na teście. Testy wielokrotnego wyboru są krytykowane za brak oceny umiejętności, takich jak pisanie. Co więcej, sukces ucznia jest przypisywany relatywnym wynikom nauczyciela, co sprawia, że ​​awans nauczyciela jest uzależniony od sukcesu nauczyciela i wyników w nauce ucznia. Pytania etyczne i ekonomiczne nasuwają się nauczycielom, gdy mają do czynienia z wyraźnie słabymi lub słabo wykwalifikowanymi uczniami i ustandaryzowanym testem.

Krytycy twierdzą, że nadużywanie i niewłaściwe używanie tych testów szkodzi nauczaniu i uczeniu się poprzez zawężanie programu nauczania. Według grupy FairTest , gdy standaryzowane testy są głównym czynnikiem odpowiedzialności, szkoły wykorzystują testy do wąskiego zdefiniowania programu nauczania i ukierunkowania nauczania. Odpowiedzialność stwarza ogromną presję na wykonanie, a to może prowadzić do niewłaściwego użycia i błędnej interpretacji standardowych testów.

Krytycy twierdzą, że „ uczenie na próbę ” nie sprzyja uczeniu się wyższego rzędu; zmienia to, czego nauczyciele mogą uczyć i znacznie ogranicza ilość innych informacji, których uczniowie uczą się przez lata. Chociaż możliwe jest zastosowanie standaryzowanego testu, nie pozwalając, aby jego zawartość determinowała program nauczania i instrukcje, często to, czego nie testuje się, nie jest nauczane, a sposób, w jaki testowany jest przedmiot, często staje się wzorem do nauczania tego przedmiotu.

Krytycy sprzeciwiają się również rodzajowi materiałów, które są zwykle testowane przez szkoły. Chociaż istnieją standaryzowane testy dla atrybutów nieakademickich, takie jak Test Torrance of Creative Thinking , szkoły rzadko przeprowadzają standaryzowane testy mierzące inicjatywę, kreatywność, wyobraźnię, ciekawość, dobrą wolę, refleksję etyczną lub wiele innych cennych dyspozycji i atrybutów. Zamiast tego testy wystawiane przez szkoły koncentrują się w mniejszym stopniu na rozwoju moralnym lub rozwoju charakteru, a bardziej na indywidualnych, możliwych do zidentyfikowania umiejętnościach akademickich.

W swojej książce, Now You See It , Cathy Davidson krytykuje standaryzowane testy. Naszą młodzież opisuje jako „dzieciaki z linii montażowej na modelu linii montażowej”, co oznacza wykorzystanie ustandaryzowanego testu jako części uniwersalnego modelu edukacyjnego. Krytykuje również zawężenie testowanych umiejętności i określanie dzieci bez tych umiejętności jako niepowodzeń lub uczniów niepełnosprawnych. Rozpowszechnione i zorganizowane oszustwo to rozwijająca się kultura.

Teoretyk edukacji Bill Ayers skomentował ograniczenia standardowego testu, pisząc, że „Standardowe testy nie mogą mierzyć inicjatywy, kreatywności, wyobraźni, myślenia koncepcyjnego, ciekawości, wysiłku, ironii, osądu, zaangażowania, niuansów, dobrej woli, refleksji etycznej, lub wiele innych cennych dyspozycji i atrybutów. Mogą mierzyć i liczyć izolowane umiejętności, określone fakty i funkcje, wiedzę merytoryczną, najmniej interesujące i najmniej znaczące aspekty uczenia się”. W swojej książce Wstyd Narodu , Jonathan Kozol twierdzi, że studenci przedłożone standardowych testów są ofiarami „dekapitacji poznawczej”. Kozol doszedł do tego po rozmowie z wieloma dziećmi w szkołach śródmiejskich, które nie pamiętają przestrzennie czasu, okresów i wydarzeń historycznych. Dzieje się tak zwłaszcza w szkołach, gdzie z powodu braku funduszy i surowej polityki odpowiedzialności, szkoły zrezygnowały z przedmiotów takich jak sztuka, historia i geografia; w celu skupienia się na konkursie obowiązkowych testów.

Istnieją trzy wskaźniki, według których mierzone są kraje o najlepszych wynikach w TIMMS („kraje A+”): skupienie, spójność i rygoryzm. Koncentracja jest zdefiniowana jako liczba tematów poruszanych w każdej klasie; chodzi o to, że im mniej tematów omawianych w każdej klasie, tym więcej uwagi można poświęcić każdemu tematowi. Definicja koherencji to trzymanie się sekwencji poruszanych tematów, która podąża za naturalnym postępem lub logiczną strukturą matematyki. CCSSM porównywano zarówno do obecnych norm krajowych i standardów państw A +. Biorąc pod uwagę większość tematów poruszanych średnio, obecne standardy państwowe miały najmniejszą wagę. Wspólne podstawowe standardy mają na celu naprawienie tej rozbieżności, pomagając nauczycielom skoncentrować się na tym, czego uczniowie muszą się nauczyć, zamiast rozpraszać się obcymi tematami. Zachęcają, aby materiały edukacyjne przechodziły od płytkiego omówienia szerokiego zakresu tematów do kilku tematów bardziej szczegółowo.

Czas i pieniądze

Testy standaryzowane to sposób na szeroko zakrojony pomiar poziomu wykształcenia uczniów i szkół. Od przedszkola do klasy 12, większość amerykańskich uczniów uczestniczy w corocznych standardowych testach. Przeciętny uczeń zdaje około 10 takich testów rocznie (np. jeden lub dwa testy rozumienia tekstu pisanego, jeden lub dwa testy z matematyki, test pisemny, test z przedmiotów ścisłych itp.). Średnia ilość egzaminów zajmuje około 2,3% całkowitego czasu zajęć (co odpowiada około czterem dniom szkolnym w roku).

Standardowe testy są drogie w administrowaniu. Doniesiono, że Stany Zjednoczone wydają na te testy około 1,7 miliarda dolarów rocznie. W 2001 roku poinformowano również, że tylko trzy firmy (Harcourt Educational Measurement, CTB McGraw-Hill i Riverside Publishing) opracowują 96% testów przeprowadzanych na poziomie stanowym.

Decyzje edukacyjne

Wyniki testów są w niektórych przypadkach wykorzystywane jako jedyne, obowiązkowe lub podstawowe kryterium przyjęć lub certyfikacji. Na przykład niektóre stany USA wymagają egzaminów maturalnych . Odpowiednie wyniki na tych egzaminach końcowych są wymagane do ukończenia szkoły średniej. Test General Educational Development to ustandaryzowany test, który jest często używany jako alternatywa dla matury w USA

Inne aplikacje obejmują śledzenie (decydowanie, czy student powinien zostać zapisany na „szybką” czy „wolną” wersję kursu) i przyznawanie stypendiów. W Stanach Zjednoczonych wiele kolegiów i uniwersytetów automatycznie przekłada wyniki z egzaminów Advanced Placement na punkty zaliczeniowe, spełnienie wymagań ukończenia studiów lub umieszczenie na bardziej zaawansowanych kursach. Testy uogólnione, takie jak SAT lub GRE, są częściej używane jako jeden z kilku mierników przy podejmowaniu decyzji o przyjęciu. Niektóre instytucje publiczne mają punkty odcięcia dla SAT, GPA lub rangi klasy do tworzenia klas kandydatów do automatycznego zaakceptowania lub odrzucenia.

Duże poleganie na standaryzowanych testach przy podejmowaniu decyzji jest często kontrowersyjne z powodów wymienionych powyżej. Krytycy często proponują położenie nacisku na miary kumulacyjne lub nawet nieliczbowe, takie jak oceny w klasie lub krótkie oceny indywidualne (pisane prozą) od nauczycieli. Zwolennicy twierdzą, że wyniki testów stanowią jasny, obiektywny standard, który służy jako cenna kontrola inflacji ocen .

Narodowa Akademia Nauk zaleca, aby główne decyzje edukacyjne nie opierały się wyłącznie na pojedynczym wyniku testu. Stosowanie minimalnych wyników cięć przy wejściu lub ukończeniu szkoły nie oznacza jednego standardu, ponieważ wyniki testu są prawie zawsze łączone z innymi minimalnymi kryteriami, takimi jak liczba punktów, kursy wstępne, frekwencja itp. Wyniki testu są często postrzegane jako „ jedyne kryteria” tylko dlatego, że są najtrudniejsze lub automatycznie zakłada się spełnienie innych kryteriów. Jedynym wyjątkiem od tej reguły jest GED , który pozwolił wielu ludziom na uznanie ich umiejętności, mimo że nie spełniali tradycyjnych kryteriów.

Niektórzy nauczyciele twierdzą, że pojedynczy ustandaryzowany test mierzy jedynie aktualną wiedzę ucznia i nie odzwierciedla postępów uczniów od początku roku. Wynik stworzony przez osoby, które nie są częścią regularnych zajęć ucznia, ale przez profesjonalistów, którzy określają, co uczniowie powinni wiedzieć w różnym wieku. Ponadto nauczyciele zgadzają się, że najlepszym kreatorem testów i moderatorem są oni sami. Twierdzą, że są najbardziej świadomi umiejętności, zdolności i potrzeb uczniów, które pozwolą im poświęcić więcej czasu na przedmioty lub kontynuować regularny program nauczania.

Wpływ na uczniów znajdujących się w niekorzystnej sytuacji

Monty Neill, dyrektor National Center for Fair and Open Testing, twierdzi, że uczniom, którzy mówią po angielsku jako drugim językiem, niepełnosprawnym lub pochodzą z rodzin o niskich dochodach, nieproporcjonalnie odmawia się dyplomu ze względu na wynik testu. co jest niesprawiedliwe i szkodliwe. Na przykład pod koniec lat siedemdziesiątych, kiedy w Stanach Zjednoczonych rozpoczęły się egzaminy maturalne, w procesie sądowym stwierdzono, że wielu czarnoskórych uczniów nie miało sprawiedliwych możliwości w zakresie materiału, z którego zdali egzamin maturalny, ponieważ uczęszczali do szkół segregowanych przez prawo. „Interakcja niedofinansowanych szkół i testów najsilniej uderza w uczniów kolorowych”, jak twierdzi Neill, „Nieproporcjonalnie odmawia się im dyplomów lub awansów, a szkoły, do których uczęszczają, są tymi, które najprawdopodobniej radzą sobie słabo na testach i mierzą się z nimi. sankcje, takie jak restrukturyzacja”.

W czasopiśmie The Progressive Barbara Miner wyjaśnia wady standaryzowanych testów, analizując trzy różne książki. Jako współdyrektor Centrum Edukacji na Uniwersytecie Rice i profesor edukacji, Linda M. McNeil w swojej książce Sprzeczności reformy szkół: Koszty edukacyjne standaryzowanych testów pisze: „Standaryzacja edukacyjna szkodzi nauczaniu i uczeniu się, a w dłuższej perspektywie , reratyfikuje edukację według rasy i klasy”. McNeil uważa, że ​​reforma edukacji oparta na testach stawia wyższe standardy uczniom koloru. Według Minera, McNeil „pokazuje, jak reforma oparta na testach centralizuje władzę w rękach elity korporacyjnej i politycznej – co jest szczególnie przerażającym zjawiskiem w czasach rosnącego wpływu korporacji i konserwatystów na reformę edukacji”. Taka reforma oparta na testach osłabiła uczenie się, zwłaszcza w przypadku uczniów kolorowych.

FairTest twierdzi, że negatywne konsekwencje niewłaściwego użycia testów obejmują wypychanie uczniów ze szkoły, wyrzucanie nauczycieli z zawodu oraz podważanie zaangażowania uczniów i atmosfery w szkole.

Stosowanie standaryzowanych testów przy rekrutacjach na studia

Standardowe testy są weryfikowane przez uniwersytety w ramach aplikacji wraz z innymi dowodami potwierdzającymi, takimi jak oświadczenia osobiste , GPA i listy polecające . Nathan Kuncel, stypendysta szkolnictwa wyższego, zauważył, że podczas przyjmowania na studia, SAT, ACT i inne standardowe testy „pomagają przytłoczonym urzędnikom rekrutacyjnym podzielić ogromną liczbę kandydatów na pule w celu dalszej oceny. Wysokie wyniki nie gwarantują nigdzie przyjęcia, a niskie wyniki nie wykluczają tego, ale szkoły traktują testy poważnie”.

Badania pokazują, że testy przewidują więcej niż tylko oceny z pierwszego roku i poziom kursów, na które student może uczęszczać. Badania podłużne przeprowadzone przez naukowców wynika, że uczniowie z wysokimi wynikami testów są bardziej skłonni do podejmowania trudnych drogę przez kolegium. Testy mogą również wskazywać wyniki studentów spoza uczelni, w tym oceny wydziałowe, osiągnięcia badawcze, uzyskane stopnie naukowe, wyniki na egzaminach kompleksowych i licencja zawodowa.

Ponieważ GPA różni się między szkołami, a nawet dla dwóch uczniów w tej samej szkole, bardziej przydatna jest wspólna miara wynikająca z wyniku testu.

Jednak w kwietniowej „metaanalizie” opublikowanej w „Journal of Educational and Psychological Measurement” z kwietnia 1995 roku Todd Morrison i Melanie Morrison przeanalizowali dwa tuziny badań trafności testu wymaganego, aby dostać się do niemal każdego programu studiów magisterskich lub doktoranckich w Ameryce: Egzamin rekordów (GRE). Badanie to objęło ponad 5000 osób testujących w ciągu ostatnich 30 lat. Autorzy stwierdzili, że wyniki GRE stanowiły zaledwie 6% różnic w ocenach na studiach podyplomowych. GRE wydaje się być „praktycznie bezużyteczny z punktu widzenia przewidywania”, napisali autorzy. Powtarzające się badania testu przyjęć do szkoły prawniczej (LSAT) potwierdzają to samo.

Trwa debata, czy test wskaże długoterminowy sukces w pracy iw życiu, ponieważ istnieje wiele innych czynników, ale podstawowe umiejętności, takie jak czytanie, pisanie i matematyka, są związane z wydajnością pracy.

Długofalowe badania przeprowadzone w 2007 r. wykazały, że ważne osiągnięcia życiowe, takie jak opublikowanie nowatorskiej lub opatentowanie technologii, są również powiązane z wynikami testów, nawet po uwzględnieniu możliwości edukacyjnych. Istnieje nawet pokaźny materiał dowodowy na to, że umiejętności te są powiązane ze skutecznym przywództwem i twórczymi osiągnięciami w pracy. Umiejętność czytania tekstów i rozumienia ich oraz posiadanie silnego rozumowania ilościowego są kluczowe we współczesnej gospodarce informacyjnej .

Wiele argumentów sugeruje, że umiejętności z testów są przydatne – ale tylko do pewnego stopnia.

Jednak w niezwykłym badaniu podłużnym opublikowanym w 2008 r. w czasopiśmie Psychological Science zbadano uczniów, którzy w wieku 13 lat zdobyli 1% najlepszych wyników w wieku 13 lat. Dwadzieścia lat później mieli średnio bardzo wysokie osiągnięcia, wysokie dochody, główne nagrody i osiągnięcia zawodowe, z których każdy rodzic byłby dumny.

Urzędnicy rekrutacyjni polegają na połączeniu materiałów aplikacyjnych , w tym listów polecających , wywiadów, esejów studenckich, GPA, testów i osobistych oświadczeń, aby kompleksowo ocenić ucznia. Jednak większość z tych narzędzi nie gwarantuje przyszłego sukcesu. Problemy z tradycyjnymi rozmowami kwalifikacyjnymi i listami polecającymi są tak wszechobecne, że wiele szkół poszukuje lepszych opcji.

Istnieje korelacja między wynikami testów a klasą społeczną, ale sukces w standardowych testach i na studiach nie zależy po prostu od klasy. Badania pokazują, że „testy były ważne nawet przy kontroli klasy społeczno-ekonomicznej. Bez względu na pochodzenie rodzinne, studenci z dobrymi wynikami testów i ocenami w szkole średniej radzą sobie lepiej na studiach niż studenci z niższymi wynikami i słabszymi transkrypcjami”.

Inną krytyką dotyczącą klasy społecznej i standaryzowanych testów jest to, że tylko zamożni ludzie otrzymują przygotowanie do testów i coaching. Jednak „naukowcy przeprowadzili mieszankę badań eksperymentalnych i kontrolowanych badań terenowych, aby przetestować to pytanie. Ogólnie rzecz biorąc, doszli do wniosku, że zyski wynikające z przygotowania do testów są bardziej rzędu 5 do 20 punktów, a nie 100 do 200 punktów, które twierdzą niektóre firmy przygotowujące do testów”.

Co ważniejsze, wiele osób uważa, że ​​testy zapobiegają zróżnicowaniu przyjęć, ponieważ mniejszości uzyskują niższe wyniki w testach w porównaniu z innymi reprezentowanymi grupami. W badaniu z 2012 r. przyjrzano się szkołom, w których egzaminy wstępne są opcjonalne dla kandydatów, i porównano je ze szkołami, które stosują te testy, a wyniki pokazują, że „ostatnie badania pokazują, że szkoły, w których egzaminy nie są obowiązkowe, zapisują coraz bardziej zróżnicowane grupy uczniów. Ale to samo dotyczy szkół, które wymagają testów”.

Przeciwnicy twierdzą, że standaryzowane testy są niewłaściwie używanymi i bezkrytycznymi ocenami inteligencji i wydajności, ale zwolennicy twierdzą, że nie są to negatywy standaryzowanych testów, ale krytyka źle zaprojektowanych reżimów testowych. Twierdzą, że testowanie powinno i skupia zasoby edukacyjne na najważniejszych aspektach edukacji — przekazywaniu wcześniej określonego zestawu wiedzy i umiejętności — oraz że inne aspekty są albo mniej ważne, albo powinny zostać dodane do schematu testowania.

Dowody pokazują, że czarni i latynoscy uczniowie uzyskują średnio gorsze wyniki niż biali i Azjaci. Dlatego standardowe testy z matematyki i czytania, takie jak SAT, spotkały się z eskalacją ataków postępowców. Jednak wyczerpujący raport senatu wydziału UC, zlecony przez panią Napolitano i opublikowany w 2020 roku, wykazał, że testy nie są dyskryminujące i odgrywają ważną rolę w ochronie jakości edukacji.

Raport sugerował, że pogarszająca się inflacja ocen , zwłaszcza w zamożnych szkołach średnich, sprawia, że ​​standardowa ocena jest szczególnie ważna.

Jeśli chodzi o intencję szkół UC polegającą na porzucaniu standardowych testów, takich jak SAT i ACT przy przyjęciach na studia, testy subiektywne i spersonalizowane, takie jak eseje i zajęcia pozalekcyjne, mogą być łatwo dostosowane i szkodliwe dla uczniów, którzy nie są zaznajomieni z tym procesem. Przyjęcia bez testów mogą być jeszcze bardziej przechylone na korzyść osób dobrze skomunikowanych.

W styczniu 2020 r. senat wydziału na Uniwersytecie Kalifornijskim zalecił, aby system UC utrzymywał standaryzowane testy jako wymagania przyjęć. Raport mówi, że standaryzowane testy z matematyki i czytania są przydatne do przewidywania wyników w college'u. Na podstawie danych od uczniów w systemie UC raport stwierdza, że ​​„wyniki testów są obecnie lepszymi predyktorami pierwszego roku GPA niż średnia ocen w szkole średniej”. Raport kontynuuje: wyniki są również dobre w przewidywaniu całkowitego GPA uczelni i możliwości ukończenia studiów przez studenta. Podczas gdy „moc predykcyjna wyników testów wzrosła”, dodaje raport, „moc predykcyjna ocen w szkole średniej spadła”.

Wyniki testów umożliwiają szkołom UC „wybranie tych uczniów z niedostatecznie reprezentowanych grup, które mają większe szanse na uzyskanie wyższych ocen i ukończenie szkoły na czas”. „Pierwotnym zamiarem SAT było zidentyfikowanie studentów pochodzących spoza stosunkowo uprzywilejowanych kręgów, którzy mogliby mieć potencjał, aby odnieść sukces na uniwersytecie” – czytamy w raporcie. Twórca SAT, Educational Testing Service (ETS), twierdzi teraz, że SAT nie jest testem „umiejętności”, ale raczej oceną „rozwiniętych umiejętności”.

Testy dla uczniów kolorowych, niepełnosprawnych oraz ze społeczności o niskich dochodach w Stanach Zjednoczonych

Spór

Standaryzowane testy i wymóg takich testów przy przyjęciach na studia to temat kontrowersyjny. Powodem kontrowersji jest to, że testy te mogą stwarzać uczniom nierówne szanse w oparciu o ich status ekonomiczny, rasę, a nawet status umiejętności. Często zdarza się, że studenci kolorowi, niepełnosprawni i ci ze społeczności o niskich dochodach mają niskie wyniki uczniów. Jest to najprawdopodobniej spowodowane „pokoleniami wykluczających mieszkań, edukacji i polityki gospodarczej”. Te luki w osiągnięciach nie są nową koncepcją. W 1991 r. różnica między średnimi wynikami uczniów białych i czarnych wynosiła 0,91 odchylenia standardowego, podczas gdy w 2020 r. różnica zmniejszyła się do 0,79 odchylenia standardowego.

Koszt wykonania testów

Standaryzowane testy mogą być kosztowne dla studentów, zarówno na kursach przygotowawczych/tutorów, jak i podczas podchodzenia do testu. ACT i SAT może kosztować 55- $ $ 52- $ 70 i $ 68, odpowiednio. Wielu uczniów, którzy mogą sobie pozwolić na wielokrotne podchodzenie do testów, aby zobaczyć najlepszy wynik, jaki mogą uzyskać, przesyłają „super-wyniki” lub ocenę składającą się z ich najlepszych wyników z każdej sekcji. Studenci ze społeczności o niskich dochodach nie zawsze mogą sobie pozwolić na wielokrotne zdawanie testu.

Koszt przygotowania do testu

Uczniowie ze społeczności o niskich dochodach często nie mają takich samych zasobów do przygotowania testu, jak ich rówieśnicy z bardziej zamożnych środowisk. Ta rozbieżność w dostępnych zasobach powoduje, że istnieje znacząca różnica w wynikach uczniów z różnych środowisk rasowych. W analizie przeprowadzonej przez Brookings Institution stwierdzono, że 59% białych studentów i 80% azjatyckich zdających egzamin jest uznanych za „gotowych na studia” według standardów SAT w porównaniu do poniżej 25% czarnych studentów i poniżej 33% latynoskich/latynoskich studenci, którzy są uważani za „gotowych na studia”. Chociaż College Board informuje, że czynniki społeczno-ekonomiczne nie wpływają bezpośrednio na wyniki ucznia, mogą wpływać na nie pośrednio poprzez dostęp do kursów przygotowawczych i lepszą edukację, doświadczenia, które mogą mieć duży wpływ na wyniki testów.

Uczniowie niepełnosprawni

W przypadku uczniów niepełnosprawnych i ze specjalnymi potrzebami testy te nie zawsze są odpowiednią metodą pomiaru wiedzy lub gotowości. W przypadku uczniów niepełnosprawnych nie zawsze realistyczne jest oczekiwanie, że będą siedzieć godzinami przy biurku i po cichu przystępować do testu. Aby temu zaprzeczyć, uczniowie niepełnosprawni mogą uzyskać udogodnienia, takie jak dodatkowy czas na pracę nad testami.

Zobacz też

Główne tematy

Inne tematy

Bibliografia

  1. ^ Słowniczek Sylvan Learning, pobrany online, źródło nie jest już dostępne
  2. ^ Popham, WJ (1999). „Dlaczego standaryzowane testy nie mierzą jakości edukacji”. Przywództwo edukacyjne . 56 (6): 8–15.
  3. ^ Phelps, Richard P. „Rola i znaczenie testowania” . nonpartisaneducation.org . Źródło 2016-05-17 .
  4. ^ B c Olson Amy M .; Szable, Darrell (październik 2008). „Testy standaryzowane” . W dobrym Thomas L. (red.). Edukacja XXI wieku: podręcznik referencyjny . SAGE Publikacje. s. 423-430. doi : 10.4135/9781412964012.n46 . Numer ISBN 9781452265995.
  5. ^ „Chińska służba cywilna” . Encyklopedia Britannica . Źródło 2 maja 2015 .
  6. ^ B c d e Mark i Boyer (1996), 9-10.
  7. ^ B Kazin Edwards i Rothman (2010), 142.
  8. ^ B Trahair Richard (01.06.2015). Zachowanie, technologia i rozwój organizacyjny: Eric Trist i Instytut Tavistock . Wydawcy transakcji. Numer ISBN 9781412855495.
  9. ^ Johnson, Robert. „Testy standaryzowane”. Encyklopedia reformy edukacyjnej i sprzeciwu. SAGE Publications, INC. 2010. 853–856.Web.
  10. ^ Garrison, Mark J. Miara niepowodzenia: polityczne początki standaryzowanych testów. Albany: State University of New York, 2009. Drukuj.
  11. ^ Darity Jr, William. „Międzynarodowa Encyklopedia Nauk Społecznych” . Encyklopedia informacji ogólnych . Gale Cengage Nauka . Źródło 25 stycznia 2017 .
  12. ^ Gould, SJ, „Naród kretynów”, New Scientist (6 maja 1982), 349-352.
  13. ^ Darity Jr, William. „Międzynarodowa Encyklopedia Nauk Społecznych” . Encyklopedie informacji ogólnych . Gale Cengage Nauka . Źródło 25 stycznia 2017 .
  14. ^ Fletcher, Dan. „Testowanie standaryzowane”. Czas. Time Inc., 11 grudnia 2009. Sieć. 09.03.2014.
  15. ^ "Co jest na ACT." Sekcje testowe ACT. NP i Sieć. 05 maja 2014
  16. ^ Stiggins, Richard (2002). „Kryzys oceny: brak oceny uczenia się” (PDF) . Phi Delta Kappan . 83 (10): 758–765. doi : 10.1177/003172170208301010 . S2CID  145683785 .
  17. ^ B Straussa Valerie (11 marca 2015). „Pięć powodów, dla których standaryzowane testowanie nie zrezygnuje” . Washington Post . Washington Post . Źródło 26 stycznia 2017 .
  18. ^ Kobal, H. i Jiang, Y., 2018
  19. ^ Kobal, H. i Jiang, Y. (2018) Podstawowe fakty dotyczące dzieci o niskich dochodach. Pobrane z http://www.nccp.org/publications/pub_1194.html
  20. ^ „Historia i tło braku pozostawionego dziecka” . Bright Hub Education9 czerwca 2015. Sieć. 12 października 2015 r. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  21. ^ „Ustawa o sukcesie każdego ucznia (ESSA) | Departament Edukacji USA” .
  22. ^ Claiborn, Karol. „Testowanie wysokich stawek”. Encyklopedia uzdolnień, kreatywności i talentu. Publikacje SAGE, 2009. 9 kwietnia 2014.
  23. ^ „Dom - Australijski program nauczania v8.1” . www.australiancurriculum.edu.au . Źródło 2016-05-17 .
  24. ^ Horowitz, MR; Montgomery, DL (styczeń 1993). „Profil fizjologiczny strażaków w porównaniu z normami dla populacji kanadyjskiej”. Kanadyjski Dziennik Zdrowia Publicznego . 84 (1): 50–52. ISSN  0008-4263 . PMID  8500058 .
  25. ^ Kanadyjski Standardowy Test Sprawności (CSTF): dla osób w wieku od 15 do 69 lat: podręcznik interpretacji i poradnictwa . Canadian Association of Sports Sciences, Fitness Appraisal Certification and Accreditation Program, Canadian Society for Exercise Physiology, Fitness Canada. Gloucester, Ontario: Kanadyjskie Towarzystwo Fizjologii Ćwiczeń. 1987. ISBN 0-662-15736-2. OCLC  16048356 .CS1 maint: inne ( link )
  26. ^ Strona internetowa ETS na temat oceniania GRE.
  27. ^ a b Houtz, Jolayne (27 sierpnia 2000) „Templariusze spędzają tylko minuty, aby zaliczyć test państwowy Zadanie matematyczne WASL może zająć 20 sekund; esej, 2 12 minuty” . Seattle Times „W ciągu kilku minut pracownik tymczasowy za 10 USD za godzinę przypisuje wynik do testu Twojego dziecka”
  28. ^ Bogaty Motoko (22.06.2015). „Ocena wspólnego rdzenia: nie jest wymagane doświadczenie w nauczaniu” . New York Times . ISSN  0362-4331 . Pobrano 06.10.2015 .
  29. ^ Lee, Jussim (1989). „Oczekiwania nauczyciela: samospełniające się proroctwa, nastawienie percepcyjne i dokładność”. Dziennik Osobowości i Psychologii Społecznej . 57 (3): 469–480. doi : 10.1037/0022-3514.57.3.469 .
  30. ^ Gdzie stoimy: Ocena oparta na standardach i odpowiedzialności (American Federation of Teachers) [1] Zarchiwizowane 24 sierpnia 2006, w Wayback Machine
  31. ^ a b c d „Wady i zalety standardowych testów” . Oksford nauka . 2014-10-29 . Źródło 2018-02-19 .
  32. ^ „Wspólny Komitet ds. Standardów Oceny Edukacyjnej” . Zarchiwizowane z oryginału w dniu 15 października 2009 . Źródło 2 maja 2015 .
  33. ^ Wspólny Komitet ds. Standardów Oceny Edukacyjnej. (1988). Standardy oceny personelu: jak oceniać systemy do oceny nauczycieli. Zarchiwizowane 2005-12-12 w Wayback Machine Newbury Park, Kalifornia: Sage Publications.
  34. ^ Wspólny Komitet ds. Standardów Oceny Edukacyjnej. (1994). Standardy oceny programu, wydanie II. Zarchiwizowane 2006-02-22 w Wayback Machine Newbury Park, Kalifornia: Sage Publications.
  35. ^ Komitet ds. Standardów Ewaluacji Edukacyjnej. (2003). Standardy oceny uczniów: jak poprawić ocenę uczniów. Zarchiwizowane 2006-05-24 w Wayback Machine Newbury Park, Kalifornia: Corwin Press.
  36. ^ B Morgan Hani (2016). „Opierając się na standardowych testach wysokiej stawki w celu oceny szkół i nauczycieli: zły pomysł”. The Clearing House: Journal of Educational Strategies, Issues and Ideas . 89 (2): 67-72. doi : 10.1080/00098655.216.1156628 . S2CID  148015644 .
  37. ^ „Standardy badań edukacyjnych i psychologicznych” . www.apa.org . Źródło 2 maja 2015 .
  38. ^ Kuncel, NR; Hezletta, SA (2007). „OCENA: Standardowe testy przewidują sukces absolwentów”. Nauka . 315 (5815): 1080–81. doi : 10.1126/science.1136618 . PMID  17322046 . S2CID  143260128 .
  39. ^ Au Wayne (2007-06-01). „Testowanie wysokich stawek i kontrola programów nauczania: jakościowa metasynteza”. Badacz Edukacyjny . 36 (5): 258–267. doi : 10.3102/0013189X07306523 . ISSN  0013-189X . S2CID  507582 .
  40. ^ B c d Phelps Richard (2005). Obrona standaryzowanych testów . Londyn: Psychologia Press. Numer ISBN 978-0-8058-4912-7.
  41. ^ B Hirsch Jr, Eric (1999). Szkoły, których potrzebujemy: i dlaczego ich nie mamy . Nowy Jork: kotwica. Numer ISBN 978-0-385-49524-0.
  42. ^ „Goswami U (1991) Poddany próbie: Wpływ zewnętrznych testów na nauczycieli. Edukacyjny badacz 20: 8-11” . Zarchiwizowane od oryginału w dniu 2013-02-02.
  43. ^ „Krytyka FairTest SAT” . fairtest.org.
  44. ^ „Standardowe testy nie zawsze są najlepszym wskaźnikiem sukcesu” .
  45. ^ Paton, Graeme (6 lipca 2010). „Uniwersytety krytykować egzamin«inflacji klasy » . The Daily Telegraph . Londyn.
  46. ^ Vasagar, Jeevan (2 sierpnia 2010). „Obawy o uczniów państwowych, ponieważ najlepsze uniwersytety nalegają na ocenę A* na poziomie A” . Opiekun . Londyn.
  47. ^ Finch, Julia (10 marca 2010). „Nie potrafią czytać, pisać, pilnować czasu ani być uporządkowanym: werdykt dyrektora Tesco w sprawie absolwentów szkół” . Opiekun . Londyn.
  48. ^ Żywopłoty, Larry V .; Laine, Richard D.; Greenwald, Rob (1994). „Hedges LV (1994) Wymiana: Część I *: Czy pieniądze mają znaczenie? Metaanaliza badań skutków różnicowych nakładów szkolnych na wyniki uczniów” . Badacz Edukacyjny . 23 (3): 5–14. doi : 10.3102/0013189X023003005 . S2CID  36771659 .
  49. ^ Coughlan, Sean. Bystrzy biedni „wstrzymywani przez dziesięciolecia” , BBC , 16 października 2013. Źródło 17 października 2013.
  50. ^ „Neuronauki znormalizowanego wykonywania testów” .
  51. ^ „Standardowe testy nie pokazują, co dzieci wiedzą” .
  52. ^ „Standardowe testy nie są dobrym wskaźnikiem inteligencji płynów według nowych badań” .
  53. ^ „Standardowe testy nie mierzą inteligencji ani zdolności” .
  54. ^ „Obserwacje: Standaryzowane wyniki testów nie odzwierciedlają umiejętności uczniów” .
  55. ^ „Karta Raport Narodów NAEP - Narodowa Ocena Postępów w Edukacji - NAEP” . ces.ed.gov . Pobrano 19.02.2018 .
  56. ^ B c Williams, Maria (2015). „Standardowe testowanie szkodzi uczeniu się uczniów” . go.galegroup.com . Źródło 28 marca 2018 .
  57. ^ Arco, Matt (12 czerwca 2015). „Christie Education Speech w Iowa” . NJ.com . Źródło 25 lipca 2016 .
  58. ^ Popham, WJ (1999). „Dlaczego standaryzowane wyniki testów nie mierzą jakości edukacji” . Przywództwo edukacyjne . 56 (6): 8–15.
  59. ^ Hassel, B. & Rosch, J. (2008) "Ohio podkład o wartości dodanej". Fundacja Fordhama. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf
  60. ^ „Wady i zalety standardowych testów” (PDF) . Uniwersytet Kolumbii . Wiosna 2013. Zarchiwizowane z oryginału (PDF) w dniu 2018-01-27 . Źródło 19 lutego 2018 .
  61. ^ B Holloway JH (2001). „Wykorzystanie i nadużycie standardowych testów”. Przywództwo edukacyjne . 59 (1): 77.
  62. ^ Kohn, Alfie (2000). Sprawa przeciwko standardowym testom: podnoszenie wyników, rujnowanie szkół . 361 Hanover Street Portsmouth, NH 03801-3912: Heinemann. Numer ISBN 978-0325003252.CS1 maint: lokalizacja ( link )
  63. ^ Davidson, Cathy (2011). Teraz to widzisz: jak mózgoznawstwo uwagi zmieni sposób, w jaki żyjemy, pracujemy i uczymy się . Nowy Jork: Wiking.
  64. ^ Wiadomości z USA (2 maja 2015). „Skandal z oszustwami: federalni twierdzą, że nauczyciele zatrudnili zastępcę, aby przystąpić do egzaminów certyfikacyjnych” . Wiadomości NBC . Źródło 2 maja 2015 .
  65. ^ Nauczanie: podróż nauczyciela, William Ayers, Teachers College Press, 1993, ISBN  0-8077-3985-5 , ISBN  978-0-8077-3985-3 , s. 116
  66. ^ Kozol, Jonathan (2005). Wstyd narodu: przywrócenie szkolnictwa apartheidu w Ameryce . Drukuj: Losowy dom. s. 118-119. Numer ISBN 9781415924167.
  67. ^ Schmidt, William H.; Houang, Richard T. (2012). „Spójność programowa i wspólne standardy podstawowe dla matematyki”. Badacz Edukacyjny . 41 (8): 294–308. doi : 10.3102/0013189x12464517 . S2CID  121779439 .
  68. ^ Porter, A.; McMaken, J.; Hwang, J.; Yang, R. (2011). „Wspólne podstawowe standardy: nowy program nauczania w USA” . Badacz Edukacyjny . 40 (7): 103–116. doi : 10.3102/0013189x11405038 . S2CID  51453603 .
  69. ^ Layton, Lyndsey (24 października 2015). „Badanie mówi, że standaryzowane testy przytłaczają szkoły publiczne w całym kraju” . Washington Post . Źródło 26 lipca 2015 .
  70. ^ Doering, Christopher (25 października 2015). „Plan Obamy ogranicza standardowe testy do nie więcej niż 2% czasu zajęć” . USA Dzisiaj . Pobrano 26 lipca 2016 .
  71. ^ Kuczyński-Brown, Alex. „Znormalizowane koszty testowania wynoszą 1,7 miliarda dolarów rocznie, jak wynika z badań”. Poczta w Huffington. TheHuffingtonPost.com, 29 listopada 2012 r. Sieć. 7 kwietnia 2014 r.
  72. ^ „Wielka Czwórka Przemysłu Testującego” . Linia frontu PBS . PBS. 2001 . Źródło 2015-01-21 .
  73. ^ Buckley, Jack; Letukas, Lynn; Wildavsky, Ben (2017), Mierzenie sukcesu: testowanie, oceny i przyszłość przyjęć na studia , Baltimore: Johns Hopkins University Press, s. 344, ISBN 9781421424965
  74. ^ „Przeglądaj wszystkie tematy - The National Academies Press” . Zarchiwizowane od oryginału w dniu 2008-04-18 . Źródło 2 maja 2015 .
  75. ^ „Wady i zalety standardowych testów” (PDF) . Uniwersytet Columbia. 21 listopada 2017 r.
  76. ^ Neill, Monty (jesień 2009). Standardowe testy są nieuczciwe i szkodliwe . Detroit: Farmington Hills, MI: Greenhaven Press. s. 28–35. Numer ISBN 9780737747812. Źródło 4 grudnia 2016 .
  77. ^ Górnik, Barbara (sierpień 2000). „Standardowe umysły: wysoka cena amerykańskiej kultury testowania i co możemy zrobić, aby ją zmienić / Sprzeczności reformy szkolnej: koszty edukacyjne standaryzowanych testów”. Postępowy . 64 : 40–43. ProQuest  231959849 .
  78. ^ Kuncel, Nathan; Sackett, Paul (8 marca 2018). „Prawda o SAT i ACT” . Dziennik Wall Street .
  79. ^ Kuncel, Nathan; Hezlett, Sarah A. (2007). "Standardowe testy przewidują sukces absolwentów" . Nauka . 315 (5815): 1080-1. doi : 10.1126/science.1136618 . PMID  17322046 . S2CID  143260128 .
  80. ^ B Kuncel Nathan; Hezlett, Sarah A. (2007). "Standardowe testy przewidują sukces absolwentów" . Nauka . 315 : 1080–1081. doi : 10.1126/science.1136618 . PMID  17322046 . S2CID  143260128 .
  81. ^ Park, Grzegorz; Lubiński, Dawid; Benbow, Camilla P. (1 października 2008). „Różnice w umiejętnościach wśród ludzi, którzy mają współmierne stopnie naukowe, mają znaczenie dla twórczości naukowej”. Nauka psychologiczna . 19 (10): 957–961. doi : 10.1111/j.1467-9280.2008.02182.x . PMID  19000201 . S2CID  6443429 .
  82. ^ Murphy, Sara C; Klieger, David M; Borneman, Mateusz J; Kuncel, Nathan R. (2009). „Moc predykcyjna osobistych oświadczeń w przyjęciu: metaanaliza i przestroga” . Kolegium i Uniwersytet . 84 : 83-86, 88.
  83. ^ Kuncel, Nathan; Arnesona (2009). „Czy status społeczno-ekonomiczny wyjaśnia związek między testami wstępnymi a wynikami w nauce po ukończeniu szkoły średniej?” . Biuletyn psychologiczny : 1-22.
  84. ^ Connelly, Brian S.; Kuncel, Nathan (3 listopada 2012). „Równoważenie grup terapeutycznych i kontrolnych w quasi-eksperymentach: wprowadzenie do punktacji skłonności”. Psychologia personelu . 66 (2): 407–442. doi : 10.1111/peps.12020 .
  85. ^ Kuncel, Nathan; Sackett, Paul; Beatty, Adam S. (2 sierpnia 2012). „Rola statusu społeczno-ekonomicznego w relacjach SAT-Grade oraz w decyzjach o przyjęciu na studia”. Nauka psychologiczna . 23 (9): 1000-7. doi : 10.1177/0956797612438732 . PMID  22858524 . S2CID  22703783 .
  86. ^ a b c d e f g UNIWERSYTET W KALIFORNII, SENAT AKADEMICKI (styczeń 2020). „Sprawozdanie grupy zadaniowej ds. standaryzowanych badań Rady Akademickiej Uniwersytetu Kalifornijskiego” (PDF) .
  87. ^ Redakcja (17 maja 2020 r.). „Kalifornia definiuje testowanie w dół” . Dziennik Wall Street .
  88. ^ Todd Morrison i Melanie Morrison. „Meta-analityczna ocena trafności predykcyjnej...” Journal of Educational and Psychological Measurement. 1995. Komponentyhttp://epm.sagepub.com/content/55/2/309.abstract.
  89. ^ B Smith żaru. „Wyniki matematyki SAT odzwierciedlają i utrzymują nierówności rasowe” . Instytucja Brookings .
  90. ^ "Dlaczego powinniśmy zrezygnować ze standaryzowanych testów" . Kardynał Codzienny . Źródło 2021-09-27 .
  91. ^ „Ponowne podejście do testu” . www.manhattanreview.com . Pobrano 2021-10-04 .
  92. ^ Geiser, Saul (październik 2015). „Rosnąca korelacja między wynikami wyścigowymi i SAT” (PDF) . Cytowanie dziennika wymaga |journal=( pomoc )
  93. ^ „Standardowe testy i trudności w uczeniu się - limity testowe i wyzwania” . neurohealthah.com . 2020-11-19 . Pobrano 2021-10-04 .

Dalsza lektura

Zewnętrzne linki