Dlaczego polityka oparta na dowodach jest przeceniana

Trzy lata temu Stany Zjednoczone ogłosiły koniec stanu zagrożenia pandemicznego i kraj odetchnął z ulgą. Ty, drogi czytelniku, pewnie już całą tę sprawę odłożyłeś do akt. Przepraszam, ale ja po prostu nie potrafię o niej zapomnieć, a lektura znakomitej książki Macedo i Lee „In Covid’s Wake” w drodze powrotnej z Irlandii w zeszłym tygodniu przypomniała mi dlaczego. Wirus oczywiście nie był winą żadnego z nas w szczególności.¹ Ale to, jak rozumowaliśmy o nim jako demokratyczne społeczeństwo, było absolutnie naszą winą. Tak zwani eksperci latami mówili reszcie z nas, by „kierować się nauką”, a potem rościli sobie pewność, której nauka nigdy im nie dawała, ubierali sądy wartościujące w szatę technicznych, opowiadali mnóstwo szlachetnych kłamstw dla naszego dobra i machali ręką na każdy koszt leżący poza ich własną wąską specjalizacją. Tonęliśmy w danych, ale tym, czego nam brakowało, był uczciwy osąd.

Ta odruchowa postawa oparta na dowodach to nie tylko sprawa pandemii i pojawia się wszędzie tam, gdzie traktujemy jeden rodzaj danych jako jedyny, który się liczy. W 2018 roku czołowe czasopismo medyczne opublikowało randomizowane badanie kontrolowane (RCT), z którego wynikało, że spadochrony nie robiły nic, by zapobiec śmierci lub urazom, gdy ludzie wyskakiwali z samolotu. Haczyk polegał na tym, że samoloty stały zaparkowane na ziemi, a średnia wysokość skoku wynosiła około pół metra. Całe badanie było oczywiście żartem. Autorzy nie byli przeciwni eksperymentom jako takim, lecz wyśmiewali powszechny odruch wśród swoich kolegów, który traktuje RCT jako jedyną szanowaną formę wiedzy, nawet w odniesieniu do twierdzenia, które można sprawdzić, wyglądając przez okno samolotu.²

Sporą część swojego zawodowego życia poświęciłem na wnoszenie wkładu i domaganie się lepszych dowodów w debatach o imigracji, zwykle ku cichej irytacji ludzi z mojej własnej strony, więc nie zamierzam teraz zaczynać szydzić z danych i działać na „przeczucia”. Dobre tworzenie polityki potrzebuje dowodów, analizy kosztów i korzyści oraz starannego myślenia kontrfaktycznego. Ale potrzebuje też pokory i lepszego osądu co do tego, jakiego rodzaju dowodu dane pytanie może faktycznie wymagać, jeśli w ogóle.

Są pewne polityki tak oczywiście dobre, że nie powinniśmy potrzebować idealnego badania, by je wypróbować, jak prawne pozwalanie na więcej mieszkań tam, gdzie popyt jest wysoki, utrzymywanie w sieci niezawodnej niskoemisyjnej energii, gdy substytutem jest paliwo kopalne, czy zwiększanie liczby wiz dla najlepszych zagranicznych talentów, których wszyscy rzekomo chcą. Rozsądni ludzie mogą spierać się o szczegóły i kompromisy. Ale w pytaniach takich jak te uzasadnienie działania nie zależy od idealnego RCT, a ciężar dowodu nie powinien być nieskończony.

Są też polityki tak oczywiście złe, że nie powinniśmy potrzebować badania, by je powstrzymać, jak zakazy pracy dla osób ubiegających się o azyl. Serio, nie potrzebujesz randomizowanego badania ani żadnego twardego dowodu, by przewidzieć, co się stanie, gdy zabronisz chętnej dorosłej osobie w prawnym zawieszeniu pracować, zapłacisz za jej utrzymanie, a potem wskażesz jej bezczynność jako dowód, że system jest zepsuty. Większość najtrudniejszych decyzji w polityce wygląda bardziej tak niż jak wielka tajemnica wymagająca dobrze zaprojektowanego eksperymentu.

Co „dowody” naprawdę znaczą

Jeden szczebel niżej od spadochronu siedzi nić dentystyczna. Ja osobiście nie lubię nitkowania, ale większość z nas pewnie potrafi wyczuć różnicę po wyczyszczeniu nicią resztek po obfitym posiłku, a nasi dentyści widzą to przy następnym czyszczeniu. A jednak gdy część dziennikarzy uchwyciła się przeglądu, który wykazał niewiele wysokiej jakości randomizowanych dowodów na rzecz nitkowania, seria nagłówków obwieściła, że nie ma żadnego dowodu, by to w ogóle działało. Jak zauważa historyczka nauki Naomi Oreskes, było to błędne odczytanie. Powinniśmy mieć „szerokie podejście do dowodów”, twierdzi ona, licząc też doświadczenie zawodowe i zwykłą obserwację, zwłaszcza tam, gdzie czyste, długoterminowe badanie jest niewykonalne lub nigdy nie zostanie sfinansowane.

To samo pomieszanie, choć o znacznie wyższej stawce, przewinęło się przez pandemię COVID. W swojej niedawnej (wysoce polecanej) książce na ten temat Stephen Macedo i Frances Lee stawiają zaskakującą tezę: spora część istotnej wiedzy o tym, jak radzić sobie z pandemią oddechową, już istniała, ale rządy w całym świecie zachodnim w dużej mierze ją odłożyły na bok. Przed 2020 rokiem dominujące plany gotowości pandemicznej były sceptyczne wobec szeroko zakrojonych środków, takich jak lockdowny i przedłużone zamknięcia szkół, ostrzegając, że dowody na ich rzecz są słabe, a koszty ludzkie i ekonomiczne wysokie. W panice wczesnego 2020 roku rządy te porzuciły te wytyczne niemal z dnia na dzień, a potem roztoczyły pewność, której nauka nigdy nie poparła.

Pomaga uporządkować sprawy według rodzaju informacji zwrotnej, jaką dają, i ku jakiemu celowi. Spadochron daje najprostszy jej rodzaj: korzyść z pozostania przy życiu jest natychmiastowa, indywidualna i niemożliwa do przeoczenia, więc badanie tylko potwierdziłoby to, co każdy już widzi. Nowy lek lub szczepionka daje coś przeciwnego: korzyści i koszty mogą być rzeczywiste, ale są też znacznie bardziej zróżnicowane i często niewidoczne. Zakażenie, które nigdy nie nadeszło, łatwo pomylić ze szczęściem lub z tym, że organizm wyleczył się sam, co jest dokładnie powodem, dla którego randomizowane badanie z placebo jest niezbędne i dla którego współczesna medycyna na nim się opiera.

Większość polityki rządowej leży pomiędzy. Zwykle można stwierdzić, czy dana polityka zmierza ku zyskowi czy stracie, na długo zanim da się to ująć w czystą liczbę, a skutki przebiegają przez rynki pracy, ceny i politykę naraz, więc żadne pojedyncze badanie nie potrafi ich wyizolować, a często żadnego nie da się przeprowadzić. Ale nie da się tego rozstrzygnąć samym patrzeniem, jak ze spadochronem, ani nie da się tego rozstrzygnąć jednym czystym eksperymentem, jak z lekiem. Pozostaje osąd oparty na skumulowanych dowodach, porównaniach między miejscami i czasami oraz uczciwym rozumowaniu kosztów i korzyści w warunkach niepewności, a wszystko to wyłożone otwarcie, zamiast przebrane za rozstrzygniętą naukę.

Kolejną ofiarą naszej faktycznie istniejącej odruchowej polityki opartej na dowodach jest pytanie wstępne o to, co w ogóle liczy się jako istotny dowód i czyja specjalizacja ma o tym decydować. Tutaj Macedo i Lee są druzgocący. Jak dokumentują, niszowa grupa ekspertów od zdrowia publicznego i chorób zakaźnych została nagle potraktowana jako jedyny prawomocny autorytet w kryzysie, który dotykał każdej części życia, a ich pole widzenia było wąskie z założenia: utkwione w minimalizowaniu zakażeń, spychało niemal każdy inny skutek, ekonomiczny i pozaekonomiczny zarazem, ze stołu jako cudzy resort.

Francis Collins, który kierował Narodowymi Instytutami Zdrowia, przyznał, że „mentalność zdrowia publicznego”, którą podzielał, prowadziła go do „przypisywania nieskończonej wartości powstrzymaniu choroby” i „zerowej wartości temu, czy faktycznie całkowicie zaburza to życie ludzi, rujnuje gospodarkę i trzyma mnóstwo dzieci poza szkołą”. W Wielkiej Brytanii naczelny lekarz Chris Whitty powiedział oficjalnej komisji śledczej ds. Covid, że dodanie ekspertów ekonomicznych lub społecznych do rządowej grupy doradczej uczyniłoby ją zbyt „niesterowną”. Powstrzymanie wirusa stało się jedynym celem, który liczył się jako kierowanie się nauką, a koszty, które musi rozważyć każda uczciwa polityka, zostały uznane za leżące poza zakresem.

Ekonomiści mieli już tę bitwę za sobą

Ekonomiści rozwoju spierają się o to od 20 lat. „Rewolucja wiarygodności” nauczyła nauki społeczne nieufności wobec niechlujnych twierdzeń przyczynowych i cenienia identyfikacji, co było prawdziwym postępem. Ale ekonomista Lant Pritchett dowodzi, że niektórzy z jej orędowników wykonali potem dziwną sztuczkę: zażądawszy najbardziej rygorystycznych możliwych dowodów dla wąskiej estymacji wewnątrz artykułu, odwracali się i przyjmowali rozległe, systemowe twierdzenia zbudowane na tych estymacjach „z całkowitą i absolutną łatwowiernością”. Nazywa to rewolucją łatwowierności. Eksperyment może być wewnętrznie szczelny, a mimo to nie powie ci niemal nic o tym, czy program zadziała na skalę krajową w innym kraju.

Zarzut płynie z samego centrum dziedziny. Angus Deaton i Nancy Cartwright, bynajmniej nie wrogowie kwantyfikacji, dowodzą, że randomizowane badania zasługują na swoje miejsce tylko „jako część kumulatywnego programu” obok teorii i mechanizmu. Domaganie się trafności zewnętrznej od pojedynczego badania „oczekuje od RCT zbyt wiele, jednocześnie nie doceniając jego wkładu”.

Pritchett oferuje dosadniejszy test węchowy dla swojej własnej dziedziny wzrostu gospodarczego: jeśli kraje bogate nie mają więcej jakiegoś modnego czynnika niż kraje biedne, powinniśmy być podejrzliwi wobec twierdzeń, że wyjaśnia on rozwój. Żaden kraj nigdy nie przeprowadził randomizowanego badania w drodze do bogactwa. Polska nie wyszła z komunizmu i nie weszła w dobrobyt dzięki dobrze przeprowadzonemu eksperymentowi z transferami pieniężnymi; uczyniła to poprzez chaotyczne, wielkoskalowe zmiany na rynkach, w instytucjach i w polityce, których żadne badanie nie mogłoby przetestować z wyprzedzeniem. Metoda powinna pasować do pytania. Gdy tak nie jest, więcej rygoru w niewłaściwym pytaniu to tylko droższy sposób, by z pewnością mijać się z istotą.

Kiedy badanie zasługuje na swoje miejsce

Nie zrozumcie mnie źle—lubię swoje RCT i sam pewne przeprowadziłem. Randomizowane badania są niezbędne, gdy intuicja wyprzedza wiedzę. Najlepsze uzasadnienie badania to lustrzane odbicie spadochronu: czasem odpowiedź wcale nie jest oczywista, intuicja, którą podziela niemal każdy, okazuje się błędna, a jedynym sposobem, by się przekonać, jest przeprowadzenie eksperymentu i poniesienie jego kosztu. Gdy nie da się dostrzec efektu od razu samym patrzeniem, trzeba go bezwzględnie zmierzyć starannie i systematycznie.

Transfery pieniężne w bogatych krajach mogą być tu ciekawym przykładem. W biednych krajach dowody na to, że wręczanie ludziom pieniędzy poprawia ich życie, są tak mocne, jak tylko nauka społeczna potrafi, a randomizowane badania znajdują duże zyski w dochodzie, majątku, bezpieczeństwie żywnościowym, a nawet niższą umieralność niemowląt. Gdy ekonomiści po raz pierwszy zaproponowali zwyczajne wręczanie biednym ludziom gotówki, obawiano się, że roztrwonią ją na alkohol i inne pokusy, dlatego pomoc tak często przybierała postać żywności lub gotówki z warunkami. Badania wykazały, że ta obawa była w dużej mierze bezpodstawna: w dziesiątkach badań gotówka nie podnosiła wydatków na alkohol czy tytoń, a często je obniżała, bo ludzie w ubóstwie okazują się dobrymi sędziami tego, czego potrzebują.

Skoro więc dla coraz większej liczby osób staje się coraz bardziej oczywiste, że transfery pieniężne wyraźnie działają, można by założyć, że ta sama logika przenosi się na kraj bogaty: jeśli dasz borykającemu się z trudnościami Amerykaninowi kilkaset dolarów miesięcznie, jego życie wymiernie się poprawi. Przynajmniej wydawało się to oczywiste badaczom, którzy w to wierzyli. Ale potem przeprowadzili badania.

Jak szczegółowo opisuje Kelsey Piper, seria starannych amerykańskich badań, w tym eksperyment OpenResearch, który dawał ludziom 1000 dolarów miesięcznie przez trzy lata, nie znalazła trwałej poprawy w zdrowiu, zatrudnieniu, poziomie stresu ani w wynikach dzieci. Piper, która podchodziła do tego, spodziewając się, że gotówka pomoże bardziej, nazwała te dowody „szokującymi”. Wyniki z krajów rozwijających się były solidne, ale nie przeniosły się czysto na ten kontekst, co jest dokładnie tym problemem trafności zewnętrznej, którym tak martwił się Angus Deaton. Tutaj badanie zarobiło na każdego dolara, który kosztowało, bo stawka była wysoka, intuicja była silna, ale ostatecznie błędna. Problemem jest oczywiście odróżnienie spadochronu od badania medycznego, zanim zdecydujesz, czy badanie warto przeprowadzić.

Nawet wtedy właściwym narzędziem nie zawsze jest eksperyment, a czasem w ogóle nie jest dostępny. Niektóre z najważniejszych rzeczy, które wiemy, opierają się bardziej na teorii i modelowaniu niż na jakimkolwiek pojedynczym badaniu. Nikt nie przeprowadził ani nie mógłby przeprowadzić randomizowanego badania nad tym, czy kraj powinien otworzyć się na wolny handel. Uzasadnienie opiera się tu na teorii przewagi komparatywnej, wypracowanej dwa wieki temu i dopracowanej przez góry nieeksperymentalnych dowodów od tamtej pory. Nikt nie losował narodów do demokracji i dyktatury, by dowiedzieć się, która z nich daje lepsze życie. O pytaniach takich jak te rozumujemy z teorii i wartości, opieramy się na eksperymentach myślowych i modelach formalnych, na tego rodzaju symulacjach obliczeniowych i myślowych, które naukowcy społeczni budują właśnie dlatego, że niektórych pytań nigdy nie da się poddać próbie eksperymentalnej.

Kiedy wszyscy mylą się naraz

Wcale nie jestem ekspertem od pandemii. Ale to bardzo ważny przypadek, który wciąż na gorsze kształtuje publiczne zaufanie. Niepewność w dowodach widzieliśmy już wcześniej. Ale głębszą porażką była odmowa jej przyznania. Urzędnicy na każdym szczeblu wciąż powtarzali, że „wiemy, co działa przeciwko Covid-19”, jak dokumentują Macedo i Lee, „nawet gdy stawało się coraz bardziej oczywiste, że decydenci improwizują i w istocie nie wiedzą z pewnością, co działa”. Pewność rościło się tam, gdzie jej nie było. Nauka może ci powiedzieć, co dana polityka prawdopodobnie zrobi. Ale nie może ci powiedzieć, co powinieneś cenić, a udawanie inaczej trwoni wiarygodność, której potrzebujesz następnym razem.

Krytycy często popełniali lustrzany błąd, traktując brak czystego badania jako dowód, że dany środek jest bezwartościowy, co jest błędem nitkowania powiększonym do skali kryzysu narodowego. Macedo i Lee ganią oba odruchy naraz: błędem było, piszą, „wyśmiewać i cenzurować sceptyków masek, tak jak błędem było upierać się z pewnością, że maski nie działają”. A pod krzykiem siedział kompromis, którego nikt nie chciał nazwać. Badania nad noszeniem masek mierzyły „tylko jedną stronę równania”, zauważają, i nie mówiły „nic o kosztach maskowania dla nauki, komunikacji, socjalizacji i dobrostanu psychicznego dzieci”, podczas gdy zamknięcia szkół „najbardziej zaszkodziły biednym dzieciom”. Tym, co łączy oba błędy, jest odmowa powiedzenia uczciwej rzeczy: dowody były niepełne, a wybory nałożyły ciężkie koszty na ludzi, którzy nigdy nie dostali głosu.

Porażka „kierowania się nauką” wzięła spór o wartości, o to, jaką wagę przyłożyć do edukacji młodych wobec bezpieczeństwa starych, do wolności wobec ostrożności, i przebrała go za techniczny spór, który dane już rozstrzygnęły. Imigracja bez przerwy działa na tej samej zasadzie. Wiele z tego, co wygląda na spór o dowody, jest w istocie sporem o to, co rząd jest winien własnym obywatelom wobec tego, co jest winien cudzoziemcom. Żaden eksperyment nie powie ci, jak bardzo zważyć płace obywatela wobec bezpieczeństwa obcego ani czy bardziej zróżnicowane społeczeństwo jest lepsze od bardziej spójnego.

To wszystko są pytania o wartości, a jeśli ludzie po prostu nie chcą pewnego rezultatu, takiego jak bardziej zróżnicowane społeczeństwo, żadna czysta estymacja, że dana polityka by go przyniosła, nie zmieni ich zdania. Dowodziłem tego obszernie: najbardziej użyteczne, co dowody mogą tu zrobić, to zdyscyplinować spór o wartości, mówiąc nam, ile dana polityka będzie kosztować i co przyniesie. Nie mogą sprawić, by spór o wartości zniknął, a przedstawianie konfliktu wartości jako naukowego głównie tylko ukrywa to, o co ludzie się spierają.

Dan Williams stawia ściśle powiązaną tezę w swoim nowym eseju o tym, jak plemiona polityczne konstruują rywalizujące rzeczywistości. Polityczny spór często przebiega przez rywalizujące systemy interpretacji, które rozstrzygają, które fakty się liczą, co uchodzi za reprezentatywne i kto należy do opowieści jako ofiara, czarny charakter czy bohater. To dlatego odwołania do „dowodów” tak często rozczarowują. Walka toczy się po części o fakty, ale także o ramę, która mówi ludziom, co fakty znaczą.

Wykazalne korzyści

Żadne randomizowane badanie nigdy też nie powie ci wszystkiego, co chciałbyś wiedzieć o przyjęciu produktywnego, wykwalifikowanego pracownika, który płaci podatki, wypełnia udokumentowany niedobór, zakłada firmę albo leczy pacjentów w mieście, które nie jest w stanie zwerbować lekarza. Informacja zwrotna przebiega tu przez rozmaite instytucje, a nie da się trzymać reszty świata nieruchomo, gdy przekręcasz pokrętło. A jednak podstawowy kierunek wcale nie jest tajemniczy. Decydent rozważający, czy skierować więcej kwalifikujących się naukowców przez wyspecjalizowaną wizę, czy też udrożnić zbędną zaległość dla wykwalifikowanych pracowników, nigdy nie będzie miał czystych dowodów eksperymentalnych, które rozstrzygnęłyby całe pytanie, a czekanie na nie oznacza tylko pozwolenie, by zły domyślny stan trwał.

To dlatego imigracja wykwalifikowana jest tak popularna: jej korzyści są intuicyjne i widoczne, bez konieczności czytania przez kogokolwiek artykułu z ekonometrii. Około 80 procent amerykańskich wyborców popiera imigrację wysoko wykwalifikowaną ponad podziałami partyjnymi, a decydenci, którzy chcieliby na tym oprzeć działanie, mogliby usprawnić nielimitowaną wizę O-1A dla pracowników o nadzwyczajnych zdolnościach już jutro, bez ani jednej nowej ustawy. To właśnie mam na myśli, mówiąc wykazalnie korzystny: polityka, której wkład w kraj zwykli ludzie widzą w praktycznych kategoriach, jawnie i wprost służąca interesowi narodowemu. Przekonujące obramowanie jest już wpisane w samą politykę, więc nie potrzebujesz kampanii, by je wyjaśnić.

Ale ustalanie polityki imigracyjnej nie jest oczywiście tym samym, co wybieranie spadochronów. „Wykwalifikowany pracownik, który płaci podatki i wypełnia udokumentowany niedobór, jest atutem dla kraju” to twierdzenie tak bliskie obserwacyjnemu nasyceniu, jak tylko fakty społeczne potrafią być. „Ta konkretna reforma wizowa przyniesie tę korzyść w tej konkretnej wielkości” to prawdziwe pytanie empiryczne, które rzeczywiście wymaga identyfikacji, i jest to coś, nad czego estymacją moi koledzy spędzają całe kariery. Traktowanie drugiego twierdzenia tak, jakby było równie oczywiste jak pierwsze, to ten sam błąd, który wyśmiewali autorzy badania nad spadochronem, tyle że wymierzony w przyjaźniejszym kierunku. Jak dowodziłem wcześniej, „imigracja” w abstrakcji nie ma czystego efektu czekającego na odkrycie; mają go konkretne polityki przyjmujące konkretnych ludzi według konkretnych reguł.

Nie każda widoczna korzyść jest tak kłopotliwa jak imigracja. Skoro już mówiliśmy o nitkowaniu, rozważcie… ideę japońskiej toalety. Wystarczy raz czy dwa skorzystać z podgrzewanego washletu, by wiedzieć, że bije on to, co oferuje większość zwykłych łazienek, i nikt nie potrzebuje randomizowanego badania mierzącego czystość czy zadowolenie, by rozstrzygnąć sprawę, jak właśnie dowodził Noah Smith. Ja też kupiłem jeden niedawno, po spędzeniu trochę czasu w Japonii, i mam zdanie na ten temat.³ Jestem dość pewien, że instalowanie washletów na dużą skalę, w hotelach i na lotniskach, byłoby dobrą polityką dla wielu amerykańskich instytucji, i równie pewien, że nie musi ona być oparta na dowodach w jakimkolwiek poważnym sensie. Przeszkodą nie jest tutaj niedobór dowodów. To nasze nawyki kulturowe, przepisy budowlane i instalacja elektryczna, do której większość amerykańskich łazienek nigdy nie była zbudowana.

Wykazalne szkody

Ta sama logika działa w odwrotną stronę i wytwarza to, co może być najwyraźniej autodestrukcyjną polityką imigracyjną w bogatym świecie: zakaz pozwalania osobom ubiegającym się o azyl na pracę, gdy ich wnioski są rozpatrywane. W wielu krajach to wykluczenie trwa pół roku lub dłużej, a w praktyce może ciągnąć się znacznie dłużej.

Zanim rozważymy cokolwiek z polityki, pomyślmy o tym, co to robi z człowiekiem. Rząd przyjmuje wniosek azylowy do rozpatrzenia, płaci za utrzymanie wnioskodawcy, a potem zabrania jednej czynności, która pozwoliłaby mu utrzymać się samodzielnie, zbudować dorobek i zacząć przynależeć, czyli pracy. Miesiące przymusowej bezczynności drenują oszczędności, erodują umiejętności i niszczą nawyki oraz pewność siebie, które czynią kogoś zdolnym do zatrudnienia, a szkoda przeżywa zakaz o całe lata. Nie potrzebujesz pomysłowego instrumentu ani randomizowanego badania, by zobaczyć, że to zła transakcja.

Potem jest jeszcze kłopotliwa polityka tej kwestii. Zakaz wytwarza dokładnie ten obraz, na który wskazują antyimigracyjni politycy jako na dowód, że system jest zepsuty: zdolni do pracy przybysze bezczynni w finansowanych przez podatników hotelach albo sprzedający owoce na skrzyżowaniach, bo formalna gospodarka jest dla nich zamknięta. Ta widoczna zależność może zniechęcić wyborców do imigracji w ogóle, w tym do wykwalifikowanych ścieżek, które wyborcy poza tym lubią.

Ilekroć dowodzę, że polityka imigracyjna musi być intuicyjnie korzystna, by pozostać popularną, ktoś pyta, jak w ogóle wyglądałaby niekorzystna proimigracyjna polityka. Wygląda właśnie tak, i żadna ilość zagregowanych dowodów na długoterminowy fiskalny wkład uchodźców nie sprawi, że wyborca odzobaczy widoczny nieład kryzysu azylowego na ulicach. Uczciwym rozwiązaniem jest polityka, która w ogóle przestaje generować widoczną porażkę.

Przeciw teatrowi dowodów

Pomaga zrozumieć, dlaczego maksymalistyczna wersja polityki opartej na dowodach wciąż rozczarowuje swoich orędowników. Wpychanie każdego żetonu na „naukę” i poddawanie się temu, na co eksperci akurat się zgadzają, nadal nie daje polityki, bo najtrudniejsze pytania to nie te, do których odpowiadania nauka została stworzona. Macedo i Lee stawiają tezę co do Covid: naukowcy, piszą, „ze swoimi wąskimi podstawami specjalizacji, nie powinni tworzyć polityki”, bo wybory zależą od wartości i kompromisów, których żadne badanie nie potrafi zważyć. Ta sama luka pojawia się w sprawie klimatu, gdzie ekonomista Matt Burgess dowodzi, że głośne obramowania, „nic wielkiego” i „zagrożenie egzystencjalne”, są oba prawdopodobnie błędne, a odpowiedzialna polityka musi ważyć kompromisy i oceniać, które scenariusze są prawdopodobne, czego żadne odwołanie do konsensusu nie potrafi rozstrzygnąć. I pojawia się w sprawie imigracji, gdzie „dowody” są przywoływane przez obie strony, by rozstrzygnąć to, co w gruncie rzeczy jest walką o to, co jesteśmy sobie nawzajem winni.

Jak więc to wygląda w praktyce, dla kogoś, kto chce traktować dowody poważnie, nie chowając się za nimi? Pomocne są następujące pytania:

Jakiego rodzaju twierdzenie faktycznie leży na stole: empiryczne, które dane mogą rozstrzygnąć, czy normatywne, którego żadna regresja nigdy nie rozwiąże?

Jakiego rodzaju informację zwrotną wytwarza dana polityka i czy czyste badanie byłoby w ogóle trafne i dostępne, zanim decyzja musi zostać podjęta?

I ile kosztuje zebranie dowodów, ile kosztuje czekanie i kto płaci za zwłokę?

Gdy mechanizm jest jasny i silny, negatywne skutki są odwracalne, a ci, którzy by skorzystali, nie mogą sobie pozwolić na czekanie, uczciwym posunięciem jest działać teraz i badać dalej w trakcie. A gdy spór w gruncie rzeczy dotyczy wartości, eksperci powinni to powiedzieć, zamiast przepuszczać go przez „naukę”.

Od polityki opartej na dowodach do uczciwego demokratycznego osądu

Każde badanie ma swoją cenę, i ma ją też każda zwłoka. Pisarz Jeremiah Johnson niedawno nazwał tryb porażki, który określa jako tyranię przypadku skrajnego w tekście w The Argument, w którym każda wyobrażalna szkoda dla kogokolwiek, choćby najrzadsza, staje się powodem, by nikt nie działał, a żądanie jeszcze jednego badania należy do jego ulubionych instrumentów. To żądanie niemal nigdy nie pada równo: poprzeczka rośnie dla reformy, której ktoś nie lubi, i znika dla status quo, które zwykle nie opiera się na żadnym badaniu.

Wybiórcze żądanie rygoru, wymierzone tylko we wniosek, do którego wolałbyś nie dojść, to jeden z najskuteczniejszych sposobów blokowania działania, brzmiąc przy tym godnie podziwu starannie wobec dowodów. Przeprowadzenie badania oznacza wydawanie pieniędzy, palenie czasu i czasem wstrzymywanie obiecującej polityki przed ludźmi w grupie kontrolnej, podczas gdy każdy miesiąc spędzony na czekaniu to miesiąc, w którym obecna reguła pozostaje w mocy. Zwykle można to zważyć nieformalnie: nikt nie potrzebuje randomizowanego badania, by zobaczyć, że płacenie ludziom za bezczynne siedzenie, jak czynią to zakazy azylowe, a potem żywienie do nich urazy z tego powodu, to zła transakcja.

Dyscypliną, która utrzymuje to wszystko w uczciwości, jest gotowość powiedzenia, co zmieniłoby twoje zdanie. Jeśli twierdzę, że zakaz pracy dla azylantów jest oczywiście nie do obrony, jestem ci winien warunki, w których bym to twierdzenie porzucił: solidne dowody, że odstrasza on nieuczciwe wnioski w skali wartej lat utraconych zarobków i opóźnionej integracji dla ludzi, którzy w innym razie by pracowali. Nie widziałem takich dowodów, ale szczerze bym się im przyjrzał. Nazwanie wyniku, który by tobą poruszył, jest tym, co oddziela rozważny osąd od wygodnego, i jest to próba, której najgłośniejsi domagający się „polityki opartej na dowodach” zbyt rzadko stosują wobec samych siebie.

Nie zrozumcie mnie źle—nic z tego nie jest przyzwoleniem na przeczucia. Badanie nad spadochronem jest zabawne, bo oczywiście nikt nie potrzebuje randomizowanego badania na wysokości, ale większość decyzji, które mają znaczenie, wygląda mniej jak spadochron, a bardziej jak nasz system imigracyjny: dowody są częściowe, a informacja zwrotna jest powolna lub niewidoczna. Dla tych decyzji dowody są niezbędne. Ale nadal nie mogą podjąć za ciebie trudnego osądu, a dobry osąd nie przetrwa długo w demokracji, jeśli polityka, która za nim stoi, nie potrafi pokazać swojej wartości w świecie, w którym faktycznie żyją zwykli obywatele o każdym przekonaniu politycznym.

Rzekomo. Jak dobrze podsumował Scott Alexander, „[a]lbo wirus odzwierzęcy przeszedł na ludzi piętnaście mil od największego laboratorium koronawirusów na półkuli wschodniej. Albo wirus z wycieku laboratoryjnego po raz pierwszy zwrócił publiczną uwagę tuż obok stoiska z jenotami na targu mokrym. Tak czy inaczej, to jeden z największych zbiegów okoliczności stulecia, zaprojektowany przez jakiegoś kosmicznego dowcipnisia, który chciał utrzymać debatę zajadłą przez lata”. ↩
Oczywiście, nawet w tym przypadku, jeśli musisz zdecydować o lepszej konstrukcji spadochronu z rozmaitymi poprawkami, możesz chcieć zmierzyć rzeczy systematycznie, czy to przez randomizowane badanie, czy przez badanie obserwacyjne. ↩
TOTO Nexus, skoro pytasz. Stałem się o to bardziej nieznośny niż nawet o europejską sytuację z klimatyzacją. ↩