Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00054 008636 11203892 na godz. na dobę w sumie
Propensity Score Matching - ebook/pdf
Propensity Score Matching - ebook/pdf
Autor: Liczba stron:
Wydawca: Wydawnictwa Uniwersytetu Warszawskiego Język publikacji: polski
ISBN: 978-83-235-1696-5 Data wydania:
Lektor:
Kategoria: ebooki >> biznes >> ekonomia
Porównaj ceny (książka, ebook, audiobook).

Książka omawia własności statystyczne metody Propensity Score Matching w małej próbie. Porównano w niej na gruncie symulacji różne estymatory łączenia wykorzystujące prawdopodobieństwo w małych próbach. Porównaniu są poddane estymatory służące do szacowania przeciętnych efektów oddziaływania (ATE) oraz przeciętnych efektów oddziaływania wobec jednostek poddanych oddziaływaniu (ATT). Dla obu efektów porównywane są estymatory wykorzystujące łączenie 1 do 1 według prawdopodobieństwa oraz wykorzystujące ważenie obserwacji odwrotnością oszacowania prawdopodobieństwa poddania oddziaływaniu (propensity score).

Publikacja adresowana jest głównie do specjalistów z zakresu metod ilościowych w ekonomii, zajmujących się ilościową ewaluacją programów.

Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

BADANIA EKONOMICZNE Paweł Strawiński Propensity Score Matching Własności małopróbkowe Paweł Strawiński jest adiunktem w Katedrze Statystyki i Ekonometrii Wydziału Nauk Eko- nomicznych Uniwersytetu Warszawskiego. Jest autorem licznych publikacji naukowych w czołowych czasopismach polskich i zagranicznych. Jego zainteresowania badawcze koncentrują się na teorii i zastosowaniu współczesnych technik mikroekonometrycznych – w szczególności do analizy zagadnień związanych z funkcjonowaniem rynku pracy i rynku edukacyjnego, a także z interakcjami pomiędzy tymi segmentami gospodarki. Książka omawia własności statystyczne metody propensity score matching w próbach o małej liczbie obserwacji. Porównano w niej na gruncie symulacji różne estymatory łączenia wykorzystujące oszacowanie prawdopodobieństwa oddziaływania (propensity score) w małych próbach. Analizowano estymatory służące do szacowania przeciętnych efektów oddziaływania (ATE) oraz przeciętnych efektów oddziaływania wobec jednostek poddanych oddziaływaniu (ATT). Dla obu efektów porównywano estymatory wykorzystujące łączenie 1 do 1 według prawdopodobieństwa oraz wykorzystujące ważenie obserwacji odwrotnością oszacowania prawdopodobieństwa poddania oddziaływaniu (propensity score). Pub- likacja adresowana jest głównie do specjalistów z zakresu metod ilościowych w ekonomii, zajmujących się ilościową oceną programów. „Dr Paweł Strawiński jest uznanym, nie tylko w Polsce (o czym świadczą publikacje, m.in. w prestiżowym czasopiśmie «Economics of Transition»), specjalistą w omawianej dziedzinie. Znajomość autora współczesnych osiągnięć światowej statystyki i ekonometrii oraz umiejętność zastosowania ich w praktyce pozwalają przypuszczać, że książkowe wydanie omawianej pracy może stanowić cenny wkład do polskiej literatury statysty- czno-ekonometrycznej, jako pierwsza monografia poświęcona estymacji przez łączenie za pomocą prawdopodobieństwa. Ważnym uzupełnieniem części teoretycznej są szczegółowo omówione przykłady empiryczne obejmujące cztery różniące się od siebie dziedziny zastosowań (wpływ szkoleń zawodowych na zarobki, wybór strategii dochodowej gospodarstw rolników, skuteczność subsydiowania miejsc pracy oraz porównanie wyników nauczania w szkołach publicznych i prywatnych)”. (z recenzji dr. hab. Adama Szulca, prof. nadzw. SGH) P a w e ł i S t r a w ń s k i P r o p e n s i t y S c o r e M a t c h n g i www.wuw.pl/ksiegarnia ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== oklad_propensity.indd 1 14-09-03 11:24 Propensity Score Matching ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Komitet Redakcyjny serii Przewodnicząca: prof. dr hab. Urszula Sztandar-Sztanderska Członkowie: prof. dr hab. Dariusz Dziuba prof. dr hab. Jacek Kochanowicz dr hab. Ryszard Kokoszczyński prof. dr hab. Marek Okólski prof. dr hab. Krzysztof Opolski dr hab. Wojciech Otto prof. dr hab. Jerzy Wilkin w serii ukazały się m.in. Michał Brzozowski, Paweł Gierałtowski, Dominika Milczarek, Joanna Siwińska-Gorzelak Instytucje a polityka makroekonomiczna i wzrost gospodarczy Katarzyna Metelska-Szaniawska Konstytucyjne czynniki reform gospodarczych w krajach postsocjalistycznych Studium empiryczne Stanisław Kubielas Innowacje i luka technologiczna w gospodarce globalnej opartej na wiedzy Strukturalne i makroekonomiczne uwarunkowania Katarzyna Kowalska Koordynowana opieka zdrowotna. Doświadczenia polskie i międzynarodowe Wiktor Rutkowski Współczesne państwo dobrobytu. Ekspansja, kryzys, spory Łukasz Hardt Ekonomia kosztów transakcyjnych – geneza i kierunki rozwoju Ewa Aksman Redystrybucja dochodów i jej wpływ na dobrobyt społeczny w Polsce w latach 1995–2007 Joanna Tyrowicz Histereza bezrobocia w Polsce Agnieszka Fihel Płeć a trwanie życia. Analiza demograficzna Gabriela Grotkowska Czy Polska importuje bezrobocie? O wpływie handlu zagranicznego na polski rynek pracy w okresie transformacji Katarzyna Śledziewska Regionalizm handlowy w XXI wieku. Przesłanki teoretyczne i analiza empiryczna Tomasz Łyziak Oczekiwania inflacyjne konsumentów: pomiar i testowanie ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== BADANIA EKONOMICZNE Paweł Strawiński Propensity Score Matching Własności małopróbkowe Warszawa 2014 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Recenzent dr hab. Adam Szulc Projekt okładki i stron tytułowych Frycz/Wicha/corporate design Edwin Radzikowski Redaktor prowadz ˛acy Małgorzata Yamazaki Redakcja Krystyna Dziewanowska-Stefa´nczyk Skład i łamanie Fixpoint c(cid:13) Copyright by Wydawnictwa Uniwersytetu Warszawskiego, Warszawa 2014 ISBN 978-83-235-1696-5 (PDF) Wydawnictwa Uniwersytetu Warszawskiego 00-497 Warszawa, ul. Nowy ´Swiat 4 www.wuw.pl; e-mail: wuw@uw.edu.pl Dział Handlowy WUW: tel. (48 22) 55-31-333; e-mail: dz.handlowy@uw.edu.pl Ksi˛egarnia internetowa: www.wuw.pl/ksiegarnia Wydanie I ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Spis tre´sci Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1. Efekty oddziaływania i ł ˛aczenie danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Fundamenty analizy kontrfaktycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Ł ˛aczenie danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1. Statystyczna metoda ł ˛aczenia . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2. Propensity Score Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4. Algorytmy ł ˛aczenia u˙zywaj ˛ace propensity score . . . . . . . . . . . . . . . . . . 1.4.1. Dobieranie najbli˙zszego s ˛asiada . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . . 1.4.3. Kilka słów o weryfikacji zało˙ze´n . . . . . . . . . . . . . . . . . . . . . . . . 1.5. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 14 21 24 29 43 45 47 48 52 2. Własno´sci małopróbkowe estymatorów metody ł ˛aczenia . . . . . . . . . . . . . 2.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1. Wybór prac o własno´sciach małopróbkowych PSM . . . . . . . . . 2.1.2. Wymuszanie wspólnej cz˛e´sci przedziału okre´slono´sci . . . . . . . 2.1.3. Opis symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.4. Rozmiar i moc symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Szacowanie przeci˛etnych efektów oddziaływania . . . . . . . . . . . . . . . . . 2.2.1. Ł ˛aczenie 1 do 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . . 2.3. Szacowanie przeci˛etnych efektów oddziaływania wobec jednostek 95 poddanych oddziaływaniu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Ł ˛aczenie 1 do 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 2.3.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . . 107 2.4. Podsumowanie wyników symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 56 56 57 60 62 69 75 76 90 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 6 Spis tre´sci 3. Zastosowania Propensity Score Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.2. Oszacowanie wpływu szkole´n zawodowych na zarobki . . . . . . . . . . . . 116 3.3. Opłacalno´s´c strategii dochodowych na polskiej wsi . . . . . . . . . . . . . . . 126 3.4. Ocena skuteczno´sci subsydiowanych miejsc pracy . . . . . . . . . . . . . . . . 137 3.5. Prywatne a publiczne szkoły w Hiszpanii . . . . . . . . . . . . . . . . . . . . . . . . 145 3.6. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Aneks. Angielsko-polski słownik terminów specjalistycznych . . . . . . . . . . . . 159 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 Spis rysunków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywaj ˛a co- raz wi˛eksz ˛a popularno´s´c i uznanie badaczy. Jest to zwi ˛azane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych. Mikroekonometria to grupa metod przeznaczona do analizy mikroda- nych. Współcze´snie mikrodane, czyli dane jednostkowe, s ˛a gromadzone w wielu dziedzinach gospodarki takich jak finanse, ubezpieczenia, rynek pracy czy badanie zachowania gospodarstw domowych. Jednym z obszarów analiz ilo´sciowych prowadzonych na poziomie mikro jest analiza skuteczno´sci działa´n podejmowanych przez instytucje publiczne. Dotyczy to przede wszystkim ró˙znych form wsparcia takich jak szkolenia podnosz ˛ace kwalifikacje pracowników, szkolenia dla osób bezrobotnych czy programy wsparcia dla firm. Z reguły takie działania s ˛a skierowane do specyficznych grup odbiorców. Wyst˛epuj ˛ace zjawisko selekcji lub samoselekcji próby uniemo˙zliwia przeprowadzenie ilo´scio- wej oceny skuteczno´sci tych działów z wykorzystaniem klasycznych narz˛edzi ekonometrycznych (Strawi´nski 2007). Metoda ł ˛aczenia danych jest narz˛edziem pozwalaj ˛acym na ocen˛e skuteczno´sci podejmowanych działa´n o charakterze programów. Jest to grupa metod, wywodz ˛aca si˛e z nauk eskperymentalnych i przeniesiona na grunt dziedzin nauki, w których prowadzenie w pełni kontrolowanych eksperymentów nie jest mo˙zliwe albo jest w znacznym stopniu ograni- czone. Na przykład, nie jest mo˙zliwe przeprowadzenie eksperymental- nego badania skuteczno´sci leku, który mo˙ze zagra˙za´c zdrowiu lub ˙zyciu (Szulc 2012). Ł ˛aczenie danych pozwala uzyska´c odpowied´z na pytanie, „co by si˛e stało, gdyby”. Nie jest ono pytaniem nowym ani specyficznym ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 8 Wprowadzenie dla nauk ekonomicznych. W naukach eksperymentalnych badacze po- szukuj ˛a na nie odpowiedzi, dokonuj ˛ac serii eksperymentów. W dzie- dzinach, w których nie jest to mo˙zliwe, wykorzystuje si˛e dost˛epny aparat matematyczny do nadania wła´sciwo´sci zbioru eksperymentalnego danym niepochodz ˛acym z eksperymentu. Jedn ˛a z takich metod jest ł ˛aczenie danych. Umo˙zliwia ona przeprowadzenie analizy kontrfaktycz- nej. Jednym ze sposobów ł ˛aczenia danych, który w ostatnich latach uzyskał uznanie badaczy, jest ł ˛aczenie według prawdopodobie´nstwa (ang. Propensity Score Matching). Zastosowanie metody nie ogranicza si˛e do nauk ekonomicznych, jest ona z powodzeniem wykorzystywana w medycynie, naukach politycznych czy naukach rolniczych. Niniejsza ksi ˛a˙zka jest pogł˛ebionym studium własno´sci statystycz- nych estymatorów metody Propensity Score Matching, stosowanych do szacowania przeci˛etnych efektów oddziaływania. Asymptotyczne wła´sciwo´sci estymatorów zostały ju˙z przez badaczy opisane, brakuje natomiast bada´n dotycz ˛acych prób o niewielkiej liczbie obserwacji. Niniejsza ksi ˛a˙zka jest prób ˛a wypełnienia tej luki. Efekty oddziaływania mo˙zna szacowa´c, wykorzystuj ˛ac wiele sposobów. Dwoma najcz˛e´sciej wykorzystywanymi miarami s ˛a przeci˛etny efekt oddziaływania oraz przeci˛etny efekt oddziaływania wobec jednostek poddanych oddziały- waniu. Pierwsza wskazuje, jaki jest efekt działania programu wobec przeci˛etnej jednostki w populacji. Druga miara opisuje efekt działania programu wobec jednostek w tym programie uczestnicz ˛acych. W kon- tek´scie szacowania tych wielko´sci zostan ˛a ukazane wła´sciwo´sci staty- styczne estymatorów uzyskiwanych z wykorzystaniem dwóch metod bazuj ˛acych na oszacowaniach propensity score, czyli prawdopodobie´n- stwa poddania oddziaływaniu. Wspomnianymi metodami b˛ed ˛a ł ˛aczenie danych według prawdopodobie´nstwa oraz wa˙zenie odwrotno´sci ˛a osza- cowania prawdopodobie´nstwa. Pewn ˛a trudno´sci ˛a, która stała przed autorem, jest brak ugruntowanej terminologii w j˛ezyku polskim dotycz ˛acej metod ł ˛aczenia danych. Jedyn ˛a znan ˛a autorowi pozycj ˛a o charakterze akademickim, w której tematyka ł ˛aczenia danych jest omawiania, jest podr˛ecznik Mikroeko- nometria pod redakcj ˛a prof. dr. hab. Marka Gruszczy´nskiego. Kilka lat temu, przed powstaniem pierwszego wydania podr˛ecznika, próbo- ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wprowadzenie 9 wali´smy uzgodni´c jednolite tłumaczenia angloj˛ezycznych terminów. W wielu przypadkach si˛e to udało, jednak drobne ró˙znice pozostały. Przykładem takiej rozbie˙zno´sci jest tłumaczenie na j˛ezyk polski poj˛ecia matching estimation. W podr˛eczniku Mikroekonometria zaproponowano „estymacja przez dopasowanie” (rozdział 9 autorstwa Adama Szulca), ja proponuj˛e „estymacja przez ł ˛aczenie”. Obie propozycje s ˛a dosłownymi tłumaczeniem poj˛ecia matching. Oznacza ono zarówno dopasowywanie, dobieranie, jak i ł ˛aczenie w pary. Wydaje mi si˛e, ˙ze termin „ł ˛aczenie” lepiej oddaje charakter poj˛ecia, gdy˙z jego istot ˛a jest ł ˛aczenie podob- nych obserwacji, najcz˛e´sciej w pary. Ponadto w ekonometrii słowo „dopasowanie” jest kojarzone ze stopniem dopasowania modelu do danych empirycznych. Aby unikn ˛a´c niejasno´sci terminologicznej, na ko´ncu niniejszej ksi ˛a˙zki jest umieszczony zał ˛acznik, w którym zesta- wiono stosowane tłumaczenia na j˛ezyk polski terminów angloj˛ezyczych. Dodatkowo w celu unikni˛ecia zamieszania, w ksi ˛a˙zce obok okre´sle´n polskich pojawiaj ˛a si˛e ich angloj˛ezyczne odpowiedniki. Osobnego komentarza wymaga wyja´snienie tytułu ksi ˛a˙zki. Jego pierwszy człon jest w j˛ezyku angielskim, nie ma bowiem utrwalone- go w literaturze tłumaczenia go na j˛ezyk polski. Moje tłumaczenie „ł ˛aczenie według prawdopodobie´nstwa” stara si˛e odda´c istot˛e metody, jednak nawet dla specjalistów w dziedzinie mikroekonometrii mogłoby by´c niezrozumiałe. W pracy oba poj˛ecia b˛ed ˛a pojawia´c si˛e wymiennie, chocia˙z Propensity Score Matching cz˛e´sciej. Ta sama uwaga dotyczy poj˛ecia propensity score i jego tłumaczenia – „prawdopodobie´nstwo oddziaływania”. Na ksi ˛a˙zk˛e składaj ˛a si˛e trzy rozdziały. Zadaniem pierwszego jest wprowadzenie czytelnika w ´swiat efektów oddziaływania i ł ˛aczenia danych. Ma on charakter teoretycznego przegl ˛adu najwa˙zniejszych prac z literatury dotycz ˛acej analizy kontrfaktycznej i ł ˛aczenia danych. Zaprezentowano fundamenty analizy kontrfaktycznej, które wywodz ˛a si˛e z prac Neymana (1923a i 1923b) i Fishera (1925) na temat rando- mizacji. Opisano dwa podstawowe efekty oddziaływania oraz warunki ich identyfikacji. Opieraj ˛ac si˛e na fundamentalnej pracy Rosenbauma i Rubina (1983), omówiono metod˛e ł ˛aczenia obserwacji oraz propo- zycj˛e autorów wykorzystania propensity score do ł ˛aczenia obserwa- ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 10 Wprowadzenie cji. W dalszej cz˛e´sci rozdziału przedstawiono zało˙zenia i statystyczne wła´sciwo´sci metody Propensity Score Matching w du˙zych próbach. Fragment tej cz˛e´sci bazuje na mojej rozprawie doktorskiej. Warto´sci ˛a dodan ˛a jest zebranie w jednym miejscu wyników najwa˙zniejszych prac z ostatnich 15 lat. Rozdział zamyka prezentacja ró˙znych algorytmów u˙zywanych do ł ˛aczenia danych oraz narz˛edzi diagnostycznych pozwa- laj ˛acych oceni´c jako´s´c uzyskanego ł ˛aczenia. Omówiono ró˙zne warianty algorytmu dobierania najbli˙zszego s ˛asiada – jego zalet ˛a jest szybko´s´c, a wad ˛a niejednoznaczno´s´c. Innym algorytmem jest wa˙zenie odwrotno- ´sci ˛a oszacowania prawdopodobie´nstwa, którego jako´s´c zale˙zy m.in. od jako´sci przyj˛etego modelu dla prawdopodobie´nstwa. Rozdział ko´nczy prezentacja dyskusji naukowej, która toczyła si˛e na pocz ˛atku XXI wieku i dotyczyła zagadnienia, czy wykorzystuj ˛ac metody ł ˛aczenia według prawdopodobie´nstwa, mo˙zna odtworzy´c wyniki eksperymentalne. W rozdziale drugim zaprezentowano wyniki bada´n symulacyjnych nad wła´sciwo´sciami estymatorów metody ł ˛aczenia według prawdopodo- bie´nstwa w małych próbach. Własno´sci metod statystycznych w małych próbach s ˛a kluczowe w praktycznym zastosowaniu narz˛edzi ekonome- trycznych. W konkretnych problemach badawczych, np. w pomiarze efektu interwencji na rynku pracy, badacz zazwyczaj staje przed ocen ˛a ilo´sciowego efektu oddziaływania na podstawie badania o charakterze pilota˙zowym. Cech ˛a charakterystyczn ˛a bada´n pilota˙zowych jest ich niewielka skala, a zatem niewielka liczebno´s´c próby. Wa˙zna jest wi˛ec informacja, czy wła´sciwo´sci statystyczne metod ł ˛aczenia, które udo- wodniono, korzystaj ˛ac z twierdze´n granicznych, s ˛a równie˙z zachowane w próbach o liczebno´sciach zbli˙zonych do liczebno´sci prób rzeczy- wistych. W literaturze brakuje ogólnych prac dotycz ˛acych własno´sci estymatorów metody Propensity Score Matching w małych próbach. W rozdziale zaprezentowano wyniki własnych oryginalnych bada´n sy- mulacyjnych. Struktura eksperymentalnego planu symulacyjnego jest analogiczna do moich wcze´sniejszych prac. Wykorzystany plan eks- perymentalny oraz cz˛e´s´c prezentowanych wyników dla estymatorów przeci˛etnych efektów oddziaływania wobec jednostek poddanych od- działywaniu zostały wcze´sniej opublikowane przeze mnie w artykułach. Cech ˛a odró˙zniaj ˛ac ˛a uzyskane wyniki od wcze´sniejszych rezultatów jest ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wprowadzenie 11 cel badania oraz jego du˙zo szerszy zakres. Analizowano dwa sposoby szacowania efektów oddziaływania oraz wpływ ró˙znych technik wy- muszaj ˛acych spełnienie zało˙ze´n metody Propensity Score Matching na statystyczne własno´sci estymatorów dla efektów oddziaływania. Anali- zowano standardowe miary jako´sci: obci ˛a˙zenie, wariancj˛e i pierwiastek bł˛edu ´sredniokwadratowego estymatora. Nowym elementem niewyst˛e- puj ˛acym we wcze´sniejszych pracach s ˛a analizy rozmiaru procedury ł ˛aczenia i mocy testów istotno´sci estymatora oszacowanej warto´sci efektu oddziaływania. Celem trzeciego rozdziału jest próba prezentacji zastosowa´n i wła- ´sciwo´sci statystycznych omawianych metod zastosowanych do analizy rzeczywistych zbiorów danych. W rozdziale zaprezentowano cztery przykłady. Pierwszy z nich jest oryginalnym badaniem pokazuj ˛acym, w jaki sposób mo˙zna wykorzysta´c dost˛epne dane pochodz ˛ace z Badania Aktywno´sci Ekonomicznej Ludno´sci (BAEL) do oceny skuteczno´sci dodatkowych szkole´n podnosz ˛acych kwalifikacje zawodowe oraz ich wpływu na sytuacj˛e uczestnicz ˛acych w nich pracowników. Pozostałe przykłady zostały zaadaptowane z literatury. Drugi z nich powstał na podstawie artykułu, którego jestem współautorem. W przykładzie s ˛a porównane relatywne korzy´sci dla gospodarstw wiejskich z wyboru strategii dywersyfikacji albo specjalizacji działalno´sci. Trzeci przykład pochodzi z mojego własnego artykułu. S ˛a w nim analizowane dane dotycz ˛ace ameryka´nskiego programu subsydiowanych miejsc pracy. Celem badania jest oszacowanie efektu brutto programu, czyli efektu dla beneficjenta bez uwzgl˛edniania kosztu programu. Ostatni przykład został zaadaptowany z artykułu Vanderberghe’a i Robina (2004). Celem artykułu jest porównanie wpływu umieszczania dzieci w szkołach pry- watnych na ich osi ˛agni˛ecia edukacyjne. W ka˙zdym z przykładów podj˛eto prób˛e oszacowania przeci˛etnego efektu oddziaływania (ATE) oraz przeci˛etnego efektu oddziaływania wobec jednostek poddanych oddziaływaniu (ATT) metod ˛a ł ˛aczenia według oszacowanych warto´sci propensity score oraz metod ˛a prze- wa˙zania według odwrotno´sci oszacowa´n propensity score. Wskazano na dwa wa˙zne wyniki. Po pierwsze, wykorzystanie metod ł ˛aczenia danych przyczynia si˛e do zblilansowania rozkładów cech w grupie ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 12 Wprowadzenie eksperymentalnej i dobranej do niej grupie kontrolnej. Po drugie, nie istnieje jedna uniwersalna i zawsze skuteczna metoda wykorzystania wektorów prawdopodobie´nstwa oddziaływania w małych próbach. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Rozdział 1 Efekty oddziaływania i ł ˛aczenie danych 1.1. Wprowadzenie Metoda ł ˛aczenia według prawdopodobie´nstwa jest jednym ze spo- sobów na szacowanie wielko´sci efektów oddziaływania. Trudno jest zatem opisa´c wła´sciwo´sci tej metody estymacji bez odwoływania si˛e do kontekstu, w jakim znajduje ona zastosowanie. W tym celu zosta- n ˛a zaprezentowane fundamenty analizy kontrfaktycznej. Stanowi ona wa˙zne narz˛edzie wspomagaj ˛ace ilo´sciow ˛a ewaluacj˛e programów. Na- st˛epnie zostan ˛a omówione metody ł ˛aczenia danych oraz metodologiczne i statystyczne uwarunkowania wykorzystania ł ˛aczenia według prawdo- podobie´nstwa. Rozdział zamyka dyskusja, czy wykorzystuj ˛ac metody ł ˛aczenia według prawdopodobie´nstwa, mo˙zna odtworzy´c kontrolowane randomizowane eksperymenty. Za idealn ˛a metod˛e badawcz ˛a, wyznaczaj ˛ac ˛a złoty standard nauki, s ˛a uznawane w pełni kontrolowane randomizowane eksperymenty. S ˛a one domen ˛a nauk eksperymentalnych takich jak fizyka, biologia czy medycyna. W warunkach laboratoryjnych obserwowane jest zachowanie jednostek przydzielonych do grupy eksperymentalnej i identycznych z nimi jednostek przydzielonych do grupy kontrolnej. Na podstawie porównania reakcji na oddziaływanie zaaplikowane jednostkom w gru- pie eksperymentalnej z zachowaniem jednostek w grupie kontrolnej s ˛a wyci ˛agane wnioski dotycz ˛ace efektów oddziaływania. W naukach społecznych przeprowadzenie kontrolowanych eksperymentów na sze- rok ˛a skal˛e nie jest mo˙zliwe. Najbardziej wiarogodne i uznane wyniki w tej dziedzinie pochodz ˛a z bada´n, w których stosowano randomizacj˛e (LaLonde 1986). Termin „randomizacja” wprowadzili do statystyki niezale˙znie Ney- man (1935) i Fisher (1935). Fisher opisuje randomizacj˛e jako „uza- ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 14 Efekty oddziaływania i ł ˛aczenie danych sadnion ˛a podstaw˛e” wnioskowania i „podstawy dla poprawno´sci te- stu [statystycznego]”. Randomizacj ˛a nazywamy losowe przydzielenie jednostek do grupy eksperymentalnej i kontrolnej. Zatem nie ka˙zdy kontrolowany eksperyment jest randomizowany. Nadzór nad warun- kami przeprowadzania eksperymentu i manipulowanie nimi nie musi zapewnia´c efektu randomizacji. Na przykład podczas prób klinicznych nowatorskie leki s ˛a serwowane pacjentom cierpi ˛acym na typ choroby, na który lek ma oddziaływa´c. Zdanie odwrotne, ˙ze ka˙zdy randomizowany eksperyment jest kontrolowany, równie˙z nie jest prawdziwe. Dobrym przykładem jest znany ameryka´nski program wsparcia osób bezrobot- nych National Supported Work Demonstration, w którym uczestników w sposób losowy przydzielano do ró˙znych form aktywizacji zawodowej. Poniewa˙z program był interwencj ˛a na rynku pracy, nie wszystkie jego efekty były kontrolowane, np. nie mo˙zna było oddzieli´c jednostek poddanych ró˙znym formom aktywizacji w sposób zapewniaj ˛acy brak kontaktu mi˛edzy nimi. W celu przeprowadzenia skutecznej randomizacji badanie musi zo- sta´c odpowiednio zaprojektowane. Jednostki poddane eksperymentowi nie musz ˛a by´c homogeniczne, próba eksperymentalna i grupa kontrolna nie musz ˛a by´c próbami losowymi z populacji, ale jednostki musz ˛a by´c w sposób losowy przydzielone do grupy poddanej oddziaływaniu i gru- py kontrolnej (Rosenbaum 2002). Jednak w niektórych przypadkach badacze poszukuj ˛a uzasadnienia empirycznego dla zjawisk, które nie były głównym przedmiotem zainteresowania badania, wykorzystuj ˛ac zgromadzone dane. W takiej sytuacji metody ł ˛aczenia pozwalaj ˛a na przekształcenie danych pochodz ˛acych z bada´n ankietowych w zbiór danych spełniaj ˛acy wszystkie warunki, jakim podlegaj ˛a dane ekspery- mentalne. W literaturze w ten sposób przekształcone zbiory okre´sla si˛e mianem danych quasi-eksperymentalnych. 1.2. Fundamenty analizy kontrfaktycznej Randomizacja jest uwa˙zana za metod˛e wyznaczaj ˛ac ˛a standard oce- ny wpływu efektu oddziaływania danego czynnika czy wprowadzonej interwencji na rezultat. Losowe przydzielenie oddziaływania oznacza, ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 1.2. Fundamenty analizy kontrfaktycznej 15 ˙ze przydział jednostki do grupy eksperymentalnej albo kontrolnej od- bywa si˛e w sposób niezale˙zny od wyniku oddziaływania (Heckman i Vytlacil 2007). Zapewnia on, ˙ze nie b˛ed ˛a wyst˛epowały inne czynniki jednocze´snie wpływaj ˛ace na przydzielenie oddziaływania i wynik jego działania (ang. confounders). Dzieje si˛e tak, gdy˙z wynik działania jest niezale˙zny od przydziału jednostki do konkretnej grupy. Zatem efekt oddziaływania mo˙ze zosta´c oszacowany poprzez proste porównanie jednostek poddanych oddziaływaniu i jemu nie poddanych (Neyman 1923a i 1923b; Pearl 2000). W naukach społecznych, w odró˙znieniu od nauk eksperymental- nych, przeprowadzenie kontrolowanego eksperymentu i wykorzystanie randomizacji w wi˛ekszo´sci przypadków nie jest mo˙zliwe. W pewnych sytuacjach nawet w naukach eksperymentalnych przeprowadzenie eks- perymentu mo˙ze nie by´c mo˙zliwe ze wzgl˛edu na ograniczenia prawne lub powody etyczne. Dobrym przykładem s ˛a ograniczenia w testowaniu klinicznym leków o znacznych efektach ubocznych. Z drugiej strony ocena efektu działania czynnika, np. programu czy prowadzonej polityki wymaga informacji, w jaki sposób jednostka zachowałaby si˛e, gdyby nie została poddana oddziaływaniu tego czynnika. Standardowe ramy analizy kontrfaktycznej i model potencjalnych wyników s ˛a przez ró˙znych autorów ró˙znie przypisywane: Neymanowi (1923a i 1923b), Fisherowi (1925), Royowi (1951), Quandtowi (1972) lub Rubinowi (1973a). Neyman (1923a i 1923b) w pracy dotycz ˛acej ran- domizowanych eksperymentów sformułował problem w j˛ezyku staty- stycznym. Nast˛epnie Roy (1951) zauwa˙zył, ˙ze w badaniach ankietowych (obserwacyjnych) obserwowane s ˛a wył ˛acznie najlepsze dla rozpatry- wanych jednostek wybory. Uzale˙znił on podział jednostek na poddane i niepoddane oddziaływaniu od potencjalnych wyników działania. Mate- matyczne powi ˛azanie obserwowanego wyniku oddziaływania ze ´sredni ˛a wa˙zon ˛a wyniku dla grupy eksperymentalnej i kontrolnej, gdzie wagami s ˛a udziały jednostek z grupy eksperymentalnej i kontrolnej w próbie, jest efektem pracy Quandta (1972). Z kolei Rubin (1973a) stworzył reguł˛e podziału jednostek, która jest niezale˙zna od potencjalnego wyniku. Innymi słowy, przydzielenie do jednostek poddanych albo niepoddanych oddziaływaniu nie zale˙zy od potencjalnego wyniku działania b ˛ad´z braku ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 16 Efekty oddziaływania i ł ˛aczenie danych działania. W celu oszacowania efektu oddziaływania zaproponował on ł ˛aczenia podobnych obserwacji i porównanie ich wyników. Ten sposób analizy jest cz˛esto w literaturze angloj˛ezycznej przypisywany Royowi (1951) oraz Rubinowi (1973b) i opisywany jako model Roya–Rubina. Randomizacja i oddziaływanie ´sci´sle wi ˛a˙z ˛a si˛e z poj˛eciem przyczy- nowo´sci (Strawi´nski 2007). Relacja przyczynowo-skutkowa we współ- czesnej statystyce i ekonometrii jest przedstawiana z zastosowaniem notacji wykorzystuj ˛acej wyniki kontrfaktyczne (ang. counterfactual). W przypadku bada´n nieeksperymentalnych s ˛a one warto´sciami hipote- tycznymi, a zatem nie mo˙zna tych wyników obserwowa´c w rzeczywi- sto´sci. Podstawowymi elementami analizy s ˛a jednostki, oddziaływanie i potencjalne efekty oddziaływania, czyli potencjalne wyniki. Najprost- szym typem oddziaływania, jakiemu mog ˛a by´c poddane jednostki, jest tzw. oddziaływanie binarne, w którym czynnik oddziałuje na jednostk˛e albo na ni ˛a nie oddziałuje. Notacja odnosz ˛aca si˛e do potencjalnych wyników została zapropo- nowana w pracach Neymana (1923a i 1923b) i Fishera (1925), doty- cz ˛acych randomizowanych eksperymentów. Niech zmienna losowa P opisuje dwa wyró˙znione stany: poddania i niepoddania oddziaływaniu. Stan poddania oddziaływaniu oznaczamy Pi = 1 i mówimy wówczas, ˙ze jednostka nale˙zy do grupy eksperymentalnej (ang. treated group). Stan niepoddania oddziaływaniu Pi = 0 nazywamy przynale˙zno´sci ˛a jednostki do grupy niepoddanej oddziaływaniu (ang. non-treated) lub grupy kontrolnej (ang. control treatment). Oczywi´scie role stanu Pi = 0 i Pi = 1 mo˙zna odwróci´c (Heckman, LaLonde i Smith 1999). Zatem wybór stanu Pi = 1 cz˛esto jest arbitralny. W przypadku analiz prowadzonych w naukach społecznych stan Pi = 0 jest w naturalny sposób przypisywany brakowi interwencji. Z tego powodu w literaturze ekonomicznej cz˛esto zamiast o poj˛eciu grupy eksperymentalnej mówi si˛e o grupie jednostek poddanych działaniu programu b ˛ad´z polityki. Dodatkowo przyjmijmy nast˛epuj ˛ace oznaczenia. Niech Y1i b˛edzie wyni- kiem działania w sytuacji, gdy jednostka i jest poddana oddziaływaniu lub nale˙zy do grupy eksperymentalnej, a Y0i to wynik, gdy pozostaje poza wpływem działania lub nale˙zy do grupy pozostaj ˛acej poza progra- mem. W tym miejscu warto dokona´c rozgraniczenia dwóch poj˛e´c: grupa ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Propensity Score Matching
Autor:

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: