Darmowy fragment publikacji:
BADANIA EKONOMICZNE
Paweł Strawiński
Propensity
Score Matching
Własności małopróbkowe
Paweł Strawiński jest adiunktem w Katedrze Statystyki i Ekonometrii Wydziału Nauk Eko-
nomicznych Uniwersytetu Warszawskiego. Jest autorem licznych publikacji naukowych
w czołowych czasopismach polskich i zagranicznych. Jego zainteresowania badawcze
koncentrują się na teorii i zastosowaniu współczesnych technik mikroekonometrycznych –
w szczególności do analizy zagadnień związanych z funkcjonowaniem rynku pracy i rynku
edukacyjnego, a także z interakcjami pomiędzy tymi segmentami gospodarki.
Książka omawia własności statystyczne metody propensity score matching w próbach o
małej liczbie obserwacji. Porównano w niej na gruncie symulacji różne estymatory łączenia
wykorzystujące oszacowanie prawdopodobieństwa oddziaływania (propensity score) w
małych próbach. Analizowano estymatory służące do szacowania przeciętnych efektów
oddziaływania (ATE) oraz przeciętnych efektów oddziaływania wobec jednostek poddanych
oddziaływaniu (ATT). Dla obu efektów porównywano estymatory wykorzystujące łączenie
1 do 1 według prawdopodobieństwa oraz wykorzystujące ważenie obserwacji odwrotnością
oszacowania prawdopodobieństwa poddania oddziaływaniu (propensity score). Pub-
likacja adresowana jest głównie do specjalistów z zakresu metod ilościowych w ekonomii,
zajmujących się ilościową oceną programów.
„Dr Paweł Strawiński jest uznanym, nie tylko w Polsce (o czym świadczą publikacje,
m.in. w prestiżowym czasopiśmie «Economics of Transition»), specjalistą w omawianej
dziedzinie. Znajomość autora współczesnych osiągnięć światowej statystyki i ekonometrii
oraz umiejętność zastosowania ich w praktyce pozwalają przypuszczać, że książkowe
wydanie omawianej pracy może stanowić cenny wkład do polskiej literatury statysty-
czno-ekonometrycznej, jako pierwsza monografia poświęcona estymacji przez łączenie
za pomocą prawdopodobieństwa. Ważnym uzupełnieniem części teoretycznej są
szczegółowo omówione przykłady empiryczne obejmujące cztery różniące się od siebie
dziedziny zastosowań (wpływ szkoleń zawodowych na zarobki, wybór strategii dochodowej
gospodarstw rolników, skuteczność subsydiowania miejsc pracy oraz porównanie wyników
nauczania w szkołach publicznych i prywatnych)”.
(z recenzji dr. hab. Adama Szulca, prof. nadzw. SGH)
P
a
w
e
ł
i
S
t
r
a
w
ń
s
k
i
P
r
o
p
e
n
s
i
t
y
S
c
o
r
e
M
a
t
c
h
n
g
i
www.wuw.pl/ksiegarnia
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
oklad_propensity.indd 1
14-09-03 11:24
Propensity
Score Matching
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Komitet Redakcyjny serii
Przewodnicząca: prof. dr hab. Urszula Sztandar-Sztanderska
Członkowie: prof. dr hab. Dariusz Dziuba
prof. dr hab. Jacek Kochanowicz
dr hab. Ryszard Kokoszczyński
prof. dr hab. Marek Okólski
prof. dr hab. Krzysztof Opolski
dr hab. Wojciech Otto
prof. dr hab. Jerzy Wilkin
w serii ukazały się m.in.
Michał Brzozowski, Paweł Gierałtowski, Dominika Milczarek, Joanna Siwińska-Gorzelak
Instytucje a polityka makroekonomiczna i wzrost gospodarczy
Katarzyna Metelska-Szaniawska
Konstytucyjne czynniki reform gospodarczych w krajach postsocjalistycznych
Studium empiryczne
Stanisław Kubielas
Innowacje i luka technologiczna w gospodarce globalnej opartej na wiedzy
Strukturalne i makroekonomiczne uwarunkowania
Katarzyna Kowalska
Koordynowana opieka zdrowotna. Doświadczenia polskie i międzynarodowe
Wiktor Rutkowski
Współczesne państwo dobrobytu. Ekspansja, kryzys, spory
Łukasz Hardt
Ekonomia kosztów transakcyjnych – geneza i kierunki rozwoju
Ewa Aksman
Redystrybucja dochodów i jej wpływ na dobrobyt społeczny w Polsce w latach 1995–2007
Joanna Tyrowicz
Histereza bezrobocia w Polsce
Agnieszka Fihel
Płeć a trwanie życia. Analiza demograficzna
Gabriela Grotkowska
Czy Polska importuje bezrobocie? O wpływie handlu zagranicznego na polski rynek pracy w okresie
transformacji
Katarzyna Śledziewska
Regionalizm handlowy w XXI wieku. Przesłanki teoretyczne i analiza empiryczna
Tomasz Łyziak
Oczekiwania inflacyjne konsumentów: pomiar i testowanie
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
BADANIA EKONOMICZNE
Paweł Strawiński
Propensity
Score Matching
Własności małopróbkowe
Warszawa 2014
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Recenzent
dr hab. Adam Szulc
Projekt okładki i stron tytułowych
Frycz/Wicha/corporate design
Edwin Radzikowski
Redaktor prowadz ˛acy
Małgorzata Yamazaki
Redakcja
Krystyna Dziewanowska-Stefa´nczyk
Skład i łamanie
Fixpoint
c(cid:13) Copyright by Wydawnictwa Uniwersytetu Warszawskiego, Warszawa 2014
ISBN 978-83-235-1696-5 (PDF)
Wydawnictwa Uniwersytetu Warszawskiego
00-497 Warszawa, ul. Nowy ´Swiat 4
www.wuw.pl; e-mail: wuw@uw.edu.pl
Dział Handlowy WUW: tel. (48 22) 55-31-333; e-mail: dz.handlowy@uw.edu.pl
Ksi˛egarnia internetowa: www.wuw.pl/ksiegarnia
Wydanie I
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Spis tre´sci
Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1. Efekty oddziaływania i ł ˛aczenie danych . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Fundamenty analizy kontrfaktycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Ł ˛aczenie danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1. Statystyczna metoda ł ˛aczenia . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2. Propensity Score Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4. Algorytmy ł ˛aczenia u˙zywaj ˛ace propensity score . . . . . . . . . . . . . . . . . .
1.4.1. Dobieranie najbli˙zszego s ˛asiada . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . .
1.4.3. Kilka słów o weryfikacji zało˙ze´n . . . . . . . . . . . . . . . . . . . . . . . .
1.5. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
13
14
21
24
29
43
45
47
48
52
2. Własno´sci małopróbkowe estymatorów metody ł ˛aczenia . . . . . . . . . . . . .
2.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1. Wybór prac o własno´sciach małopróbkowych PSM . . . . . . . . .
2.1.2. Wymuszanie wspólnej cz˛e´sci przedziału okre´slono´sci . . . . . . .
2.1.3. Opis symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4. Rozmiar i moc symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Szacowanie przeci˛etnych efektów oddziaływania . . . . . . . . . . . . . . . . .
2.2.1. Ł ˛aczenie 1 do 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . .
2.3. Szacowanie przeci˛etnych efektów oddziaływania wobec jednostek
95
poddanych oddziaływaniu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1. Ł ˛aczenie 1 do 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
2.3.2. Wa˙zenie odwrotno´sci ˛a prawdopodobie´nstwa . . . . . . . . . . . . . . 107
2.4. Podsumowanie wyników symulacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
56
56
57
60
62
69
75
76
90
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
6
Spis tre´sci
3. Zastosowania Propensity Score Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.2. Oszacowanie wpływu szkole´n zawodowych na zarobki . . . . . . . . . . . . 116
3.3. Opłacalno´s´c strategii dochodowych na polskiej wsi . . . . . . . . . . . . . . . 126
3.4. Ocena skuteczno´sci subsydiowanych miejsc pracy . . . . . . . . . . . . . . . . 137
3.5. Prywatne a publiczne szkoły w Hiszpanii . . . . . . . . . . . . . . . . . . . . . . . . 145
3.6. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Aneks. Angielsko-polski słownik terminów specjalistycznych . . . . . . . . . . . . 159
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
Spis rysunków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Wprowadzenie
W ostatnich latach metody mikroekonometryczne zdobywaj ˛a co-
raz wi˛eksz ˛a popularno´s´c i uznanie badaczy. Jest to zwi ˛azane przede
wszystkim z rozwojem technik gromadzenia i przetwarzania danych.
Mikroekonometria to grupa metod przeznaczona do analizy mikroda-
nych. Współcze´snie mikrodane, czyli dane jednostkowe, s ˛a gromadzone
w wielu dziedzinach gospodarki takich jak finanse, ubezpieczenia, rynek
pracy czy badanie zachowania gospodarstw domowych.
Jednym z obszarów analiz ilo´sciowych prowadzonych na poziomie
mikro jest analiza skuteczno´sci działa´n podejmowanych przez instytucje
publiczne. Dotyczy to przede wszystkim ró˙znych form wsparcia takich
jak szkolenia podnosz ˛ace kwalifikacje pracowników, szkolenia dla osób
bezrobotnych czy programy wsparcia dla firm. Z reguły takie działania
s ˛a skierowane do specyficznych grup odbiorców. Wyst˛epuj ˛ace zjawisko
selekcji lub samoselekcji próby uniemo˙zliwia przeprowadzenie ilo´scio-
wej oceny skuteczno´sci tych działów z wykorzystaniem klasycznych
narz˛edzi ekonometrycznych (Strawi´nski 2007).
Metoda ł ˛aczenia danych jest narz˛edziem pozwalaj ˛acym na ocen˛e
skuteczno´sci podejmowanych działa´n o charakterze programów. Jest to
grupa metod, wywodz ˛aca si˛e z nauk eskperymentalnych i przeniesiona
na grunt dziedzin nauki, w których prowadzenie w pełni kontrolowanych
eksperymentów nie jest mo˙zliwe albo jest w znacznym stopniu ograni-
czone. Na przykład, nie jest mo˙zliwe przeprowadzenie eksperymental-
nego badania skuteczno´sci leku, który mo˙ze zagra˙za´c zdrowiu lub ˙zyciu
(Szulc 2012).
Ł ˛aczenie danych pozwala uzyska´c odpowied´z na pytanie, „co by
si˛e stało, gdyby”. Nie jest ono pytaniem nowym ani specyficznym
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
8
Wprowadzenie
dla nauk ekonomicznych. W naukach eksperymentalnych badacze po-
szukuj ˛a na nie odpowiedzi, dokonuj ˛ac serii eksperymentów. W dzie-
dzinach, w których nie jest to mo˙zliwe, wykorzystuje si˛e dost˛epny
aparat matematyczny do nadania wła´sciwo´sci zbioru eksperymentalnego
danym niepochodz ˛acym z eksperymentu. Jedn ˛a z takich metod jest
ł ˛aczenie danych. Umo˙zliwia ona przeprowadzenie analizy kontrfaktycz-
nej. Jednym ze sposobów ł ˛aczenia danych, który w ostatnich latach
uzyskał uznanie badaczy, jest ł ˛aczenie według prawdopodobie´nstwa
(ang. Propensity Score Matching). Zastosowanie metody nie ogranicza
si˛e do nauk ekonomicznych, jest ona z powodzeniem wykorzystywana
w medycynie, naukach politycznych czy naukach rolniczych.
Niniejsza ksi ˛a˙zka jest pogł˛ebionym studium własno´sci statystycz-
nych estymatorów metody Propensity Score Matching, stosowanych
do szacowania przeci˛etnych efektów oddziaływania. Asymptotyczne
wła´sciwo´sci estymatorów zostały ju˙z przez badaczy opisane, brakuje
natomiast bada´n dotycz ˛acych prób o niewielkiej liczbie obserwacji.
Niniejsza ksi ˛a˙zka jest prób ˛a wypełnienia tej luki. Efekty oddziaływania
mo˙zna szacowa´c, wykorzystuj ˛ac wiele sposobów. Dwoma najcz˛e´sciej
wykorzystywanymi miarami s ˛a przeci˛etny efekt oddziaływania oraz
przeci˛etny efekt oddziaływania wobec jednostek poddanych oddziały-
waniu. Pierwsza wskazuje, jaki jest efekt działania programu wobec
przeci˛etnej jednostki w populacji. Druga miara opisuje efekt działania
programu wobec jednostek w tym programie uczestnicz ˛acych. W kon-
tek´scie szacowania tych wielko´sci zostan ˛a ukazane wła´sciwo´sci staty-
styczne estymatorów uzyskiwanych z wykorzystaniem dwóch metod
bazuj ˛acych na oszacowaniach propensity score, czyli prawdopodobie´n-
stwa poddania oddziaływaniu. Wspomnianymi metodami b˛ed ˛a ł ˛aczenie
danych według prawdopodobie´nstwa oraz wa˙zenie odwrotno´sci ˛a osza-
cowania prawdopodobie´nstwa.
Pewn ˛a trudno´sci ˛a, która stała przed autorem, jest brak ugruntowanej
terminologii w j˛ezyku polskim dotycz ˛acej metod ł ˛aczenia danych.
Jedyn ˛a znan ˛a autorowi pozycj ˛a o charakterze akademickim, w której
tematyka ł ˛aczenia danych jest omawiania, jest podr˛ecznik Mikroeko-
nometria pod redakcj ˛a prof. dr. hab. Marka Gruszczy´nskiego. Kilka
lat temu, przed powstaniem pierwszego wydania podr˛ecznika, próbo-
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Wprowadzenie
9
wali´smy uzgodni´c jednolite tłumaczenia angloj˛ezycznych terminów.
W wielu przypadkach si˛e to udało, jednak drobne ró˙znice pozostały.
Przykładem takiej rozbie˙zno´sci jest tłumaczenie na j˛ezyk polski poj˛ecia
matching estimation. W podr˛eczniku Mikroekonometria zaproponowano
„estymacja przez dopasowanie” (rozdział 9 autorstwa Adama Szulca), ja
proponuj˛e „estymacja przez ł ˛aczenie”. Obie propozycje s ˛a dosłownymi
tłumaczeniem poj˛ecia matching. Oznacza ono zarówno dopasowywanie,
dobieranie, jak i ł ˛aczenie w pary. Wydaje mi si˛e, ˙ze termin „ł ˛aczenie”
lepiej oddaje charakter poj˛ecia, gdy˙z jego istot ˛a jest ł ˛aczenie podob-
nych obserwacji, najcz˛e´sciej w pary. Ponadto w ekonometrii słowo
„dopasowanie” jest kojarzone ze stopniem dopasowania modelu do
danych empirycznych. Aby unikn ˛a´c niejasno´sci terminologicznej, na
ko´ncu niniejszej ksi ˛a˙zki jest umieszczony zał ˛acznik, w którym zesta-
wiono stosowane tłumaczenia na j˛ezyk polski terminów angloj˛ezyczych.
Dodatkowo w celu unikni˛ecia zamieszania, w ksi ˛a˙zce obok okre´sle´n
polskich pojawiaj ˛a si˛e ich angloj˛ezyczne odpowiedniki.
Osobnego komentarza wymaga wyja´snienie tytułu ksi ˛a˙zki. Jego
pierwszy człon jest w j˛ezyku angielskim, nie ma bowiem utrwalone-
go w literaturze tłumaczenia go na j˛ezyk polski. Moje tłumaczenie
„ł ˛aczenie według prawdopodobie´nstwa” stara si˛e odda´c istot˛e metody,
jednak nawet dla specjalistów w dziedzinie mikroekonometrii mogłoby
by´c niezrozumiałe. W pracy oba poj˛ecia b˛ed ˛a pojawia´c si˛e wymiennie,
chocia˙z Propensity Score Matching cz˛e´sciej. Ta sama uwaga dotyczy
poj˛ecia propensity score i jego tłumaczenia – „prawdopodobie´nstwo
oddziaływania”.
Na ksi ˛a˙zk˛e składaj ˛a si˛e trzy rozdziały. Zadaniem pierwszego jest
wprowadzenie czytelnika w ´swiat efektów oddziaływania i ł ˛aczenia
danych. Ma on charakter teoretycznego przegl ˛adu najwa˙zniejszych
prac z literatury dotycz ˛acej analizy kontrfaktycznej i ł ˛aczenia danych.
Zaprezentowano fundamenty analizy kontrfaktycznej, które wywodz ˛a
si˛e z prac Neymana (1923a i 1923b) i Fishera (1925) na temat rando-
mizacji. Opisano dwa podstawowe efekty oddziaływania oraz warunki
ich identyfikacji. Opieraj ˛ac si˛e na fundamentalnej pracy Rosenbauma
i Rubina (1983), omówiono metod˛e ł ˛aczenia obserwacji oraz propo-
zycj˛e autorów wykorzystania propensity score do ł ˛aczenia obserwa-
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
10
Wprowadzenie
cji. W dalszej cz˛e´sci rozdziału przedstawiono zało˙zenia i statystyczne
wła´sciwo´sci metody Propensity Score Matching w du˙zych próbach.
Fragment tej cz˛e´sci bazuje na mojej rozprawie doktorskiej. Warto´sci ˛a
dodan ˛a jest zebranie w jednym miejscu wyników najwa˙zniejszych prac
z ostatnich 15 lat. Rozdział zamyka prezentacja ró˙znych algorytmów
u˙zywanych do ł ˛aczenia danych oraz narz˛edzi diagnostycznych pozwa-
laj ˛acych oceni´c jako´s´c uzyskanego ł ˛aczenia. Omówiono ró˙zne warianty
algorytmu dobierania najbli˙zszego s ˛asiada – jego zalet ˛a jest szybko´s´c,
a wad ˛a niejednoznaczno´s´c. Innym algorytmem jest wa˙zenie odwrotno-
´sci ˛a oszacowania prawdopodobie´nstwa, którego jako´s´c zale˙zy m.in. od
jako´sci przyj˛etego modelu dla prawdopodobie´nstwa. Rozdział ko´nczy
prezentacja dyskusji naukowej, która toczyła si˛e na pocz ˛atku XXI wieku
i dotyczyła zagadnienia, czy wykorzystuj ˛ac metody ł ˛aczenia według
prawdopodobie´nstwa, mo˙zna odtworzy´c wyniki eksperymentalne.
W rozdziale drugim zaprezentowano wyniki bada´n symulacyjnych
nad wła´sciwo´sciami estymatorów metody ł ˛aczenia według prawdopodo-
bie´nstwa w małych próbach. Własno´sci metod statystycznych w małych
próbach s ˛a kluczowe w praktycznym zastosowaniu narz˛edzi ekonome-
trycznych. W konkretnych problemach badawczych, np. w pomiarze
efektu interwencji na rynku pracy, badacz zazwyczaj staje przed ocen ˛a
ilo´sciowego efektu oddziaływania na podstawie badania o charakterze
pilota˙zowym. Cech ˛a charakterystyczn ˛a bada´n pilota˙zowych jest ich
niewielka skala, a zatem niewielka liczebno´s´c próby. Wa˙zna jest wi˛ec
informacja, czy wła´sciwo´sci statystyczne metod ł ˛aczenia, które udo-
wodniono, korzystaj ˛ac z twierdze´n granicznych, s ˛a równie˙z zachowane
w próbach o liczebno´sciach zbli˙zonych do liczebno´sci prób rzeczy-
wistych. W literaturze brakuje ogólnych prac dotycz ˛acych własno´sci
estymatorów metody Propensity Score Matching w małych próbach.
W rozdziale zaprezentowano wyniki własnych oryginalnych bada´n sy-
mulacyjnych. Struktura eksperymentalnego planu symulacyjnego jest
analogiczna do moich wcze´sniejszych prac. Wykorzystany plan eks-
perymentalny oraz cz˛e´s´c prezentowanych wyników dla estymatorów
przeci˛etnych efektów oddziaływania wobec jednostek poddanych od-
działywaniu zostały wcze´sniej opublikowane przeze mnie w artykułach.
Cech ˛a odró˙zniaj ˛ac ˛a uzyskane wyniki od wcze´sniejszych rezultatów jest
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Wprowadzenie
11
cel badania oraz jego du˙zo szerszy zakres. Analizowano dwa sposoby
szacowania efektów oddziaływania oraz wpływ ró˙znych technik wy-
muszaj ˛acych spełnienie zało˙ze´n metody Propensity Score Matching na
statystyczne własno´sci estymatorów dla efektów oddziaływania. Anali-
zowano standardowe miary jako´sci: obci ˛a˙zenie, wariancj˛e i pierwiastek
bł˛edu ´sredniokwadratowego estymatora. Nowym elementem niewyst˛e-
puj ˛acym we wcze´sniejszych pracach s ˛a analizy rozmiaru procedury
ł ˛aczenia i mocy testów istotno´sci estymatora oszacowanej warto´sci
efektu oddziaływania.
Celem trzeciego rozdziału jest próba prezentacji zastosowa´n i wła-
´sciwo´sci statystycznych omawianych metod zastosowanych do analizy
rzeczywistych zbiorów danych. W rozdziale zaprezentowano cztery
przykłady. Pierwszy z nich jest oryginalnym badaniem pokazuj ˛acym,
w jaki sposób mo˙zna wykorzysta´c dost˛epne dane pochodz ˛ace z Badania
Aktywno´sci Ekonomicznej Ludno´sci (BAEL) do oceny skuteczno´sci
dodatkowych szkole´n podnosz ˛acych kwalifikacje zawodowe oraz ich
wpływu na sytuacj˛e uczestnicz ˛acych w nich pracowników. Pozostałe
przykłady zostały zaadaptowane z literatury. Drugi z nich powstał na
podstawie artykułu, którego jestem współautorem. W przykładzie s ˛a
porównane relatywne korzy´sci dla gospodarstw wiejskich z wyboru
strategii dywersyfikacji albo specjalizacji działalno´sci. Trzeci przykład
pochodzi z mojego własnego artykułu. S ˛a w nim analizowane dane
dotycz ˛ace ameryka´nskiego programu subsydiowanych miejsc pracy.
Celem badania jest oszacowanie efektu brutto programu, czyli efektu
dla beneficjenta bez uwzgl˛edniania kosztu programu. Ostatni przykład
został zaadaptowany z artykułu Vanderberghe’a i Robina (2004). Celem
artykułu jest porównanie wpływu umieszczania dzieci w szkołach pry-
watnych na ich osi ˛agni˛ecia edukacyjne.
W ka˙zdym z przykładów podj˛eto prób˛e oszacowania przeci˛etnego
efektu oddziaływania (ATE) oraz przeci˛etnego efektu oddziaływania
wobec jednostek poddanych oddziaływaniu (ATT) metod ˛a ł ˛aczenia
według oszacowanych warto´sci propensity score oraz metod ˛a prze-
wa˙zania według odwrotno´sci oszacowa´n propensity score. Wskazano
na dwa wa˙zne wyniki. Po pierwsze, wykorzystanie metod ł ˛aczenia
danych przyczynia si˛e do zblilansowania rozkładów cech w grupie
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
12
Wprowadzenie
eksperymentalnej i dobranej do niej grupie kontrolnej. Po drugie, nie
istnieje jedna uniwersalna i zawsze skuteczna metoda wykorzystania
wektorów prawdopodobie´nstwa oddziaływania w małych próbach.
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Rozdział 1
Efekty oddziaływania i ł ˛aczenie danych
1.1. Wprowadzenie
Metoda ł ˛aczenia według prawdopodobie´nstwa jest jednym ze spo-
sobów na szacowanie wielko´sci efektów oddziaływania. Trudno jest
zatem opisa´c wła´sciwo´sci tej metody estymacji bez odwoływania si˛e
do kontekstu, w jakim znajduje ona zastosowanie. W tym celu zosta-
n ˛a zaprezentowane fundamenty analizy kontrfaktycznej. Stanowi ona
wa˙zne narz˛edzie wspomagaj ˛ace ilo´sciow ˛a ewaluacj˛e programów. Na-
st˛epnie zostan ˛a omówione metody ł ˛aczenia danych oraz metodologiczne
i statystyczne uwarunkowania wykorzystania ł ˛aczenia według prawdo-
podobie´nstwa. Rozdział zamyka dyskusja, czy wykorzystuj ˛ac metody
ł ˛aczenia według prawdopodobie´nstwa, mo˙zna odtworzy´c kontrolowane
randomizowane eksperymenty.
Za idealn ˛a metod˛e badawcz ˛a, wyznaczaj ˛ac ˛a złoty standard nauki,
s ˛a uznawane w pełni kontrolowane randomizowane eksperymenty. S ˛a
one domen ˛a nauk eksperymentalnych takich jak fizyka, biologia czy
medycyna. W warunkach laboratoryjnych obserwowane jest zachowanie
jednostek przydzielonych do grupy eksperymentalnej i identycznych
z nimi jednostek przydzielonych do grupy kontrolnej. Na podstawie
porównania reakcji na oddziaływanie zaaplikowane jednostkom w gru-
pie eksperymentalnej z zachowaniem jednostek w grupie kontrolnej
s ˛a wyci ˛agane wnioski dotycz ˛ace efektów oddziaływania. W naukach
społecznych przeprowadzenie kontrolowanych eksperymentów na sze-
rok ˛a skal˛e nie jest mo˙zliwe. Najbardziej wiarogodne i uznane wyniki
w tej dziedzinie pochodz ˛a z bada´n, w których stosowano randomizacj˛e
(LaLonde 1986).
Termin „randomizacja” wprowadzili do statystyki niezale˙znie Ney-
man (1935) i Fisher (1935). Fisher opisuje randomizacj˛e jako „uza-
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
14
Efekty oddziaływania i ł ˛aczenie danych
sadnion ˛a podstaw˛e” wnioskowania i „podstawy dla poprawno´sci te-
stu [statystycznego]”. Randomizacj ˛a nazywamy losowe przydzielenie
jednostek do grupy eksperymentalnej i kontrolnej. Zatem nie ka˙zdy
kontrolowany eksperyment jest randomizowany. Nadzór nad warun-
kami przeprowadzania eksperymentu i manipulowanie nimi nie musi
zapewnia´c efektu randomizacji. Na przykład podczas prób klinicznych
nowatorskie leki s ˛a serwowane pacjentom cierpi ˛acym na typ choroby, na
który lek ma oddziaływa´c. Zdanie odwrotne, ˙ze ka˙zdy randomizowany
eksperyment jest kontrolowany, równie˙z nie jest prawdziwe. Dobrym
przykładem jest znany ameryka´nski program wsparcia osób bezrobot-
nych National Supported Work Demonstration, w którym uczestników
w sposób losowy przydzielano do ró˙znych form aktywizacji zawodowej.
Poniewa˙z program był interwencj ˛a na rynku pracy, nie wszystkie jego
efekty były kontrolowane, np. nie mo˙zna było oddzieli´c jednostek
poddanych ró˙znym formom aktywizacji w sposób zapewniaj ˛acy brak
kontaktu mi˛edzy nimi.
W celu przeprowadzenia skutecznej randomizacji badanie musi zo-
sta´c odpowiednio zaprojektowane. Jednostki poddane eksperymentowi
nie musz ˛a by´c homogeniczne, próba eksperymentalna i grupa kontrolna
nie musz ˛a by´c próbami losowymi z populacji, ale jednostki musz ˛a by´c
w sposób losowy przydzielone do grupy poddanej oddziaływaniu i gru-
py kontrolnej (Rosenbaum 2002). Jednak w niektórych przypadkach
badacze poszukuj ˛a uzasadnienia empirycznego dla zjawisk, które nie
były głównym przedmiotem zainteresowania badania, wykorzystuj ˛ac
zgromadzone dane. W takiej sytuacji metody ł ˛aczenia pozwalaj ˛a na
przekształcenie danych pochodz ˛acych z bada´n ankietowych w zbiór
danych spełniaj ˛acy wszystkie warunki, jakim podlegaj ˛a dane ekspery-
mentalne. W literaturze w ten sposób przekształcone zbiory okre´sla si˛e
mianem danych quasi-eksperymentalnych.
1.2. Fundamenty analizy kontrfaktycznej
Randomizacja jest uwa˙zana za metod˛e wyznaczaj ˛ac ˛a standard oce-
ny wpływu efektu oddziaływania danego czynnika czy wprowadzonej
interwencji na rezultat. Losowe przydzielenie oddziaływania oznacza,
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
1.2. Fundamenty analizy kontrfaktycznej
15
˙ze przydział jednostki do grupy eksperymentalnej albo kontrolnej od-
bywa si˛e w sposób niezale˙zny od wyniku oddziaływania (Heckman
i Vytlacil 2007). Zapewnia on, ˙ze nie b˛ed ˛a wyst˛epowały inne czynniki
jednocze´snie wpływaj ˛ace na przydzielenie oddziaływania i wynik jego
działania (ang. confounders). Dzieje si˛e tak, gdy˙z wynik działania jest
niezale˙zny od przydziału jednostki do konkretnej grupy. Zatem efekt
oddziaływania mo˙ze zosta´c oszacowany poprzez proste porównanie
jednostek poddanych oddziaływaniu i jemu nie poddanych (Neyman
1923a i 1923b; Pearl 2000).
W naukach społecznych, w odró˙znieniu od nauk eksperymental-
nych, przeprowadzenie kontrolowanego eksperymentu i wykorzystanie
randomizacji w wi˛ekszo´sci przypadków nie jest mo˙zliwe. W pewnych
sytuacjach nawet w naukach eksperymentalnych przeprowadzenie eks-
perymentu mo˙ze nie by´c mo˙zliwe ze wzgl˛edu na ograniczenia prawne
lub powody etyczne. Dobrym przykładem s ˛a ograniczenia w testowaniu
klinicznym leków o znacznych efektach ubocznych. Z drugiej strony
ocena efektu działania czynnika, np. programu czy prowadzonej polityki
wymaga informacji, w jaki sposób jednostka zachowałaby si˛e, gdyby nie
została poddana oddziaływaniu tego czynnika.
Standardowe ramy analizy kontrfaktycznej i model potencjalnych
wyników s ˛a przez ró˙znych autorów ró˙znie przypisywane: Neymanowi
(1923a i 1923b), Fisherowi (1925), Royowi (1951), Quandtowi (1972)
lub Rubinowi (1973a). Neyman (1923a i 1923b) w pracy dotycz ˛acej ran-
domizowanych eksperymentów sformułował problem w j˛ezyku staty-
stycznym. Nast˛epnie Roy (1951) zauwa˙zył, ˙ze w badaniach ankietowych
(obserwacyjnych) obserwowane s ˛a wył ˛acznie najlepsze dla rozpatry-
wanych jednostek wybory. Uzale˙znił on podział jednostek na poddane
i niepoddane oddziaływaniu od potencjalnych wyników działania. Mate-
matyczne powi ˛azanie obserwowanego wyniku oddziaływania ze ´sredni ˛a
wa˙zon ˛a wyniku dla grupy eksperymentalnej i kontrolnej, gdzie wagami
s ˛a udziały jednostek z grupy eksperymentalnej i kontrolnej w próbie, jest
efektem pracy Quandta (1972). Z kolei Rubin (1973a) stworzył reguł˛e
podziału jednostek, która jest niezale˙zna od potencjalnego wyniku.
Innymi słowy, przydzielenie do jednostek poddanych albo niepoddanych
oddziaływaniu nie zale˙zy od potencjalnego wyniku działania b ˛ad´z braku
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
16
Efekty oddziaływania i ł ˛aczenie danych
działania. W celu oszacowania efektu oddziaływania zaproponował on
ł ˛aczenia podobnych obserwacji i porównanie ich wyników. Ten sposób
analizy jest cz˛esto w literaturze angloj˛ezycznej przypisywany Royowi
(1951) oraz Rubinowi (1973b) i opisywany jako model Roya–Rubina.
Randomizacja i oddziaływanie ´sci´sle wi ˛a˙z ˛a si˛e z poj˛eciem przyczy-
nowo´sci (Strawi´nski 2007). Relacja przyczynowo-skutkowa we współ-
czesnej statystyce i ekonometrii jest przedstawiana z zastosowaniem
notacji wykorzystuj ˛acej wyniki kontrfaktyczne (ang. counterfactual).
W przypadku bada´n nieeksperymentalnych s ˛a one warto´sciami hipote-
tycznymi, a zatem nie mo˙zna tych wyników obserwowa´c w rzeczywi-
sto´sci. Podstawowymi elementami analizy s ˛a jednostki, oddziaływanie
i potencjalne efekty oddziaływania, czyli potencjalne wyniki. Najprost-
szym typem oddziaływania, jakiemu mog ˛a by´c poddane jednostki, jest
tzw. oddziaływanie binarne, w którym czynnik oddziałuje na jednostk˛e
albo na ni ˛a nie oddziałuje.
Notacja odnosz ˛aca si˛e do potencjalnych wyników została zapropo-
nowana w pracach Neymana (1923a i 1923b) i Fishera (1925), doty-
cz ˛acych randomizowanych eksperymentów. Niech zmienna losowa P
opisuje dwa wyró˙znione stany: poddania i niepoddania oddziaływaniu.
Stan poddania oddziaływaniu oznaczamy Pi = 1 i mówimy wówczas,
˙ze jednostka nale˙zy do grupy eksperymentalnej (ang. treated group).
Stan niepoddania oddziaływaniu Pi = 0 nazywamy przynale˙zno´sci ˛a
jednostki do grupy niepoddanej oddziaływaniu (ang. non-treated) lub
grupy kontrolnej (ang. control treatment). Oczywi´scie role stanu Pi = 0
i Pi = 1 mo˙zna odwróci´c (Heckman, LaLonde i Smith 1999). Zatem
wybór stanu Pi = 1 cz˛esto jest arbitralny. W przypadku analiz
prowadzonych w naukach społecznych stan Pi = 0 jest w naturalny
sposób przypisywany brakowi interwencji. Z tego powodu w literaturze
ekonomicznej cz˛esto zamiast o poj˛eciu grupy eksperymentalnej mówi
si˛e o grupie jednostek poddanych działaniu programu b ˛ad´z polityki.
Dodatkowo przyjmijmy nast˛epuj ˛ace oznaczenia. Niech Y1i b˛edzie wyni-
kiem działania w sytuacji, gdy jednostka i jest poddana oddziaływaniu
lub nale˙zy do grupy eksperymentalnej, a Y0i to wynik, gdy pozostaje
poza wpływem działania lub nale˙zy do grupy pozostaj ˛acej poza progra-
mem. W tym miejscu warto dokona´c rozgraniczenia dwóch poj˛e´c: grupa
##7#52#aSUZPUk1BVC1WaXJ0dWFsbw==
Pobierz darmowy fragment (pdf)