Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00434 005919 12420447 na godz. na dobę w sumie
Mikroekonometria. Modele i metody analizy danych indywidualnych - ebook/pdf
Mikroekonometria. Modele i metody analizy danych indywidualnych - ebook/pdf
Autor: , , Liczba stron:
Wydawca: Wolters Kluwer Język publikacji: polski
ISBN: 978-83-264-5184-3 Data wydania:
Lektor:
Kategoria: ebooki >> biznes >> ekonomia
Porównaj ceny (książka, ebook, audiobook).
Mikroekonometria jest pierwszym w Polsce podręcznikiem analizy mikrodanych dotyczących zagadnień ekonomicznych, finansowych i społecznych. Coraz większy popyt na analizy mikrodanych odnotowuje się w marketingu, w finansach, w zarządzaniu, w badaniach mikro- i makroekonomicznych, a także w innych naukach społecznych. Przykładowe zastosowania omawianych modeli obejmują: * badanie zdolności kredytowej, * prognozowanie odejść klientów i bankructw firm, * wybór grup docelowych do kampanii bezpośrednich, * badanie preferencji klientów względem marek, * modelowanie szkód i wypłat ubezpieczeniowych. Obok przeglądu modeli i metod książka zawiera liczne przykłady i ćwiczenia. Jest przeznaczona do studiowania mikroekonometrii przez studentów uczelni ekonomicznych oraz praktyków-analityków interesujących się analizą mikrodanych. Drugie wydanie Mikroekonometrii zostało rozszerzone o rozdziały poświęcone modelom dla danych panelowych oraz szacowaniu efektów oddziaływania za pomocą estymacji przez dopasowanie (matching}. Autorzy książki związani są z Instytutem Ekonometrii oraz z Instytutem Statystyki i Demografii w Szkole Głównej Handlowej w Warszawie, zwłaszcza z Zakładem Ekonometrii Stosowanej kierowanym przez redaktora naukowego książki profesora Marka Gruszczyńskiego. Jest to publikacja bardzo potrzebna, wypełniająca luką na polskim rynku wydawnictw naukowych w zakresie podręcznika metod ekonometrycznych stosowanych do analizy mikrodanych.' Z recenzji profesor Krystyny Strzały
Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

Recenzent Prof. UG dr hab. Krystyna Strzała Wydawca Monika Pawłowska Redaktor prowadzący Ewa Fonkowicz Opracowanie redakcyjne Justyna Łęczyńska Łamanie Sławomir Sobczyk Projekt graficzny okładki i zdjęcie Barbara Widłak Autorzy: Monika Bazyl – rozdział 7 i p. 3.6 Marek Gruszczyński – rozdziały 1 i 3 Monika Książek – rozdział 4 Marcin Owczarczuk – rozdziały 2 (p. 2.1–2.4) i 6 Adam Szulc – rozdział 9 Arkadiusz Wiśniowski – rozdziały 2 (p. 2.1) i 5 Bartosz Witkowski – rozdział 8 © Copyright by Wolters Kluwer Polska Sp. z o.o., 2012 ISBN: 978-83-264-3775-5 wydanie 2. rozszerzone Wydane przez: Wolters Kluwer Polska Sp. z o.o. Redakcja Książek 01-231 Warszawa, ul. Płocka 5a tel. 22 535 82 00, fax 22 535 81 35 e-mail: ksiazki@wolterskluwer.pl www.wolterskluwer.pl księgarnia internetowa www.profinfo.pl Spis treści Wstęp 1 Wprowadzenie do mikroekonometrii 1.1 Mikrodane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Obszar mikroekonometrii, tradycje i piśmiennictwo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Modele mikroekonometrii 1.4 Główne zagadnienia mikroekonometrii . . . . . . . . . . . . . . . . . . 1.4.1 Ekonomia a strategia modelowania w mikroekonometrii . . . . 1.4.2 Założenia modelu regresji dla danych przekrojowych . . . . . . 1.4.3 Korelacja a przyczynowość. Relacje przyczynowe a analiza ceteris paribus . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.4 Efekty oddziaływania . . . . . . . . . . . . . . . . . . . . . . . 1.4.5 Endogeniczność . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.6 Heterogeniczność . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.7 Skokowość, nieliniowość, zawartość informacyjna zbiorów mikrodanych . . . . . . . . . . . . . . . . . . . . . . . 1.4.8 Zbieranie danych . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.9 Nowe wyzwania dla mikroekonometrii . . . . . . . . . . . . . . 1.5 Ekonometria przestrzenna a mikroekonometria . . . . . . . . . . . . . 1.6 Mikroekonometria na salonach: Heckman i McFadden . . . . . . . . . 1.7 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Metody i modele 2.1 Metoda największej wiarygodności . . . . . . . . . . . . . . . . . . . . 2.1.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 15 15 17 19 21 21 23 24 26 28 29 32 32 38 38 40 42 43 45 45 45 5 Spis treści 2.1.2 Przykład. Moneta . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Definicja estymatora metody największej wiarygodności . . . . 2.1.4 Przykład. MNW-estymator wartości oczekiwanej rozkładu nor- malnego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.5 M-estymatory . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.6 Teoretyczne własności metody największej wiarygodności . . . 2.1.7 Testy statystyczne zbudowane na podstawie metody największej wiarygodności . . . . . . . . . . . . . . . . 2.1.8 Optymalizacja . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.9 Nieliniowa metoda najmniejszych kwadratów . . . . . . . . . . 2.1.10 Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Problem wielokrotnego testowania hipotez . . . . . . . . . . . . . . . . 2.3 Sprawdzanie trafności prognoz . . . . . . . . . . . . . . . . . . . . . . 2.4 Modele ze zmienną ukrytą . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Model tobitowy . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Model dwumianowy . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 Model uporządkowanej zmiennej wielomianowej . . . . . . . . . 2.4.5 Modele czasów trwania . . . . . . . . . . . . . . . . . . . . . . 2.5 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Modele zmiennych jakościowych dwumianowych Intuicyjne objaśnienie modeli zmiennych dwumianowych 3.1 Zmienne dwumianowe jako przedmiot modelowania . . . . . . . . . . . 3.1.1 Cele modelowania zmiennej dwumianowej . . . . . . . . . . . . 3.1.2 Model dwumianowy . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Związek Y ze zmiennymi objaśniającymi X . . . . . . . . . . . 3.1.4 . . . 3.1.5 Główne typy modeli zmiennych dwumianowych . . . . . . . . . 3.2 Liniowy model prawdopodobieństwa . . . . . . . . . . . . . . . . . . . 3.2.1 Uwagi o R-kwadrat w mikroekonometrii . . . . . . . . . . . . . 3.3 Model logitowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 MNW dla modelu logitowego . . . . . . . . . . . . . . . . . . . 3.3.2 Weryfikacja statystyczna . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Interpretacja wyników: efekty krańcowe (MEM, MER, AME) . . . . . . . . . . . . . . . . . . . . . . . . Interpretacja wyników: ilorazy szans . . . . . . . . . . . . . . . 3.4 Model probitowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 3.4.1 Logit, probit, LMP: relacja między parametrami oraz między efektami krańcowymi . . . . . . . . . . . . . . . . 3.5 Endogeniczność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Miary dopasowania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 46 47 48 48 50 52 54 56 57 58 61 63 63 64 65 66 67 68 68 71 71 72 73 74 74 75 76 80 80 81 82 83 85 87 88 89 89 Spis treści 3.6.1 Pseudo-R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 91 3.6.2 Tablica trafności oraz krzywa ROC . . . . . . . . . . . . . . . . 97 3.7 Dobór zmiennych objaśniających do modeli . . . . . . . . . . . . . . . 98 3.8 Modelowanie interakcji . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9 Regresja binarna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 3.10 Próba dobierana w modelu logitowym . . . . . . . . . . . . . . . . . . 103 3.11 Model logitowy dla makrodanych . . . . . . . . . . . . . . . . . . . . . 105 3.12 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.13 Problemy i zadania 4 Modele zmiennych wielomianowych uporządkowanych 123 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 4.1 Wprowadzenie 4.2 Zmienne uporządkowane . . . . . . . . . . . . . . . . . . . . . . . . . . 125 4.3 Specyfikacja modelu uporządkowanego . . . . . . . . . . . . . . . . . . 128 4.4 Szacowanie modelu uporządkowanego . . . . . . . . . . . . . . . . . . 132 4.5 Uporządkowany model probitowy i logitowy . . . . . . . . . . . . . . . 134 4.6 Założenie proporcjonalnych szans/regresji równoległych . . . . . . . . 139 4.7 Weryfikacja założenia proporcjonalnych szans . . . . . . . . . . . . . . 143 4.8 Uogólniony model uporządkowany . . . . . . . . . . . . . . . . . . . . 146 4.9 Model częściowo proporcjonalnych szans . . . . . . . . . . . . . . . . . 148 4.10 Problem rzadkich danych . . . . . . . . . . . . . . . . . . . . . . . . . 149 4.11 Ocena jakości modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 4.11.1 Ocena dopasowania modelu . . . . . . . . . . . . . . . . . . . . 154 4.11.2 Ocena zdolności predykcyjnych modelu . . . . . . . . . . . . . 161 4.12 Interpretacja parametrów . . . . . . . . . . . . . . . . . . . . . . . . . 164 4.12.1 Efekt kompensujący . . . . . . . . . . . . . . . . . . . . . . . . 164 4.12.2 Efekty krańcowe . . . . . . . . . . . . . . . . . . . . . . . . . . 165 4.12.3 Iloraz szans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 4.13.1 Specyfikacja modelu . . . . . . . . . . . . . . . . . . . . . . . . 173 4.13.2 Estymacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 4.14 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 4.15 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 4.13 Dane sekwencyjne 5 Modele zmiennych wielomianowych nieuporządkowanych 185 5.1 Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 5.2 Wprowadzenie do modeli wielomianowych . . . . . . . . . . . . . . . . 187 5.3 Zmienne egzogeniczne w modelach dla kategorii nieuporządkowanych . 190 5.4 Model stochastycznej addytywnej użyteczności . . . . . . . . . . . . . 191 5.5 Wielomianowy model logitowy . . . . . . . . . . . . . . . . . . . . . . 192 5.5.1 Konstrukcja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 5.5.2 Estymacja i ocena jakości modelu . . . . . . . . . . . . . . . . . 193 7 Spis treści 5.5.3 Interpretacja wyników estymacji Interpretacja wyników estymacji . . . . . . . . . . . . . . . . . 197 5.6 Warunkowy model logitowy . . . . . . . . . . . . . . . . . . . . . . . . 204 5.6.1 Konstrukcja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 5.6.2 Estymacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 5.6.3 . . . . . . . . . . . . . . . . . 210 5.7 Logitowy model zagnieżdżony . . . . . . . . . . . . . . . . . . . . . . . 213 5.7.1 Niezależność od nieistotnych możliwości . . . . . . . . . . . . . 213 5.7.2 Konstrukcja zagnieżdżonego modelu logitowego . . . . . . . . . 215 Inne modele wyborów dyskretnych . . . . . . . . . . . . . . . . 219 5.7.3 5.8 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 5.9 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 6 Modele zmiennych ograniczonych 225 6.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 6.2 Model tobitowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 6.3 Podstawowe własności modelu . . . . . . . . . . . . . . . . . . . . . . . 228 6.4 Estymacja za pomocą metody największej wiarygodności . . . . . . . 231 6.5 Testy istotności i miary dopasowania dla modeli zmiennych ograniczonych232 6.6 Regresja ucięta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 6.7 Semiparametryczne estymatory modeli regresji tobitowej i uciętej . . . 237 6.8 Modele selekcji próby . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 6.9 Estymacja modelu selekcji próby Heckmana . . . . . . . . . . . . . . . 240 6.10 Modele zmiennych ograniczonych w praktyce: datki charytatywne . . . 242 6.10.1 Regresja tobitowa i ucięta . . . . . . . . . . . . . . . . . . . . . 242 6.10.2 Model selekcji próby . . . . . . . . . . . . . . . . . . . . . . . . 245 6.11 Przykład. Wypłacanie dywidend . . . . . . . . . . . . . . . . . . . . . 247 6.12 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 6.13 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 7 Modele zmiennych licznikowych 251 7.1 Zmienna licznikowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 7.2 Model regresji Poissona . . . . . . . . . . . . . . . . . . . . . . . . . . 252 7.3 Model regresji ujemnej dwumianowej . . . . . . . . . . . . . . . . . . . 255 7.4 Modele z podwyższoną liczbą zer . . . . . . . . . . . . . . . . . . . . . 257 7.5 Modele zmiennych licznikowych w praktyce: liczba dzieci w rodzinie . 259 7.6 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 7.7 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 8 Modele danych panelowych 267 8.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 8.2 Statyczne modele liniowe dla danych panelowych . . . . . . . . . . . . 270 8.2.1 Model z efektami ustalonymi (fixed effects) . . . . . . . . . . . 272 8.2.2 Model z efektami losowymi (random effects) . . . . . . . . . . . 277 8 Spis treści 8.2.3 Weryfikacja liniowych modeli statycznych 8.2.4 dla danych panelowych . . . . . . . . . . . . . . . . . . . . . . 282 Inne modele statyczne dla danych panelowych . . . . . . . . . . 288 8.3 Dynamiczne modele liniowe dla danych panelowych . . . . . . . . . . . 290 8.3.1 Estymator first differences . . . . . . . . . . . . . . . . . . . . . 291 8.3.2 Metoda zmiennych instrumentalnych i estymator Andersona-Hsiao . . . . . . . . . . . . . . . . . . . 292 8.3.3 Estymatory uogólnionej metody momentów . . . . . . . . . . . 293 8.4 Modele zmiennych dwumianowych dla danych panelowych . . . . . . . 298 8.4.1 Model z efektami ustalonymi . . . . . . . . . . . . . . . . . . . 298 8.4.2 Modele z efektami losowymi . . . . . . . . . . . . . . . . . . . . 301 8.5 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 8.6 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 9 Ocena efektu oddziaływania: estymacja przez dopasowanie 309 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 9.1 Wprowadzenie 9.2 Zdefiniowanie efektu oddziaływania . . . . . . . . . . . . . . . . . . . . 311 9.3 Ogólne zasady tworzenia estymatora efektu oddziaływania . . . . . . . 313 9.4 Podstawowe założenia estymacji przez dopasowanie . . . . . . . . . . . 316 9.5 Szczegóły konstrukcji estymatora efektu oddziaływania . . . . . . . . . 318 9.5.1 Łączenie za pomocą metryki i prawdopodobieństwa (propensity score) . . . . . . . . . . . . . . . . . . . . . . . . . . 318 9.5.2 Prosty i skorygowany (nieobciążony) estymator oparty 9.5.3 Metody łączenia obserwacji na metryce versus estymator PSM . . . . . . . . . . . . . . . . 320 . . . . . . . . . . . . . . . . . . . . 321 9.6 Własności statystyczne estymatorów . . . . . . . . . . . . . . . . . . . 325 . . . . . . . . . . . . . . . . . . . . . 325 9.6.1 Obciążenie i efektywność 9.6.2 Wrażliwość oszacowań na założenia, dobór zmiennych i metodę estymacji . . . . . . . . . . . . . . . . . . . . . . . . . 326 9.7 Dalszy rozwój metod estymacji przez dopasowanie . . . . . . . . . . . 328 9.8 Estymacja przez dopasowanie z programem Stata . . . . . . . . . . . . 329 9.9 Słowa kluczowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 9.10 Problemy i zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Literatura Indeks rzeczowy 337 347 Wstęp Mikroekonometria to analiza mikrodanych dotyczących zagadnień ekonomicznych, finansowych i społecznych. Mikrodane to dane o pojedynczych uczestnikach życia ekonomicznego: osobach, gospodarstwach domowych, firmach itd., a także o zacho- waniach tych uczestników. Coraz większa dostępność mikrodanych stwarza potrzebę sięgania po nowoczesne narzędzia ich analizy, jakich dostarcza mikroekonometria. Jest to ta część ekonometrii, która rozwija się od kilkudziesięciu lat, głównie ze względu na wzrost możliwości obliczeniowych oraz dostępności dużych zbiorów mikrodanych. Rosnący popyt na analizy mikrodanych odnotowuje się w marketingu, finansach, zarządzaniu, w ekonomii i w innych naukach społecznych. Popularne zastosowania modeli mikroekonometrii obejmują: badanie zdolności kredytowej, prognozowanie odejść klientów i bankructw firm, wybór grup docelowych do kampanii bezpośrednich, badanie preferencji klientów dotyczących marek czy modelowanie szkód i wypłat ubezpieczeniowych. Niniejsza książka stanowi wprowadzenie do analizy mikrodanych i przedstawia ekonometryczne metody modelowania zmiennych jakościowych lub ograniczonych. Oprócz przeglądu modeli i metod książka zawiera przykłady i ćwiczenia. Jest przeznaczona dla studentów uczelni ekonomicznych mających zajęcia z ekonometrii oraz praktyków analityków korzystających z mikrodanych. Przygotowanie książki pod tytułem Mikroekonometria stanowiło duże wyzwanie dla autorów. Taki tekst powinien bowiem pomieścić zarówno podstawy teoretyczne, jak i przykłady zastosowań, decydujących o zainteresowaniu wielu potencjalnych odbiorców. Nasza książka stara się spełnić te oczekiwania. Jednocześnie mamy świadomość, że nie wszystkie teoretyczne i empiryczne kwestie zostały objaśnione ku zadowoleniu wymagających odbiorców. To jest zawsze sprawa kompromisu – w tym wypadku między objętością książki a jej przeznaczeniem. 11 Wstęp W zamyśle autorów jest to podręcznik do przedmiotu „mikroekonometria” wykładanego od niedawna w Polsce, ale jeszcze nieoferowanego powszechnie na studiach ekonomii i zarządzania. To się szybko zmienia, ponieważ coraz częściej mamy do czynienia z dużymi zbiorami mikrodanych, które powinny być analizowane, z perspektywy marketingowej (dane sprzedażowe ze skanerów kasowych) bądź z punktu widzenia obserwatora rynku, na przykład rynku kapitałowego, gdzie mikrodane też tworzą się w sposób automatyczny1. Zadanie dla analityka nie jest wcale proste. Mikrodane można analizować według różnych reguł. Ta książka podkreśla regułę ekonometryczną. Znaczy to, że mamy zawsze na myśli pewien model opisujący takie dane, liniowy lub nieliniowy. Jest to model stochastyczny, jak każdy model ekonometryczny. Staramy się opisywać modele mikroekonometrii jako modele behawioralne, to znaczy „podpowiadamy modelom” pewne reguły czy zachowania jednostek, które mają znajdować w nich odzwierciedlenie. Nie są to modele oparte na technikach data mining, jakkolwiek obecnie coraz trudniej jest ustalać granice pomiędzy technikami analizy mikrodanych. Mikroekonometria wywodzi się z mikroekonomii. Tego nie przyznają chętnie matematycy lub statystycy, którzy – jak się zdaje – zawładnęli technologią mikroeko- nometrii. W obecnym świecie mnogości danych niepodobna jednak uciec od pytań o sens modelowania. Można przecież wszystko zautomatyzować, ale kierunek myślenia przy tych automatyzacjach ma decydujące znaczenie. Ta książka wskazuje jeden z ta- kich kierunków. Stoimy na stanowisku, że podstawą wyboru jest racjonalna decyzja dokonana w wyniku analizy możliwości. Uważamy, że jednostki podejmujące decyzję lub będące w określonych sytuacjach wybierają różne rozwiązania, ich grupy są zatem niejednorodne, heterogeniczne. Modelowanie ich decyzji powinno to uwzględniać. Przy tym jest to modelowanie w skali statystycznej. Nie koncentrujemy się na Kowalskim, który decyduje, czy dziś pojedzie do pracy tramwajem, czy rowerem. Interesuje nas duży zbiór różnych Kowalskich i ich różne wybory. Sądzimy, że nasza książka koresponduje z rozmaitymi tekstami na temat mikroekonometrii i analizy mikrodanych, które ukazały się w ostatnich latach. W miarę pełne omówienie pozycji wydanych przed rokiem 2000, takich jak publikacja Maddali (1983), jest dostępne w pracy Gruszczyńskiego (2001). Autorami współczesnych monografii, do których nawiązujemy w naszej książce, są m.in.: Wooldridge (2002), Cameron i Trivedi (2005), Hensher, Rose i Greene (2005), Winkelmann i Boes (2006), Train (2003), Lee (2010). Analiza mikrodanych wymaga korzystania z odpowiednich programów. Przy prezentacji naszych tekstów zdecydowaliśmy się przede wszystkim na program Stata. To oznacza, że wiele przykładów jest prezentowanych w języku Stata, można też w tekście spotkać komendy i sugestie różnych rozwiązań związanych z tym programem. Nie przedstawiamy tu jednak wyczerpującego wykładu na temat Stata. Drugim programem, który można wykorzystać w wielu przykładach z tej książki, jest Gretl. 1 Zob. felieton mojego autorstwa Będzie coraz więcej liczb w „Gazecie SGH” pod adresem http://akson.sgh.waw.pl/ thorrel/gazeta/archiwum/pdf/SGH-2009-05.pdf. 12 Wstęp Warto podkreślić dostępność dobrych podręczników z mikroekonometrii opartych na programie Stata. Mam tu na myśli autorów takich jak: Cameron i Trivedi (2009), a także Long i Freese (2006). Lżejsza pozycja to praca autorstwa Bauma (2006). Mottem naszej książki są zastosowania. Ich przykłady znajdziemy w tekście. Wiele innych spotkamy, śledząc doniesienia z badań na rozmaite tematy. Jeśli chodzi o zagadnienia ekonomiczne, finansowe i związane z zarządzaniem, dobrym źródłem jest baza artykułów SSRN oraz baza IDEAS. Niektóre zastosowania doczekały się książek z mikroekonometrią w tytule, z nowszych wymienimy prace takich autorów jak Caliendo (2006), Carvalho (2009), Degryse, Kim i Ongena (2009) oraz Lee (2005). Jak w większości współczesnych tekstów na temat mikroekonometrii, tematy w naszej książce koncentrują się na modelach zmiennych jakościowych i ograniczonych, a główna metoda estymacji to metoda największej wiarygodności. Zwracamy przy tym uwagę, że podstawowe modele opisywane w książce można przedstawić w szerszym kontekście modelowania zmiennej ukrytej (latent). Mówi o tym jeden z początkowych rozdziałów. Innym nowym elementem jest modyfikacja metody maximum score zasygna- lizowana w rozdziale 6. Autorem obu tych omówień jest Marcin Owczarczuk. Pozostali autorzy – Monika Bazyl, Monika Książek, Arkadiusz Wiśniowski oraz niżej podpisany – opracowali kolejne rozdziały, w szczególności opisujące rzadziej prezentowane w Polsce modele zmiennych wielomianowych dla kategorii uporządkowanych i nieuporządko- wanych. Autorzy, związani z Zakładem Ekonometrii Stosowanej w Szkole Głównej Handlowej w Warszawie, chętnie przyjmą wszelkie uwagi od życzliwych czytelników. *** Pierwsze wydanie książki zostało bardzo przychylnie przyjęte przez czytelników. Otrzymaliśmy od Państwa wiele uwag, propozycji udoskonalenia tekstu oraz uzupełnień. Drugie wydanie „Mikroekonometrii” jest rozszerzone o dwa nowe rozdziały, oba napisane przez ekspertów w swoich dziedzinach. Nowy rozdział ósmy o modelach ekonometrii panelowej, autorstwa Bartosza Witkowskiego z Zakładu Metod Probabilistycznych w Instytucie Ekonometrii SGH, wzbogaca naszą książkę o nowy wymiar, to jest o modelowanie przestrzenno-czasowe. Ten rozdział stanowi kompendium wiedzy na temat modeli dla danych panelowych, z przykładami i propozycjami korzystania z programu Stata. Drugi nowy rozdział (dzie- wiąty), autorstwa Adama Szulca z Instytutu Statystyki i Demografii SGH, przedstawia tematykę szacowania efektów oddziaływania, niezwykle ważną w mikroekonometrii. Mottem tego rozdziału jest estymacja przez dopasowanie (matching). Szacowanie efektów oddziaływania należy do szybko rozwijających się gałęzi mikroekonomii empi- rycznej, określanych jako metody oceny polityki społecznej (policy evaluation methods), czy wręcz jako metody ekonometrii „ewaluacyjnej” (evaluation econometrics). W stosunku do pierwszego wydania uzupełniliśmy znacząco rozważania w roz- dziale 2, między innymi o M-estymatory, o dyskusję na temat wielokrotnego testowania hipotez (testowania zbyt wielu modeli) i dyskusję na temat trafności prognoz. W roz- dziale 4 wprowadzony został podrozdział o modelu częściowo proporcjonalnych szans - 13 Wstęp jako pośrednim pomiędzy standardowym modelem uporządkowanym a uogólnionym modelem uporządkowanym. Omówiono także zdarzający się w zastosowaniach problem rzadkich danych, to znaczy problem bardzo małej lub zerowej liczności obserwacji dla niektórych kombinacji kategorii zmiennych w modelu. We wszystkich rozdziałach poprawiliśmy dostrzeżone błędy i wprowadziliśmy różne uzupełnienia. Dziękujemy czytelnikom, a przede wszystkim naszym studentom z przedmiotu „Mikroekonome- tria”, za wskazanie niedociągnięć tekstu w pierwszym wydaniu. Nowe wydanie książki zawiera indeks. Spis literatury również został uzupełniony. Wyrażamy nadzieję, że nowe rozszerzone wydanie „Mikroekonometrii” będzie jeszcze lepiej służyć naszym czytelnikom, których niniejszym zachęcamy do dalszego przesyłania uwag i komentarzy. Marek Gruszczyński ROZDZIAŁ 1 Wprowadzenie do mikroekonometrii Pierwszy rozdział stanowi wprowadzenie do problematyki mikroekonometrii. W części wstępnej przedstawiamy różne rodzaje mikrodanych oraz modele, które mogą je opisywać. Dalej następuje przegląd głównych zagadnień mikroekonometrii, to znaczy tematów wyróżniających analizę mikrodanych spośród innych analiz ekonometrycznych. Zwracamy uwagę na strategię modelowania, na specyficzne cechy zbiorów mikrodanych, na kwestię endogeniczności w modelu, a także niejednorodności danych. Wskazujemy, jak dobór próby wpływa na jakość wyników badania mikroekonometrycznego. Pokazujemy też relację mikroekonometrii z innymi dziedzinami analizy danych, takimi jak data mining czy ekonometria przestrzenna. Rozdział kończy się laudacją dla Jamesa Heckmana i Daniela McFaddena – laureatów Nagrody im. Alfreda Nobla z dziedziny ekonomii w roku 2000. 1.1. Mikrodane Zbiory danych liczbowych o pojedynczych jednostkach, takich jak klienci banku, gospodarstwa domowe, rodziny, firmy i tak dalej, to zbiory mikrodanych. Mikrodane zawierają informacje obiektywne lub subiektywne. Są to na przykład dane o każdym z 1000 konsumentów, których spytano o ocenę smaku nowej kawy. Płeć konsumenta to informacja obiektywna, a ocena smaku kawy jest subiektywna. Właśnie ta ocena jest przedmiotem zainteresowania odbiorców takich danych. Mikrodane mogą być produktem ubocznym innych działalności, np. polegającej na utrzymywaniu i zarządzaniu danymi z urzędów skarbowych bądź z NFZ czy też z ZUS. Mikrodanymi są niezwykle liczne informacje liczbowe o zachowaniu się klientów operatora telefonii 15 1.1. Mikrodane Rozdział 1 komórkowej: czas trwania każdej rozmowy, częstotliwość rozmów, koszt rozmów itd. Mikrodanymi są także próby ze zbiorów rozmaitych transakcji, takich jak informacje ze skanerów w supermarketach. Krótko mówiąc – mikrodane nas otaczają. W tej książce opisujemy niektóre sposoby ich analizowania, takie, które zalicza się do mikroekonometrii. Cechą zbiorów mikrodanych jest ich duża liczebność oraz to, że mają z reguły charakter danych przekrojowych. Dane panelowe też zalicza się do mikrodanych, szczególnie wtedy, kiedy wymiar czasowy jest bardzo mały w porównaniu z wymiarem przekrojowym, np. dane o wynikach finansowych 4000 firm z trzech kolejnych lat. Mikrodane to dane obserwacyjne, pochodzą bowiem z badań ankietowych bądź z dostępnych baz danych administracyjnych. Należy je odróżnić od danych eksperymentalnych pochodzących z odpowiednich eksperymentów. Dane obserwa- cyjne mogą być obarczone błędem selekcji próby, jeśli ich zbiór nie stanowi próby losowej. Mikrodane to przede wszystkim dane przekrojowe. Są one najprostsze do uzyskania, ale też nie odpowiadają na wszystkie pytania, szczególnie gdy dochodzi wymiar czasowy badanej relacji. Wyjątkiem jest sytuacja, gdy mamy do czynienia z populacją stacjonarną, czyli taką, dla której momenty charakteryzujących ją zmiennych są stałe (Cameron, Trivedi, 2005). Jest to jednak pewna abstrakcja, na ogół niezdarzająca się w praktyce. Kolejny rodzaj to powtarzane dane przekrojowe, ciąg niezależnych prób, rodzaj panelu z próbą zmieniającą się z okresu na okres. Jeśli populacja nie jest stacjonarna, to poszczególne próby łączy relacja zależna od tego, jak populacja zmienia się w czasie. Jednym z rozwiązań jest konstruowanie na podstawie powtarzanych danych przekrojowych tak zwanych pseudopaneli bądź paneli syntetycznych. Wreszcie dane panelowe (panel data, longitudinal data) oznaczają obserwacje na wylosowanej próbie jednostek, dokonywane w ciągu kolejnych okresów. Oczywistą zaletą danych panelowych, jeśli tylko obejmują dostatecznie długą sekwencję obserwacji w czasie, jest możliwość modelowania zarówno relacji statycznych, jak i dynamicznych. Główne problemy paneli to reprezentatywność próby i zmęczenie próby (wypadanie jednostek z panelu). Ważną cechą mikrodanych jest to, że zmienne, które reprezentują, są często mierzone na skali nieciągłej. Są to zmienne jakościowe. Mikrodane dzielimy ogólnie na dane ilościowe (quantitative) i dane jakościowe (qualitative). Mikroekonometria zajmuje się w szczególności danymi jakościowymi, jako że metody analizy takich danych różnią się znacznie od metod analizy danych ilościowych (por. rys. 1.1). Zanim zagłębimy się w szczegóły, potrzebne będzie szersze spojrzenie na samą dziedzinę mikroekonometrii. 16 Rozdział 1 1.2. Obszar mikroekonometrii, tradycje i piśmiennictwo Rys. 1.1 Rodzaje mikrodanych Rodzaje mikrodanych dane ilo(cid:339) ewoic dyskretne lub ci(cid:266)g(cid:226) e okajenad (cid:339)ciowe enterksyd zakres ynozcinargoein zakres ynozcinargo dwumianowe wielomianowe zropuein (cid:266)dkowane wielomianowe uporz(cid:266)dkowane zmienne ograniczone zmienne uci(cid:281)te zmienne licznikowe zmienne czasu trwania (prze(cid:367)ycia) (cid:364)ród(cid:226)o: Winkelmann i Boes (2006) oraz opracowanie w(cid:226)asne 1.2. Obszar mikroekonometrii, tradycje i piśmiennictwo „At its heart economic theory is about individuals (or families or firms) and their interactions in markets and other social settings1. (...) The field of microeconometrics emerged in the past forty years to aid economists in providing more accurate descriptions of the economy, in designing and evaluating public policies, and in testing economic theories and estimating the parameters of well posed economic models. It is a scientific field within economics that links the theory of individual behaviour to individual data, where individuals may be firms, persons or households.” James Heckman, przemówienie noblowskie, 8 grudnia 2000 r. (2000, 2001, 2004). Można zgodzić się z tą szeroką definicją mikroekonometrii autorstwa Jamesa Heckmana, laureata Nagrody Nobla w dziedzinie ekonomii w roku 2000. Mikroeko- nometria jest odpowiedzią na wyraźne potrzeby ekonomii i innych nauk społecznych, dotyczące dokładniejszego opisu zjawisk i lepszej weryfikacji rozmaitych hipotez. Od- grywa szczególną rolę w naukach ekonomicznych, ponieważ daje narzędzia analizy zachowań jednostek przy użyciu mikrodanych, przy czym jednostkami mogą być firmy, pojedyncze osoby czy gospodarstwa domowe. Jest to jedna z wielu dziedzin współczesnej nauki, które swoją popularność i przydatność zyskały dzięki komputerom. Ostatnie 40–50 lat były okresem wielkiego rozwoju mikroekonometrii, głównie za sprawą dostępności mikrodanych oraz możliwości obliczeniowych. Podstawy metodyczne sięgają przeszłości znacznie odleglejszej. Jeśli szukać „ojców” mikroekonometrii, to są nimi wszyscy, którzy w badaniach z zakresu 1 Słowa or families or firms zostały usunięte z tekstu przemówienia noblowskiego Jamesa Heckmana w późniejszych wydaniach. 17 1.2. Obszar mikroekonometrii, tradycje i piśmiennictwo Rozdział 1 ekonomii korzystali z mikrodanych. Należą do nich z pewnością Engel (1857), Stone (1953), Houthakker (1957) czy Tobin (1958). Typowych przykładów zastosowań mikroekonometrii w ekonomii szuka się najczęściej w ekonomii pracy; chodzi tu o klasyczną zależność płacy od poziomu wykształcenia czy liczby dzieci urodzonych przez kobietę od jej możliwości na rynku pracy. Heckman (2004) podaje następujące powody, dla których mikroekonometria przyczyniła się do rozwoju wiedzy ekonomicznej: – Mikroekonometrycy rozwinęli nowe narzędzia umożliwiające podjęcie wyzwań, jakie stanęły przed ekonometrią w postaci dużych zbiorów mikrodanych. – Mikroekonometria wzbogaciła metody analizy szeregów czasowych poprzez konstrukcję modeli, które połączyły modele ekonomiczne dla pojedynczych uczestników życia ekonomicznego z danymi na temat indywidualnych zachowań (dane panelowe). – Badania mikroekonometryczne niezmiennie dowodzą istnienia różnorodności i heterogeniczności indywidualnych zachowań. Ta heterogeniczność ma wielkie znaczenie dla teorii ekonomii oraz dla praktyki ekonometrycznej. – Mikroekonometria ma ponadto duże znaczenie jako narzędzie naukowej oceny rozmaitych programów polityki społecznej. Sam termin „mikroekonometria” pojawia się w zachodniej literaturze ekonome- trycznej od połowy lat osiemdziesiątych (zob. np. Pesaran, 1987; Ronning, 1991 lub Blundell, 1996). Nazwa wynika z potrzeby wyodrębnienia tej części ekonometrii, która obejmuje metody wykorzystania mikrodanych do analizy zagadnień ekonomicznych. Są to metody wyraźnie różne od klasycznych, przede wszystkim w przypadku, gdy mikrodane są podstawą modelowania zmiennych jakościowych lub ograniczonych. Mi- kroekonometria zdobywa popularność także na poziomie akademickim. Są już pierwsze podręczniki do ekonometrii, w których wyraźnie oddzielono analizę danych przekro- jowych od analizy szeregów czasowych, np. podręcznik Wooldridge’a (2003). Takie w istocie są też podręczniki Stocka i Watsona (2007) oraz Heija, de Boera, Fransesa, Kloeka i van Dijka (2004), a także w jakiejś mierze podręcznik Mycielskiego (2009). Monografie dotyczące samej mikroekonometrii wymieniono też we wstępie do tej książki. Wskazano tam na pozycje literatury dotyczące programu Stata. Warto też dodać, że monografia Henshera, Rose’a i Greene’a (2005) na temat stosowanej analizy wyboru jest w istocie poświęcona obsłudze i zastosowaniu innego programu: NLOGIT. Część mikroekonometrii wykorzystuje dane panelowe. W naszej książce modele ekonometrii panelowej omawia rozdział 8. Z monografii dotyczących ekonometrii panelowej można podać książki takich autorów, jak Arellano (2003), Baltagi (2008), Hsiao (2003), Hsiao, Lahiri, Lee i Pesaran (1998), Lee (2002). W literaturze polskiej do mikroekonometrii nawiązują autorzy i redaktorzy kilku monografii, na przykład Gruszczyński (2001), Wiśniewski (1986), Walesiak (1996), Gatnar i Walesiak (2004), Marzec (2008). Jest też monografia Hozera (1993), gdzie za mikroekonometrię uznaje się wszelkie zastosowania ekonometrii w mikroekonomii. Warto dodać, że wiele współczesnych badań z zakresu ekonomii, finansów i zarządzania 18 Rozdział 1 1.3. Modele mikroekonometrii w Polsce opiera się na mikrodanych przekrojowych bądź na danych panelowych. Znaczącą ich część można zaliczać do obszaru mikroekonometrii. Są one coraz częściej publikowane w renomowanych czasopismach naukowych, a także w krajowych monografiach konferencyjnych. 1.3. Modele mikroekonometrii Mikrodane, które są podstawą modelowania w mikroekonometrii, można klasyfi- kować na różne sposoby. Winkelman i Boes (2006) proponują następującą klasyfikację mikrodanych ilościowych i jakościowych, a właściwie modeli, które mają opisywać zmienne mające takie cechy (por. rys. 1.1): 1. Mikrodane ilościowe: dyskretne lub ciągłe a) zakres nieograniczony b) zakres ograniczony - ograniczone zmienne zależne - zmienne czasu trwania (przeżycia) - zmienne licznikowe 2. Mikrodane jakościowe: dyskretne a) dwumianowe (binarne) b) wielomianowe nieuporządkowane c) wielomianowe uporządkowane Podstawą klasyfikacji mikrodanych jest model, który objaśnia zmienną o okre- ślonej postaci. Nieco inny podział proponuje Gruszczyński (2001). Bierze się pod uwagę jedynie zmienne jakościowe i ograniczone, których modele podane są w czterech grupach. Tabela 1.1 przedstawia jedną z wersji tej klasyfikacji. W poniższych przykładach przedstawimy kilka modeli mikroekonometrii, które można znaleźć w obu klasyfikacjach. Przykład 1.1. Czy pracujesz? Możliwe odpowiedzi: Y = 1 Y = 0 tak nie ∗ oznaczającą skłonność do podejmowania Wyobraźmy sobie pewną zmienną ciągłą Y pracy. Jest to zmienna nieobserwowalna (ukryta). O zmiennej ukrytej dowiemy się ∗ (cid:2) 0, to pracuję, a jeśli Y więcej z rozdziału 2. Przyjmijmy, że jeśli Y 0, to nie pracuję. Obserwujemy jednak tylko wartości Y , wartości zmiennej binarnej. Wniosek: do opisu zmiennej jakościowej Y powinniśmy zastosować model dwumia- nowy. ∗ (cid:2) 0), czyli p = P (Y = 1) oraz Co modelujemy? Prawdopodobieństwa p = P (Y 1 − p = P (Y 0), czyli 1 − p = P (Y = 0). Szczegóły w rozdziale 3. ∗ ∗ 19 1.3. Modele mikroekonometrii Rozdział 1 Tab. 1.1 Systematyka modeli zmiennych jakościowych i ograniczonych 2. Modele wielomianowe 1. Modele dwumianowe liniowy model prawdopodobieństwa (LMP) Modele kategorii uporządkowanych probitowy logitowy logarytmiczno-liniowy gompitowy (krzywej Gompertza) komplementarny log-log burritowy (rozkładu Burra) ucięty LMP krzywej Urbana uporządkowany model logitowy i probitowy uogólniony model uporządkowany modele danych sekwencyjnych Modele kategorii nieuporządkowanych wielomianowy model logitowy i probitowy warunkowy model logitowy (McFadden) zagnieżdżony model logitowy mieszany model logitowy 4. Modele licznikowe i czasu trwania regresja Poissonowska model rozkładu ujemnego dwumianowego model czasu trwania model licznikowy ucięty model płotkowy 3. Modele zmiennych ograniczonych regresja ucięta modele tobitowe (klasyczne) dwugraniczny model tobitowy model doboru próby (Heckman) modele efektów oddziaływania Źródło: Gruszczyński (2001). Przykład 1.2. Czy zgadzasz się ze stwierdzeniem: każda mama powinna zrezygnować z pracy i wychowywać swoje dziecko? Możliwe odpowiedzi: Y = 1 zdecydowanie się nie zgadzam, Y = 2 nie zgadzam się, Y = 3 nie mam zdania na ten temat, Y = 4 zgadzam się, Y = 5 zdecydowanie zgadzam się z tym stwierdzeniem. skłonność do wyrażania zgody na to stwierdzenie Tutaj zmienną ukrytą jest Y (zmienna ciągła). Nadal mamy zmienną ciągłą Y , które nas interesują. Oznaczmy je jako τ1, τ2, τ3, τ4 (każdy większy od poprzedniego): , ale więcej punktów na osi Y ∗ ∗ ∗ ∗ τ1, Y = 1 dla Y Y = 4 dla τ3 (cid:3) Y ∗ τ4, Y = 2 dla τ1 (cid:3) Y Y = 5 dla τ4 (cid:3) Y ∗ ∗ τ2, . Y = 3 dla τ2 (cid:3) Y ∗ τ3, Wniosek: powinniśmy zastosować model wielomianowy kategorii uporządkowanych. Co modelujemy? Prawdopodobieństwa p1, p2, p3, p4, p5 dla (odpowiednio) Y =1, 2, 3, 4 i 5. Szczegóły w rozdziale 4. Przykład 1.3. Jaką wykonujesz pracę? Możliwe odpowiedzi: Y = A praca fizyczna, Y = C praca menedżerska, Y = B praca biurowa, Y = D inna praca. Tutaj mamy 4 prawdopodobieństwa: pA, pB, pC i pD, które odpowiadają skłonności do wykonywania pracy danego rodzaju. Wartości zmiennej Y nie da się uszeregować w jakiejkolwiek obiektywnej kolejności. Wniosek: powinniśmy zastosować model wielomianowy kategorii nieuporządkowanych. 20 Rozdział 1 1.4. Główne zagadnienia mikroekonometrii Co modelujemy? Ilorazy prawdopodobieństw pB/pA, pC/pA oraz pD/pA, gdzie A przyjęto za kategorię bazową. Szczegóły w rozdziale 5. Przykład 1.4. Ile jest dzieci do lat 6 w Twojej rodzinie? Możliwe odpowiedzi: Y = 0, Y = 1, Y = 2, Y = 3, rzadziej więcej. Jest to zmienna o wartościach dyskretnych, ograniczona z dołu. Odpowiedzi Y = 0 jest na ogół najwięcej, Y = 1 nieco mniej itd. Można przyjąć, że zmienna Y ma rozkład Poissona. Wniosek: możemy zastosować model regresji Poissona. Co modelujemy? Wartość oczekiwaną zmiennej Y , to jest wartość oczekiwaną w roz- kładzie Poissona. Szczegóły w rozdziale 7. Przykład 1.5. Ile kosztował samochód, który Twoja rodzina kupiła w ze- szłym roku? Możliwe odpowiedzi: Y = 0 lub Y 0. Jest to zmienna o wartościach ciągłych nieujemnych z dużą liczbą zer. Z punktu widzenia ekonomii te dwie informacje (Y = 0 lub Y 0) mówią o tym, czy rodzina wybrała brzegowe (corner solution), czy też wewnętrzne (interior) rozwiązanie zadania maksymalizacji użyteczności gospodarstwa domowego. Wniosek: powinniśmy zastosować model tobitowy (model rozwiązań brzegowych). Co modelujemy? Zmienną Y o warunkowym rozkładzie dyskretno-ciągłym, który jest połączeniem rozkładu ciągłego (wartości Y 0) oraz rozkładu jednopunktowego (Y = 0). Szczegóły w rozdziale 6. Inne przykłady modeli mikroekonometrycznych można znaleźć w pracy Grusz- czyńskiego (2001, rozdział 1). Trzeba pamiętać, że w najszerszym ujęciu model mikro- ekonometryczny to w istocie każdy model typu regresyjnego oparty na mikrodanych. Jeśli szacujemy model, w którym płaca jest liniową funkcją charakterystyk danej osoby, to mamy na początku na myśli zwykły model liniowej regresji, w którym zmienna objaśniana jest zmienną ilościową (ciągłą). Dopiero próba, którą dysponu- jemy, a także adekwatność założeń modelu (np. kwestia endogeniczności) decydują o metodzie analizy. 1.4. Główne zagadnienia mikroekonometrii 1.4.1. Ekonomia a strategia modelowania w mikroekonometrii Tradycyjne podejście do strategii modelowania w ekonometrii, w którym podstawą jest duże zaufanie do teorii ekonomicznej i jej postulowanych modeli, obecnie coraz częściej ustępuje miejsca podejściu aplikacyjnemu, w którym punktem wyjścia są dane. Heij i inni (2004) w nowoczesnym podręczniku do ekonometrii twierdzą, że 21 1.4. Główne zagadnienia mikroekonometrii Rozdział 1 podstawą modelowania ekonometrycznego nie powinno być testowanie konkretnej teorii ekonomicznej, lecz wykorzystanie danych do lepszego zrozumienia interesującego nas zjawiska. Modele to jedynie konstrukcje, które mogą się zmieniać pod wpływem informacji, jakie niosą dane. Włączenie do modelu charakterystyk tych danych może prowadzić do lepszego zrozumienia opisywanego procesu ekonomicznego. Poza wszystkim, teoria ekonomii często nie podpowiada konkretnych postaci modeli, co pozwala na dość swobodne podejście do specyfikacji. Takie rozmycie tradycyjnego podejścia do modelowania może nie być szczególnie pożądane w makroekonometrii, ale już ekonometria finansowa zajmująca się analizą szeregów czasowych danych o dużej częstości zdaje się zmierzać w kierunku tej drugiej strategii modelowania. A jak jest w mikroekonometrii? Cameron i Trivedi (2005) uważają, że są dwa podejścia do korzystania z teorii ekonomii w mikroekonometrii. Pierwsze to podejście strukturalne, gdzie celem analizy jest identyfikacja i oszacowanie pewnych podstawowych parametrów, które charakteryzują badane zależności, np. funkcję kosztów czy funkcję produkcji. Przyjmuje się wówczas – na podstawie teorii ekonomii – wiele założeń dotyczących samej specyfikacji modelu czy też własności składników losowych. Jeśli posługujemy się danymi zagregowanymi, to oceny parametrów otrzymuje się przy znacznie silniejszych (niekoniecznie spełnionych) założeniach w porównaniu z korzystaniem z mikrodanych. Mikrodane pozwalają na większą elastyczność przy specyfikowaniu modelu. W drugim podejściu, które autorzy nazywają opartym na postaci zredukowanej, celem analizy jest modelowanie zależności pomiędzy zmiennymi wynikowymi (endogenicznymi) a zmiennymi, które uznaje się za egzogeniczne. Główną cechą tego podejścia jest to, że nie zawsze bierze się pod uwagę wszystkie współzależności między zmiennymi. Badanie ogniskuje się bowiem na predykcji zmiennej objaśnianej na podstawie zmiennych objaśniających. Nie chodzi o interpretację przyczynową parametrów modelu. Naszym zdaniem umieszczenie modelu w nurcie określonej teorii ekonomicznej powinno być pierwszym celem badawczym. Mikrodane dają tu pewną przewagę nad danymi zagregowanymi. Nie zawsze jednak można posłużyć się solidną teorią. Z tego powodu wiele empirycznych modeli budowanych dla mikrodanych to modele oparte na dość luźnych, niekoniecznie spójnych hipotezach behawioralno-ekonomicznych. Mikroekonometria, która korzysta z mikrodanych, daje też pewną przewagę nad podejściami korzystającymi z makrodanych. Cameron i Trivedi (2005) wskazują, że makroekonometria opiera się czasami na mocnych założeniach, np. na założeniu o jednostce reprezentatywnej (representative agent). Często dane zagregowane mają właśnie odzwierciedlać zachowanie takich jednostek, co nie zawsze ma sens. Z punktu widzenia mikroekonomii, analiza ilościowa oparta na mikrodanych może być uznana za bardziej realistyczną niż analiza bazująca na danych zagregowanych. Po pierwsze pomiar takich zmiennych jest na ogół bardziej bezpośredni i ma większe odniesienie do weryfikowanej właśnie teorii. Po drugie hipotezy dotyczące zachowania ekonomicznego zwykle są wyprowadzane z teorii behawioralnych. Przy 22 Rozdział 1 1.4. Główne zagadnienia mikroekonometrii korzystaniu z danych zagregowanych trzeba wówczas dokonywać wielu aproksymacji i upraszczających założeń. Po trzecie realistyczny obraz aktywności gospodarczej powinien dopuszczać szerokie spektrum różnych wyników, które są konsekwencją naturalnej heterogeniczności jednostek i które można prognozować na podstawie danej teorii. Mikrodane zatem mogą opisywać modele, które są bardziej realistyczne niż modele oparte na makrodanych. 1.4.2. Założenia modelu regresji dla danych przekrojowych Modele mikroekonometrii omawiane w podręcznikach koncentrują się na zmien- nych jakościowych oraz na modelach nieliniowych. Nie znaczy to jednak, że prawidłowy opis zmiennej ilościowej za pomocą modelu liniowego w przypadku mikrodanych prze- krojowych powinien pozostać niezauważony. W tym punkcie wskazujemy, jak formułuje (cid:3) się założenia dla klasycznego modelu regresji yi = x iβ + i, gdzie yi jest i-tą obserwacją przekrojową dla zmiennej objaśnianej, natomiast xi jest wektorem obserwacji dla zmiennych objaśniających. Cameron i Trivedi (2005) proponują zestaw założeń dla klasycznego modelu regresji liniowej dla mikrodanych przekrojowych. Są to założenia dotyczące procesu generowania danych (DGP – data generating process). Na ogół rozumie się, że DGP jest zasadny w przypadku szeregów czasowych. Dla danych przekrojowych proces generowania danych jest definiowany rzadziej. Podstawowe założenia (można je utożsamiać z założeniami dla metody najmniej- szych kwadratów MNK) są następujące: 1. W modelu regresji y względem x dane (yi, xi) są niezależne i nie mają identycznych rozkładów względem i (inid: independent and not identically distri- buted). To założenie wyraźnie odrzuca przyjmowane w klasycznych tekstach „założenie o jednakowych wartościach zmiennych objaśniających w powtarzanych próbach”. Ma ono sens jedynie w przypadku danych eksperymentalnych (gdzie x można utożsamiać z poziomem oddziaływania: treatment; zob. niżej). W mikroekonometrii mamy często do czynienia z próbami nielosowymi (co powoduje inid, w kontraście do prób losowych, które skutkują iid: independent and identically distributed). W parze (yi, xi) jedynie yi jest zmienną losową o wartościach zależnych od wartości xi. Zauważmy, że to zało- żenie wyklucza dane w postaci szeregów czasowych, które są na ogół zależne względem i. (cid:3) iβ + i jest prawidłowa (correct specification). Co to 2. Postać modelu yi = x znaczy? To założenie mówi o tym, że model jest liniowy względem x, że wektor x zawiera wszystkie potrzebne zmienne objaśniające oraz że nie ma błędu w zmiennych, to znaczy xi są zmierzone poprawnie. Są to bowiem te same zmienne, które zarządzają DGP. Dodatkowo parametry β nie zmieniają swoich wartości względem i. 23 1.4. Główne zagadnienia mikroekonometrii Rozdział 1 3. Zmienne objaśniające mogą być stochastyczne, przy czym mają skoń- czoną wartość drugiego momentu. To założenie jest ważne zawsze wówczas, gdy ko- rzystamy z danych pochodzących z badań ankietowych, a nie z wyników eksperymentu. 4. Warunkowa wartość oczekiwana błędów i względem zmiennych objaśniają- cych xi jest równa zeru: E(i|xi) = 0. To podstawowe założenie razem z założeniem 2 implikuje, że E(yi|xi) = x (cid:3) iβ. Merytoryczne znaczenie tego założenia polega na tym, że wszystkie zmienne objaśniające, które nie są uwzględnione w modelu (czyli i), nie są skorelowane ze zmiennymi x, to jest ze zmiennymi uwzględnionymi w mo- delu, a ponadto mają wartość oczekiwaną równą zeru. To jest założenie o słabej egzogeniczności. Jeśli nie jest ono spełnione, znaczy to, że jedna ze zmiennych objaśniających (egzogenicznych) lub ich większa liczba jest zależna od y, a zatem jest endogeniczna. 5. Błędy i są heteroskedastyczne, warunkowo względem zmiennych objaśniają- i , natomiast macierz warunkowej wariancji i kowariancji i }. To założenie mówi cych, przy czym V ar(i|xi) = σ2 wektora błędów i jest diagonalna, co zapisujemy jako Diag{σ2 o warunkowo heteroskedastycznych błędach modelu regresji. Powyższy zestaw założeń można przyjąć jako standard dla stosowania MNK w modelach liniowych opartych na danych przekrojowych. Każde odejście od założeń daje konsekwencje w postaci niepożądanych własności estymatorów (MNK i podobnych). Klasyczna MNK nie okazuje się w tym przypadku rozwiązaniem najlepszym (najefektywniejszym), głównie ze względu na założenie 5. Uogólniona MNK (lub ważona MNK) są teoretycznie bardziej poprawne. Cameron i Trivedi (2005) proponują też korzystanie z regresji kwantylowej opartej na innej niż MNK funkcji straty. 1.4.3. Korelacja a przyczynowość. Relacje przyczynowe a analiza ceteris paribus Przy specyfikacji modeli z wieloma zmiennymi często posługujemy się współczyn- nikami korelacji. Trzeba jednak zawsze pamiętać, że współczynnik korelacji mierzy asocjację statystyczną między zmiennymi. Jeśli nie ma dla tej asocjacji jakiegoś moc- nego uzasadnienia teoretycznego, to korelacja między Y i X jest po prostu miarą opisującą, na ile wspólnie zmieniają się Y i X. Bardzo rzadko na tej podstawie można uznać, że mamy do czynienia z przyczynowością, to znaczy: X „jest przyczyną” Y . W ekonomii trudno nawet znaleźć bezdyskusyjny przykład. Znajdziemy go najwyżej w ekonomii eksperymentalnej. Nieco łagodniejsza w tym względzie może być opinia o korelacji cząstkowej, „po usunięciu wpływu” innych zmiennych. Co z tego wynika? Po pierwsze to, że wielkość współczynnika korelacji nie powinna być utożsamiana z poziomem przyczynowości. Po drugie odpowiedzi na pytanie 24 Rozdział 1 1.4. Główne zagadnienia mikroekonometrii o przyczynowość trzeba poszukiwać w inny sposób. Wooldridge (2002) w monografii na temat mikroekonometrii zwraca uwagę na pojęcie ceteris paribus, które można tłumaczyć jako: „zakładając niezmieniony poziom innych czynników”. Za Wooldridgem przyjmijmy, że pierwotnym celem naszych dociekań jest ustalenie, czy zmiana wartości jednej zmiennej, na przykład w, powoduje zmianę wartości innej zmiennej, na przykład y. Wówczas, jeśli koncentrujemy się na wartości przeciętnej zmiennej y, to analiza ceteris paribus oznacza, że zależy nam na oszacowaniu E(y|w, c), czyli wartości oczekiwanej zmiennej y, warunkowej względem w i c. Wektor c oznacza tutaj zbiór zmiennych kontrolnych, które chcielibyśmy traktować jako ustalone przy analizie wpływu w na y. Zmienne kontrolne są wyróżnione dlatego, iż uważamy, że w jest zmienną skorelowaną także z innymi czynnikami, które wpływają na y. Jeśli w jest zmienną ciągłą, to interesujemy się wielkością ∂E(y|w, c)/∂w, którą nazywa się cząstkowym wpływem w na E(y|w, c). Jeśli w jest zmienną skokową, to wtedy trzeba ustalić, jak E(y|w, c) zmienia się dla różnych wartości w, przy ustalonych c. Nie jest łatwo ustalić, które zmienne należy traktować jako kontrolne (c). Błąd w tej mierze oznacza możliwość ustalenia błędnej relacji między y i w. Jeśli c można obserwować, to pozostaje nam wybór właściwego c. Jednak w ekonomii wiele elementów c nie daje się obserwować. Wooldridge podaje znany przykład problemu polegającego na badaniu wpływu wykształcenia na poziom płacy za pomocą modelu: E(płaca | wykształcenie, doświadczenie, zdolności), czyli modelu z wektorem c = (doświadczenie, zdolności). W tym wektorze zmienna doświadczenie jest obserwowalna (np. za pomocą liczby lat pracy), natomiast zmienna zdolności jest nieobserwowalna. Ekonomiści zajmujący się rynkiem pracy są zgodni co do tego, że aby określić wpływ wykształcenia na poziom płacy, należy pozostawić takie zmienne jak doświadczenie i zdolności na niezmienionym poziomie, czyli zastosować analizę ceteris paribus. Pozostaje kwestia, jak to zrobić, jeśli jakiejś z tych zmiennych nie da się obserwować. Ponadto jest z pewnością wiele innych zmiennych w wektorze c, których tu nie uwzględniliśmy. Pytanie, jakie się stawia w badaniach empirycznych, polega na tym, czy wzięto pod uwagę dostatecznie dużo zmiennych w wektorze c, aby można było dobrze ocenić wpływ zmiennej w na zmienną y. Jeszcze inny problem pojawia się wtedy, kiedy trudno zmierzyć wartości głównych zmiennych, to jest y oraz w. Czasami obserwujemy jedynie wartości równowagi dla y i w, to jest wówczas, gdy są one wzajemnie współzależne. Niezbędne jest wówczas posługiwanie się narzędziami właściwymi dla współzależnych modeli wielorównaniowych. Powyższy wywód, który pochodzi od Wooldridge’a (2002), wykazuje, że typowe podejście do interpretacji parametru regresji z użyciem pojęcia ceteris paribus powinno być stosowane z dużą ostrożnością. Kwestia zasadności analiz ceteris paribus jest podejmowana przez ekonomię i ekonometrię właściwie od początków istnienia tych dyscyplin. Warto w tym względzie wskazać interesujący artykuł Bierensa i Swansona (2000), a także (w kontekście ekonometrii szeregów czasowych) artykuł Hendry’ego (2005). 25 1.4. Główne zagadnienia mikroekonometrii Rozdział 1 Badanie przyczynowości w mikroekonometrii znajduje pewne rozwiązanie w analizie efektów oddziaływania. 1.4.4. Efekty oddziaływania Efekty oddziaływania (treatment effects), podobnie jak opisane niżej endogenicz- ność i heterogeniczność, należą do ważnych tematów współczesnej mikroekonometrii. Chodzi o to, że dostępność mikrodanych pozwala na studiowanie, jak pewne od- działywania (treatment) wpływają na wartości zmiennych endogenicznych, to jest na jednostki, które są tym oddziaływaniom poddane i oglądane poprzez te właśnie endogeniczne zmienne. Teoria efektów oddziaływania wykorzystuje pojęcie wyniku hipotetycznego (counter-factual), który w rzeczywistości nie może się zdarzyć. Poniższe omówienie pochodzi z książki M. Gruszczyńskiego (2012). Dla przykładu wyobraźmy sobie decyzję firmy o wprowadzeniu akcji do obrotu publicznego (Initial Public Offering: IPO), a także efekt tej decyzji w postaci jej wpływu na wynik finansowy firmy, mierzony na przykład w rok po IPO za pomocą wskaźnika ROE rentowności kapitału własnego. Przedsięwzięcie w postaci IPO jest w tym przypadku oddziaływaniem. Aby oszacować efekt tego oddziaływania dla próby firm należałoby znać dwie wielkości ROE dla każdej firmy: ROE z IPO oraz ROE bez IPO, to znaczy wynik z oddziaływaniem i wynik bez oddziaływania. Wtedy (przyczynowy) efekt oddziaływania jest po prostu różnicą tych dwóch wyników. Jednakże dana firma może występować w próbie tylko w jednej roli: albo faktycznie wprowadza akcje do obrotu publicznego, albo nie wprowadza i pozostaje firmą niepubliczną. Zatem dla danej firmy obserwujemy tylko jeden wynik, drugi jest hipotetyczny („kontrfaktyczny”). Przyjmijmy, że wprowadzanie akcji i-tej firmy do obrotu publicznego jest reprezentowane przez losową zmienną zerojedynkową Di{0, 1}, gdzie 1 oznacza, że firma przeprowadza IPO, natomiast 0 oznacza, że nie przeprowadza IPO. Wynik, który nas interesuje, to znaczy ROE, zapiszmy jako y. Pytanie brzmi: czy IPO ma wpływ na y? Potencjalny wynik dla i-tej firmy jest następujący: (cid:2) potencjalny wynik = y1i y0i jeżeli Di = 1 jeżeli Di = 0 To znaczy, że y0i oznacza wartość ROE dla i-tej firmy, przy założeniu, że nie przeprowadza ona IPO – bez względu na to, czy faktycznie tak się dzieje. Podobnie, y1i oznacza wartość ROE dla i-tej firmy, przy założeniu, że przeprowadza ona IPO – bez względu na to, czy faktycznie tak się dzieje. Efekt oddziaływania dla i-tej firmy wynosi po prostu: y1i − y0i. Obserwowany w rzeczywistości wynik dla i-tej firmy jest następujący: 26 Rozdział 1 (cid:2) yi = y1i y0i 1.4. Główne zagadnienia mikroekonometrii jeżeli Di = 1 jeżeli Di = 0 = y0i + (y1i − y0i)Di = Diy1i + (1− Di)y0i Średnia obserwowana różnica w wartościach ROE (dla firm z IPO i bez IPO) równa się: AT E = E(yi|Di = 1) − E(yi|Di = 0). Jest to średni efekt oddziaływania (ATE: average treatment effect). Ta wielkość oczywiście równa się E(y1i|Di = 1) − E(y0i|Di = 0), co można zapisać jako: E(y1i|Di = 1) − E(y0i|Di = 0) = E(y1i|Di = 1) − E(y0i|Di = 1) + E(y0i|Di = 1) − E(y0i|Di = 0). Po prawej stronie powyższego wzoru mamy sumę dwóch różnic. Pierwsza z nich nosi nazwę średniego efektu oddziaływania na jednostkę (ATT: average treatment effect on the treated): AT T = E(y1i|Di = 1) − E(y0i|Di = 1) =E (y1i − y0i|Di = 1) jaki i mówi o tym, jest przyczynowy efekt IPO w firmach, które faktycznie przeprowadzają IPO. Jest to różnica pomiędzy wartością ROE dla firm, które przeprowadziły IPO, czyli E(y1i|Di = 1) oraz wartością ROE dla tych samych firm, przyjmując (hipotetycznie), że IPO nie przeprowadziły, to znaczy E(y0i|Di = 1). Wielkość ATT to jest właśnie to, co chcielibyśmy wiedzieć. Jednak to, co obserwujemy, czyli lewa strona równania, jest różne od ATT o wartość drugiego składnika po prawej stronie, który można nazwać obciążeniem selekcji. Jest to wielkość: E(y0i|Di = 1) − E(y0i|Di = 0) czyli różnica pomiędzy średnią wartością y0i dla firm, które przeprowadziły oraz nie przeprowadziły IPO. Przypomnijmy, że y0i to jest wartość ROE dla firmy nieprzeprowadzającej IPO. Obciążenie selekcji jest więc różnicą hipotetyczną, podobnie jak ATT. Nie wiadomo też, jaki jest znak tego obciążenia: czy firmy, które faktycznie przeprowadziły IPO mają hipotetyczne ROE (to jest takie bez przeprowadzenia IPO) większe czy mniejsze od ROE dla firm, które faktycznie nie przeprowadziły IPO. W każdym razie obciążenie może być na tyle duże, iż znacząco zakłóci wartość ATT. To, co faktycznie możemy obliczyć we wzorze: AT E = AT T + obciążenie selekcji , to lewa strona, czyli ATE. 27 1.4. Główne zagadnienia mikroekonometrii Rozdział 1 Pytanie, czy można pozbyć się obciążenia selekcji? Można – przede wszystkim wtedy, gdy zmienna losowa Di od początku jest niezależna od wyników yi. W przypadku losowego doboru próby (lub zrandomizowanego eksperymentu) oddziaływanie i jego wynik są niezależne. (W naszym przykładzie chodziłoby o losowy wybór firm do IPO; w rzeczywistości nie jest to możliwe). Wówczas we wzorze: AT E = E(y1i|Di = 1) − E(y0i|Di = 0) można zastąpić średnią E(y0i|Di = 0) przez E(y0i|Di = 1), bowiem Di jest niezależna od y0i. W rezultacie otrzymujemy AT E = AT T . Oznacza to, że efekt losowo wybranego oddziaływania IPO na firmę, która przeprowadza IPO jest taki sam jak efekt losowo wybranego oddziaływania IPO na losowo wybraną firmę. Jednakże „oddziaływania”, o jakich mowa, oznaczają dla firmy całkiem nielosowe decyzje (np. właśnie IPO) lub sytuacje (np. obiekt przejęcia przez inną firmę). Zatem firmy „z oddziaływaniem” są wyraźnie różne od firm „bez oddziaływania”. Nie jest możliwe utrzymanie założenia o niezależności Di od yi. Jednak i teraz obciążenie selekcji może być równe zeru, jeśli można przyjąć pewne szczególne założenia. Jakie to założenia? O tym jest między innymi mowa w rozdziale 9 naszej książki. Rozdział 9 przedstawia kompleksowo tematykę efektów oddziaływania. Warto pamiętać, że badania z tego zakresu były podstawą Nagrody Nobla dla J. Heckmana w roku 2000. Estymacja efektów oddziaływania należy do szybko rozwijających się gałęzi mikroekonomii empirycznej, określanych jako metody oceny polityki społecznej (por. Blundell i Costa Dias, 2008). Znana jest też ogólniejsza nazwa evaluation econometrics (metody ekonometrii „ewaluacyjnej”). 1.4.5. Endogeniczność Endogeniczność oznacza, że zmienna objaśniająca X w modelu wyja- śniającym zmienną Y jest skorelowana ze składnikiem losowym. To znaczy, że zmienna X nie objaśnia zmiennej Y z zewnątrz modelu, lecz objaśnia ją „w poro- zumieniu” (w korelacji) ze składnikiem losowym. Zmienna X jest w istocie „endoge- niczna”, to znaczy objaśniają ją czynniki zawarte w składniku losowym, podobne do tych, które objaśniają zmienną Y. Co więcej, składnik losowy nie jest wtedy naprawdę losowy, ponieważ jest częściowo przewidywalny na podstawie informacji zawartej w zmiennej X. Kwestia endogeniczności jest podstawą rozważań w wielorównaniowych modelach współzależnych. Problem występuje także w mikroekonometrii. W krymino- logii znany jest wynik estymacji modelu regresji nasilenia przestępczości w powiatach względem wielu zmiennych, w tym liczby policjantów per capita, gdzie oszacowany parametr regresji jest dodatni („im więcej policji, tym większa przestępczość”). Wśród różnych przyczyn takiego wyniku można wymienić i taką, że liczba policjantów jest endogeniczna w równaniu: taka zmienna może być na przykład skorelowana z wielkością powiatu. 28 Rozdział 1 1.4. Główne zagadnienia mikroekonometrii Dobry intuicyjny przykład dotyczący modeli mikroekonometrycznych pochodzi z książki Camerona i Trivediego (2009). Jest on zresztą wykorzystywany także w innych podręcznikach. Załóżmy, że zmienna x oznacza lata nauki, zmienna y oznacza zarobki danej osoby, a  jest składnikiem losowym w modelu liniowym, w którym y jest zmienną objaśnianą, a x zmienną objaśniającą. Przy klasycznych założeniach MNK x nie jest skorelowana z . Wtedy zwykły MNK-estymator β dla parametru regresji y względem x jest estymatorem zgodnym. Pamiętajmy, że  zawiera wszystkie czynniki, które wpływają na y, a nie są uwzględnione w x. Jednym z nich są zdolności danej osoby. Są one jednak skorelowane ze zmienną x: wiemy, że większe zdolności idą w parze z większą liczbą lat nauki. Z tego wynika, że zwykły estymator MNK dla β nie jest zgodny: ten estymator zawiera bowiem zarówno efekt bezpośredni liczby lat nauki względem zmiennej y, jak i efekt pośredni – poprzez składnik losowy . Osoby z dużą liczbą lat nauki mają także prawdopodobnie duże zdolności, dużą wartość , a w konsekwencji dużą wartość y. Jeśli oszacujemy model za pomocą MNK i otrzymamy oszacowanie β na poziomie 400 zł (co oznacza przyrost miesięcznych zarobków na 1 rok nauki), to nie wiemy, jaka część tej liczby wynika z wpływu samej nauki (x), a jaka – z wpływu zdolności (). Rozwiązaniem problemu byłoby wprowadzenie obok x zmiennej reprezentującej „zdolności”. Na ogół nie jest to jednak możliwe. Wtedy jedynym wyjściem jest poszukanie odpowiedniego „instrumentu”, to jest zmiennej z, która nie jest skorelowana z , a która jest bezpośrednio skorelowana z x. W tym przykładzie taką zmienną może być odległość od miejsca zamieszkania do wyższej uczelni. Taka zmienna z może mieć wpływ na liczbę lat nauki (x) i jednocześnie bezpośrednio nie wpływa na wartość y. Odpowiedni estymator metody zmiennych instrumentalnych dla parametru β jest estymatorem zgodnym. Testowanie endogeniczności i metoda zmiennych instrumentalnych są omówione w wielu podręcznikach ekonometrii, na przykład Wooldridge’a (2002, 2003). 1.4.6. Heterogeniczność Korzyści z dezagregacji danych, czyli korzyści z mikrodanych, są w jakimś sensie okupione potrzebą uwzględniania niejednorodności danych w analizach. Niejednorod- ność (heterogeniczność), a właściwie nieobserwowana niejednorodność, odgrywa ważną rolę w mikroekonometrii. Wiele zmiennych, które mają własność niejednorodności, można obserwować, np. płeć, wykształcenie, czynniki socjodemograficzne. Inne, na przykład motywacja, zdolności, inteligencja itd. są nieobserwowalne bądź nie dają się dobrze obserwować. Najprostszym rozwiązaniem jest zignorowanie takiej niejednorodności i włączenie jej do składnika losowego. To jednak zwiększa niewyjaśnioną w modelu część zmienności zmiennej endogenicznej (objaśnianej). W istocie ignorowanie wyraźnych różnic indywidualnych prowadzi do pomylenia z innymi czynnikami, które też są źródłem wyraźnych różnic indywidualnych. To pomylenie występuje wtedy, kiedy nie da się 29 1.4. Główne zagadnienia mikroekonometrii Rozdział 1 statystycznie wydzielić indy
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Mikroekonometria. Modele i metody analizy danych indywidualnych
Autor:
, ,

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: