Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00039 006579 18458205 na godz. na dobę w sumie
Statystyka przestrzenna. Metody analizy struktur przestrzennych - ebook/pdf
Statystyka przestrzenna. Metody analizy struktur przestrzennych - ebook/pdf
Autor: Liczba stron: 222
Wydawca: C. H. Beck Język publikacji: polski
ISBN: 978-83-255-6216-8 Data wydania:
Lektor:
Kategoria: ebooki >> biznes >> ekonomia
Porównaj ceny (książka, ebook, audiobook).

Książka Statystyka przestrzenna. Metody analizy struktur przestrzennych poświęcona jest metodom statystycznym umożliwiającym analizę i wizualizację danych geograficznych oraz innych informacji zlokalizowanych przestrzennie. Zaprezentowane w niej zostały:

(...) Monografia stanowi najbardziej obszerne i kompleksowe ujęcie zagadnień statystyki przestrzennej w aktualnie dostępnych pracach polskojęzycznych.

(...) W sposób bardzo obszerny i kompleksowy oraz, co należy podkreślić, atrakcyjny pod względem formy przekazywanych treści pozwala zapoznać się metodami statystyki przestrzennej, a w szczególności metodami analiz struktur przestrzennych. Obejmuje zarówno podstawową, jak i bardziej zaawansowaną wiedzę z zakresu analiz przestrzennych.

(...) Jest to obszerne kompendium wiedzy, zawierający zarówno warstwę teoretyczną, metodologiczną, jak i elementy aplikacyjne, opatrzone wieloma przykładami i wizualizacji.

(...) Posiada dużą wartość poznawczą i edukacyjną. Prezentuje metody statystyki przestrzennej relatywnie nowe i rzadko stosowane w Polsce.

(...) Książka powinna spotkać się z ogromnym zainteresowaniem badaczy zajmujących się zarówno zagadnieniami teoretycznymi i metodologicznymi analiz przestrzennych, jak i praktycznymi zastosowaniami metod i wizualizacji danych przestrzennych. Pozycję tę można rekomendować również studentom, uczestnikom studiów doktoranckich i podyplomowych z dobrym przygotowaniem statystycznym i informatycznym.

Dr hab. Elżbieta Sobczak, prof. UE

Uniwersytet Ekonomiczny we Wrocławiu

Prof. dr hab. Jadwiga Suchecka jest profesorem zwyczajnym, kierownikiem Katedry Ekonometrii Przestrzennej w Uniwersytecie Łódzkim oraz kierownikiem Zakładu Finansowania Ochrony Zdrowia Uniwersytetu Medycznego w Łodzi. Prowadzi badania naukowe i zajęcia dydaktyczne z zakresu ekonometrii, statystyki, metody reprezentacyjnej, ekonomii oraz ekonomii zdrowia. Jest autorką wielu publikacji i ekspertyz z zakresu statystyki, ekonometrii, ekonometrii zdrowia oraz ekonomii zdrowia i opieki zdrowotnej.

Renata Jaworska, Edyta Łaszkiewicz i Emilia Modranka kończą realizację swoich rozpraw doktorskich z zakresu zastosowań zaawansowanych metod statystyki przestrzennej i ekonometrii przestrzennej w Katedrze Ekonometrii Przestrzennej Uniwersytetu Łódzkiego.


Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

Statystyka Statystyka przestrzenna przestrzenna Metody analiz struktur przestrzennych Redakcja naukowa Jadwiga Suchecka Statys_przestrz_str 5/23/14 11:12 AM Page 1 Statystyka przestrzenna Statys_przestrz_str 5/23/14 11:12 AM Page 2 Autorzy: Renata Jaworska rozdzia∏y 2*, 3*, 4*, 5* Edyta ¸aszkiewicz rozdzia∏y 3*, 4*, 6, 7 Emilia Modranka rozdzia∏y 3*, 4*, 5* Jadwiga Suchecka rozdzia∏y: Wst´p, 1, 2*, Zakoƒczenie* * wspó∏autorstwo Statys_przestrz_str 5/23/14 11:12 AM Page 3 Statystyka przestrzenna Metody analiz struktur przestrzennych Redakcja naukowa Jadwiga Suchecka WYDAWNICTWO C.H.BECK WARSZAWA 2014 Wydawca: Dorota Ostrowska-Furmanek Redakcja merytoryczna: Danuta Kamińska-Hass Recenzent: dr hab. Elżbieta Sobczak, prof. UE we Wrocławiu Projekt okładki i stron tytułowych: Maryna Wiśniewska Ilustracja na okładce: c(cid:13) Mark Evans/iStockphoto.com Seria: Metody ilościowe Złożono programem TEX Publikacja dofinansowana przez Katedrę Ekonometrii Przestrzennej Uniwersytetu Łódzkiego c(cid:13) Wydawnictwo C.H.Beck 2014 Wydawnictwo C.H.Beck Sp. z o.o. ul. Bonifraterska 17, 00-203 Warszawa Skład i łamanie: Wydawnictwo C.H.Beck Druk i oprawa: Elpil, Siedlce ISBN 978-83-255-6215-1 e-book 978-83-255-6216-8 Spis treści . . . . . . . . . . . . . . . . . . . . . . . . . . Wykaz symboli . . . . . . . . . . . . . . . . . . . . Wstęp (Jadwiga Suchecka) . . . . . . . . . . . . . . . . Rozdział 1. Wprowadzenie do statystyki przestrzennej (Jadwiga Suchecka) . . . 1.1. Metody analiz przestrzennych – podstawowe definicje i pojęcia . . . . . . 1.2. Informacje przestrzenne – klasyfikacja, pomiar zmiennych . . . . . . . . . 1.3. Jakość danych przestrzennych . . . . . . . . . . . . . . . . . . . 1.4. Niepewność w danych przestrzennych . . . . . . . . . . . . . . . . . . . 1.5. Reprezentatywności próby w badaniach przestrzennych . . . . . . . . . . . . . . . . . Rozdział 2. Geneza i rozwój metod statystyki przestrzennej (Jadwiga . . . . . . . . . . . . . . . . . . . . . . . . . Suchecka, Renata Jaworska) . . . . . . . 2.1. Statystyka przestrzenna jako dziedzina analizy przestrzennej 2.2. Rozwój metod statystyki przestrzennej . . . . . . . . . . . . . . . . . . . 2.3. Powiązanie statystyki przestrzennej z innymi dziedzinami . . . . . . . . . 2.3.1. Statystyka przestrzenna a tradycyjna statystyka . . . . . . . . . . . 2.3.2. Statystyka przestrzenna a geografia . . . . . . . . . . . . . . . . . 2.3.3. Statystyka przestrzenna a ekonometria przestrzenna . . . . . . . . . . . Rozdział 3. Dane przestrzenne – podstawowe zagadnienia (Renata Jaworska, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Dane obszarowe . 3.1.2. Dane powierzchniowe (geostatystyczne) 3.1.3. Dane punktowe . . 3.1.4. Dane przestrzenno-czasowe . Edyta Łaszkiewicz, Emilia Modranka) . . . . . . . . . 3.1. Klasyfikacja i własności danych przestrzennych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Wybrane problemy związane z agregacją danych przestrzennych . . . . . 3.2.1. Problem MAUP i błąd ekologiczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Błąd atomistyczny . . . . . . . . . . . . . . . . . . . 3.2.3. Efekt krawędzi . . . . . . . . . . . . . . . . . . . . 3.3.1. Charakterystyka danych przestrzennych . . . . . . . . . . . . . . . 3.3.2. Model wektorowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Modele danych przestrzennych . . 3.3.2.1. Model wektorowy TIN . 3.3.2.2. Model wektorowy sieci . . 3.3.3. Model rastrowy . . 3.3.4. Konwersja danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 11 17 17 19 24 25 29 34 34 40 43 43 44 45 48 48 52 53 54 55 56 56 61 62 64 64 67 71 74 74 75 5 Spis treści Rozdział 4. Wizualizacja danych przestrzennych (Renata Jaworska, Edyta . . . . . . . . . . . . . . . . . . . Łaszkiewicz, Emilia Modranka) . . . . . . . . . . 4.1. Metody przedstawiania zjawisk przestrzennych . . . . . . . . . . . . . . . . . 4.2. Mapy tematyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1. Kartogram . . . . . . . . . . . . . . . . . . . . . . . 4.2.2. Kartodiagram . . . . . . . . . . . . . . . . . . . . . . 4.2.3. Mapa sygnaturowa . . . . . . . . . . . . . . . . . . . . . . 4.2.4. Mapa punktowa (kropkowa) . 4.2.5. Mapa izolinii (izarytmiczna) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.6. Mapa chorochromatyczna . 4.3. Problem doboru przedziałów klasowych danych ilościowych map . . . . . . . . . . . . . . . . . . . tematycznych . 4.3.1. Grupowanie wartości szeregów indywidualnych na podstawie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . wielkości odstępów pomiędzy wartościami atrybutów . . . . . . . 4.3.1.1. Podejście arytmetyczne . . . . . . . . . . . . . . . . . . 4.3.1.2. Podejście statystyczne . . . . . . . . . . . . . . . . . . . 4.3.2. Grupowanie wartości szeregów indywidualnych na podstawie 79 79 81 81 83 85 86 87 88 89 90 90 92 . . . . . . liczebności klas . . . . . . . . . . . . . . . . . . . . . 4.3.3. Grupowanie optymalizacyjne na podstawie metody Jenksa . . . . 4.3.4. Ocena poprawności wyników grupowania wartości atrybutów . . . 4.4. Wizualizacja przepływów oraz tendencji przestrzenno-czasowych . . . . 4.4.1. Sześcian czasowo-przestrzenny . . . . . . . . . . . . . . . . . . . 4.4.2. Kartodiagram dynamiczny . . . . . . . . . . . . . . . . . . . . 4.4.3. Kartodiagram liniowy wektorowy . . . . . . . . . . . . . . . . . . 93 93 95 97 97 99 99 4.5. Oprogramowanie komputerowe do wizualizacji danych przestrzennych . . 101 . . . . . . . . . . . . . . . . . . . . 102 . . . . . . . . . . . . . . . . . . . . 105 4.6. Wizualizacja z wykorzystaniem aplikacji internetowych . . . . . . . . . . 106 . . . . . . . . . . . . . . . . . . . . 107 4.6.1. OECD eXplorer . 4.6.2. Moduły do wizualizacji na portalu Eurostatu i Banku Światowego 108 4.6.3. Wizualizacja za pośrednictwem Portalu Geostatystycznego . . . . 109 4.5.1. Quantum GIS . . 4.5.2. MapViewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rozdział 5. Metody opisowej statystyki przestrzennej oraz wybrane zagadnienia eksploracyjnej analizy danych przestrzennych (Renata . Jaworska, Emilia Modranka) 5.1. Statystyki tendencji centralnej . . . 5.1.1. Średnia centralna . 5.1.2. Średnia centralna ważona . 5.1.3. Mediana centralna . . . 5.1.4. Mediana centralna ważona . . . . . . . . . . . . . . . . . . . 111 . . . . . . . . . . . . . . . . . . . . 112 . . . . . . . . . . . . . . . . . . . . 112 . . . . . . . . . . . . . . . . . . . . 113 . . . . . . . . . . . . . . . . . . . . 117 . . . . . . . . . . . . . . . . . . . . 117 . . . . . . . . . . . . . . . . . . . . 119 . 5.2.1. Średnia odległość . . . . . . . . . . . . . . . . . . . . . 119 5.2.2. Średnia odległości kwadratowych . . . . . . . . . . . . . . . . . . 119 5.2.3. Odległość standardowa . . . . . . . . . . . . . . . . . . . . . 121 5.2.3.1. Reguła trzech sigm w wymiarze przestrzennym . . . . . . 122 5.2.4. Względna odległość standardowa . . . . . . . . . . . . . . . . . . 124 5.2.5. Elipsa odchylenia standardowego . . . . . . . . . . . . . . . . . . 125 5.2.5.1. Kąt rotacji elipsy . . . . . . . . . . . . . . . . . . . . . 126 5.2.5.2. Półosie symetrii elipsy . . . . . . . . . . . . . . . . . . . 128 5.2. Statystyki dyspersji . . . . . . . . . . . . . . . . . . . . . . 6 Spis treści 5.3. Analiza skupień . 5.2.5.3. Elipsa dyspersji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 . . . . . . . . . . . . . . . . . . 135 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rozdział 6. Operacjonalizacja zależności przestrzennych w postaci macierzy Rozdział 7. Przegląd macierzy wag przestrzennych (Edyta Łaszkiewicz) 6.1.1. Nieujemna macierz W . . 6.1.2. Mechanizm autoselekcji . 6.1.3. Standaryzacja elementów macierzy W . . . . . 6.1.4. Symetryczna macierz W . wag (Edyta Łaszkiewicz) . . . . . . . . . . . . . . . 145 6.1. Podstawy budowy macierzy wag przestrzennych . . . . . . . . . . . . . . 147 . . . . . . . . . . 148 . . . . . . . . . . . . . . . . . . 152 . . . . . 153 . . . . 155 6.2. Sposoby podejścia do budowy macierzy wag przestrzennych . . . . . . . 158 6.3. Sposoby klasyfikacji macierzy wag . . . . . . . . . . . . . . . . . . . 162 6.4. Wybrane problemy doboru macierzy wag przestrzennych . . . . . . . . . 167 . . . . 169 . . . . . . . . . . . . . . . . . . 169 7.1.1. Sąsiedztwo w modelu danych wektorowych . . . . . . . . . . . . 172 7.1.1.1. Macierze sąsiedztwa dla danych punktowych . . . . . . . 172 7.1.1.2. Macierze sąsiedztwa dla danych obszarowych . . . . . . . 175 7.1.2. Kalkulacja odległości na podstawie danych obszarowych . . . . . 177 7.1.2.1. Minimalny dystans między poligonami . . . . . . . . . . 178 7.1.2.2. Wybrane sposoby wyznaczania centroidów . . . . . . . . 179 7.1.3. Podstawowe zagadnienia związane z teselacją . . . . . . . . . . . 182 7.1.3.1. Wybrane teselacje regularne . . . . . . . . . . . . . . . . 183 7.1.3.2. Wybrane teselacje nieregularne . . . . . . . . . . . . . . 184 . . . . . . . . . . . . . . . . . . 187 7.2. Macierze odległości . 7.1. Macierze sąsiedztwa . . . . . . . . . . . . . . . . . . . . . . 7.2.1. Pomiar odległości w kartezjańskim i sferycznym układzie . . . . . . . . . współrzędnych . . . . . . . . . . . . . . . . . . . 187 7.2.2. Sposoby ważenia dystansu geograficznego . . . . . . . . . . . . . 188 7.2.3. Wybrane, alternatywne sposoby definiowania odległości . . . . . . 191 7.3. Macierze przepływów i interakcji sieciowych . . . . . . . . . . . . . . . 193 . . . 198 . . . . . . . . . . . . . . . . . . 202 . . . . . . . . . . . . . . . . . . 213 Zakończenie (Jadwiga Suchecka, Edyta Łaszkiewicz) Bibliografia . . . Indeks rzeczowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Wykaz symboli punkty antypodyczne elipsy, promień okręgu zawierającego badane jednostki geograficzne, kąt nachylenia osi Y elipsy względem układu współrzędnych (OY ), – – – – wskaźnik dokładności granic, indeks koncentracji Levefera, – – odległość pomiędzy górnymi i dolnymi granicami przedziałów klasowych, domena (region próby), odległość, odległość pomiędzy punktami, – – – – metryka odległości, – ważona średnia odległość pomiędzy wszystkimi punktami pole powierzchni elipsy, zlokalizowanymi w przestrzeni, standardowa odległość ważona wartościami analizowanej zmiennej, – – średnia odległość kwadratowa, – ważona odległość kwadratowa, – – waga statystyki centrograficznej w wyrażeniu względnym, – wskaźnik ekscentryczności, – – wartość współczynnika dopasowania wariancji, – – – – wskaźnik relatywnego rozproszenia, – hipergraf, błąd kwadratowy dla ustalonej liczby klastrów, liczba przedziałów, geometryczna ekscentryczność elipsy (inaczej mimośród), dodatkowo inna wartość charakteryzująca czas albo inną cechę obiektu, – mediana centralna, – ważona mediana centralna, – średnia odległość, A, A0, B, B0 Az α BAI Ca Ck D d dij dik Dw dz DS DSw F fi E e GVF H J k LSr m MC MCw MDc 8 MDw N Ne nj OAI Oj Pi r RD Rd Rn s SDAM SDCM si sj Sr t TAI vkj W Wc Wg wij Wr WV ×E X(si) x, y xij xj xmax xmin x Z z zij σmax Wykaz symboli rozstęp zmiennej Xj, powierzchnia obiektów przestrzennych, liczba porządkowa granicy, przestrzeni, przestrzeń n-wymiarowa, liczba granic kartogramu, suma kwadratów odchyleń od średniej arytmetycznej całej populacji, suma kwadratów odchyleń od średnich dla klas, i-ty obiekt/obszar w przestrzeni geograficznej, odchylenie standardowe zmiennej Xj, struktura obszaru rozproszenia, czas, – ważona średnia odległość, łączna liczba obserwacji, – liczba punktów położonych w obszarze elipsy, – – liczba obserwacji w j-ej klasie – wskaźnik dokładności wizualnej, – – – – względna odległość, – – – – – – – – – – wskaźnik dokładności tabelarycznej, – – macierz wag przestrzennych, – macierz standaryzowana kolumnami, – macierz standaryzowana (zbilansowana) globalnie, – – macierz standaryzowana wierszami, – macierz incydencji, – – – wartość zmiennej Xj dla i-tej jednostki przestrzennej, – wartość j-ego atrybutu (cechy), – maksymalna wartość cechy w szeregu, – minimalna wartość cechy w szeregu, – macierz wartości znormalizowanych, – wartość wysokości, lokalizacja punktu w przestrzeni przestrzenna zmienna losowa X w kolejnych lokalizacjach si, długość geograficzna i szerokość geograficzna, trójwymiarowej, standaryzowana wartość zmiennej Xj dla i-tej jednostki, – – wielka półoś symetrii elipsy, 9 j-a składowa wektora miar położenia obliczonego dla k-tej klasy, element macierzy wag przestrzennych, Wykaz symboli σmin 2σmin 2σmax – mała półoś symetrii elipsy, – mała oś symetrii elipsy, – wielka oś symetrii elipsy. Wstęp Statystyka przestrzenna w ogólnym znaczeniu jest nauką dostarczającą odpo- wiednich metod umożliwiających opis struktur oraz zależności przestrzennych (interakcji) i wywodzi się z analiz przestrzennych. Analiza przestrzenna naj- częściej jest definiowana jako zbiór procedur, których wyniki działania zależą od lokalizacji opisanych zestawem danych wejściowych obiektów lub procesów w przestrzeni geograficznej. Rodzaj danych przestrzennych implikuje sposób wy- dobywania z nich wiedzy, jak i zastosowań metod graficznej prezentacji oraz technik analiz ilościowych. Wynika stąd, że ostateczny rezultat prowadzonych ana- liz może być uzależniony głównie od przyjętej lokalizacji badanych obiektów (tzn. jeżeli zmieni się lokalizacja danych wejściowych, zmianie ulegnie wynik końcowy analizy), ale również od tendencji do zmian w czasie (wynikiem są zmiany w prze- strzennym rozkładzie badanej zmiennej w poszczególnych jednostkach czasu). Celem analiz przestrzennych jest dostarczenie takich procedur, które umożli- wiają przekształcenie informacji przestrzennych w oparciu o przyjęty algorytm na wyniki w postaci liczb, tabel lub zestawień tabelarycznych wykresów oraz map. Analizy przestrzenne i przestrzenno-czasowe zarówno pod względem teo- retycznym, jak i praktycznym odnoszą się do zjawisk złożonych i wzajemnie współzależnych. Stąd też wymaga się, aby przestrzenne dane statystyczne cha- rakteryzowały się odpowiednią jakością. Ogólnie jakość danych, ich dokładność i zawartość informacyjna umożliwia określenie rzeczywistych prawidłowości do- tyczących zachowań, działań, warunków funkcjonowania lub rozwoju obiektów przestrzennych (np. dane regionalne lub terytorialne), co w efekcie prowadzi do sformułowania właściwych hipotez (rys. 1). Rysunek 1. Zależności między poszczególnymi etapami analizy przestrzennej Źródło: opracowanie własne. 11 Wstęp Zasadniczym celem książki jest omówienie różnych metod analizy i prezenta- cji złożonych w swojej strukturze danych przestrzennych i przestrzenno-czasowych zarówno z punktu widzenia teorii, jak i praktyki. Powiązania pomiędzy poszcze- gólnymi etapami analizy przedstawiono na rys. 1. Niniejsza monografia stanowi pierwszy z kilku planowanych tomów, poświęconych różnym rodzajom analizy przestrzennej. Składa się ze wstępu, siedmiu rozdziałów, zakończenia i bibliografii. Rozdział pierwszy (Wprowadzenie do statystyki przestrzennej) stanowi wpro- wadzenie do tematyki szeroko rozumianej statystyki przestrzennej i ma na celu zapoznanie czytelnika ze stosunkowo nową dziedziną wiedzy, jaką jest statysty- ka przestrzenna. W podrozdziale 1.1 omówiono podstawowe zagadnienia oraz pojęcia stosowane w analizach przestrzennych. Przedmiotem podrozdziału 1.2 jest przedstawienie metod pomiaru oraz klasyfikacji informacji przestrzennych. W kolejnych rozdziałach omówiono znaczenie jakości oraz niepewności danych przestrzennych. W ostatnim podrozdziale odniesiono się do problemu reprezenta- tywności próby w badaniach przestrzennych. Rozdział drugi (Geneza i rozwój metod statystyki przestrzennej) ma na celu przybliżenie okoliczności powstawania i rozwoju metod statystyki przestrzennej w odniesieniu do statystyki klasycznej, geografii oraz ekonometrii przestrzennej. W podrozdziale 2.1 przedstawiono rozwój metod statystyki przestrzennej, który zapoczątkowało powstanie kartografii i formalizowanie jej technik w drugiej po- łowie XX wieku. Pierwsze wzmianki na temat statystyki przestrzennej pojawiły się w pracach: Yule’a z 1926 r. (w nawiązaniu do korelacji zmiennych ubocz- nych przypisywanych autokorelacji [Yule, 1926]), Stephana ([Stephan, 1934, s. 165], gdzie stwierdził on, że dane geograficzne są ze sobą powiązane, jak kiście winogrona, a nie dzielone, jak kule w urnie), Fischera ([Fischer, 1935], rando- mizacyjne badania rolne). Osiągnięcie Fischera należy oceniać przez pryzmat opracowania eksperymentalnego projektu randomizacji, opartego na neutralizacji efektów przestrzennych autokorelacji terenowych prób rolnych. Uznanie i kon- ceptualizacja problemu autokorelacji przestrzennej charakteryzowały wczesny okres rozwoju statystyki przestrzennej. Do rozwoju statystyki przestrzennej (podrozdział 2.2) niewątpliwie przyczyni- ły się prace poświęcone ilościowemu podejściu do autokorelacji przestrzennej. Za najważniejsze w tym zakresie uważa się opracowania Morana [1950] i Geary’ego [1954]. W 1973 roku Cliff i Ord opracowali teorię rozkładu dla statystyk autoko- relacji przestrzennej [Cliff, Ord, 1973]. Drugi kierunek rozwoju metod statystyki przestrzennej był związany z geostatystyką. We wczesnych latach pięćdziesiątych XX wieku D. Krige przyczynił się do powstania metod interpolacji (szacowania) nieznanej wartości zmiennej na podstawie wartości z obszarów sąsiadujących. W podrozdziale 2.3 zostały wyjaśnione podobieństwa i różnice w zakresie sta- tystyki przestrzennej i ekonometrii przestrzennej. Obie dziedziny nauki mają wiele wspólnego i w dużym stopniu pokrywają się, zwłaszcza ze względu na wypracowa- ne techniki i metody. Elementami wspólnymi są m.in. własności estymatorów, sta- tystyki autokorelacji przestrzennej i eksploracyjna analiza danych przestrzennych. 12 Wstęp Rozdział trzeci (Dane przestrzenne – podstawowe zagadnienia) zawiera omó- wienie własności danych przestrzennych, a także możliwości ich pozyskiwania oraz konwersji. Stanowi to podstawę i jednocześnie warunkuje wykorzystywanie od- powiednich metod analizy z zakresu statystyki przestrzennej. W podrozdziale 3.1 scharakteryzowano typy danych statystycznych wykorzystywanych w analizach przestrzennych, ze szczególnym uwzględnieniem klasyfikacji według informacji. Dzieli ona dane przestrzenne na powierzchniowe (surface data), obszarowe (area data, lattice data) oraz punktowe (point patterns data). Omówiono również włas- ności poszczególnych zmiennych i scharakteryzowano najważniejsze problemy związane z analizami bazującymi na danych przestrzennych oraz wskazano moż- liwe rozwiązania. W podrozdziale 3.2 omówiono wybrane problemy związane z agregacją danych przestrzennych i związanych z nimi błędami. Skoncentrowano się na trzech wybranych błędach i efektach dotyczących sytuacji, gdy są dokony- wane: agregacja danych punktowych, wnioskowanie o zależnościach makro, mezo lub mikro oraz łączenie krawędzi analizowanych obszarów. Pierwszy z wymienio- nych błędów, tzw. MAUP (Modifiable Areal Unit Problem), to błąd wynikający z faktu analizy danych punktowych za pomocą danych zagregowanych. Przyję- cie takiego podejścia oznacza, że w zależności od sposobu wyznaczania granic jednostek agregacja danych pierwotnych może prowadzić do różnych wyników. Na fakt ten wskazywano m.in. w pracach [Gehlke, Biehl, 1934] oraz [Openshaw, 1984]. Błąd ekologiczny powstaje w przypadku wnioskowania o mikrozależno- ściach w oparciu o dane zagregowane [Gould, Fieldhouse, 1997]. Z kolei błąd atomistyczny jest efektem nieuprawnionego wnioskowania o mezo- i makroza- leżnościach na podstawie danych zagregowanych. Przyjęcie różnych zakresów przestrzennych tych samych wyjściowych indywidualnych danych obszarowych często prowadzi do popełnienia błędu zwanego efektem krawędzi. W podrozdziale 3.3 zostały omówione własności, formaty zapisu i moż- liwości wykorzystania w badaniach wektorowych modeli przestrzennych oraz rastrowych modeli przestrzennych. Model wektorowy służy do przedstawie- nia i przechowywania danych dyskretnych (obiektów o dokładnie ustalonym kształcie), odwzorowanych na mapie za pomocą punktów, linii oraz obszarów zamkniętych (poligonów). Punkty są opisane przez pary współrzędnych x i y. Linie stanowią zbiory współrzędnych definiujących kształt, poligony są opisa- ne za pomocą zbiorów współrzędnych definiujących, granice zamykają obszary. Model rastrowy jest wykorzystywany do przedstawienia danych przestrzennych za pomocą siatki regularnych komórek. W celu ulokowania modelu rastrowego w przestrzeni geograficznej wymagane są współrzędne co najmniej jednego z je- go narożników. Modele rastrowe są stosowane do przechowywania i analizowania ciągłych zjawisk powierzchniowych. Komórki rastra są przyporządkowane do klasy lub kategorii i mają określoną wartość pomiarową. Ten sposób prezentacji danych przestrzennych w formie cyfrowej może być tworzony zarówno na podsta- wie próbek punktowych, jak i przetworzenia danych wektorowych. Dane rastrowe 13 Wstęp mogą zawierać również atrybuty dla każdej z wyróżnionych kategorii. Natomiast dane wektorowe prezentują wartości atrybutów dla każdego obiektu. W rozdziale czwartym (Wizualizacja danych przestrzennych) omówiono możliwości graficznej prezentacji danych przestrzennych. W podrozdziale 4.1. scharakteryzowano ogólnie metody wizualizacji zjawisk i procesów prze- strzennych. W podrozdziale 4.2. skoncentrowano się na omówieniu często stosowanego sposobu wizualizacji, jakim są mapy tematyczne. Zaprezentowano sposoby graficznej prezentacji danych przestrzenno-czasowych, ze szczególnym uwzględnieniem sześcianu czasowo-przestrzennego (Space-Time-Cube), który jest najbardziej widocznym elementem w modelu przestrzenno-czasowym [Häger- strand, 1970, s. 247–257]. Sześcian przestrzenno-czasowy łączy czas i przestrzeń w sposób naturalny. W prezentacji graficznej czas może być wyrażony jako zmienna ciągła lub dyskretna na trzeciej osi Z, natomiast osie X i Y wskazują przestrzeń 2D. Jest to forma alternatywna do tradycyjnych metod wizualizacji danych przestrzenno-czasowych. Najbardziej popularnymi metodami są metody umożliwiające przedstawienie zjawiska na jednej mapie statycznej lub na wielu mapach statycznych i animacja zjawiska na mapie. W przypadku stosowania te- go typu rozwiązania trudno jest pokazać złożone zmiany, gdy punkty znakujące różne momenty w czasie pokrywają się. Poszczególne małe mapy przedstawiają sekwencję czasową w ten sposób, że każda mapa dotyczy kolejnego momentu w czasie. Ułatwia to znalezienie różnic między dwoma punktami w przestrzeni i w czasie. Ograniczeniem w stosowaniu tego sposobu wizualizacji jest długość szeregu czasowego, która wymaga utworzenia dużej liczby map, co w rezultacie czyni opis zjawiska nieczytelnym. Drugie rozwiązanie, wykorzystujące animację map, ułatwia diagnozowanie tendencji w czasie. Odbiorca takiej mapy sam może kontrolować prędkość animacji i zatrzymać ją w dowolnym momencie czasu. Wadą tego sposobu wizualizacji danych przestrzenno-czasowych jest duża liczba zmieniających się obrazów, przez co łatwo można przeoczyć istotny moment. Rozdział zamyka prezentacja wybranego oprogramowania komputerowego oraz aplikacji internetowych do wizualizacji danych przestrzennych. Rozdział piąty (Metody opisowej statystyki przestrzennej oraz wybrane za- gadnienia eksploracyjnej analizy) został podzielony na dwie części – w pierwszej części przedstawiono statystyki tendencji centralnej oraz dyspersji, a w części drugiej metody eksploracyjnej analizy danych przestrzennychg (Exploratory Spa- tial Data Analysis, ESDA). W podrozdziale 5.1 przedstawiono główne miary opisujące lokalizację obiektów przestrzennych. Średnia centralna (środka ob- szaru) stanowi średnią arytmetyczną współrzędnych geograficznych (x, y), czyli długości i szerokości geograficznej, obiektów przestrzennych w postaci punk- tów. W przypadku obszarów (poligonów) wyznacza się ich geometryczny środek (centroid). Ważona średnia centralna obszaru jest też interpretowana jako środek ciężkości dla badanego obszaru pod względem badanej cechy. Mediana central- na (mediana euklidesowa), w przeciwieństwie do średniej centralnej obliczonej jako średnia dla koordynat, jest wyznaczona na podstawie minimalizacji sumy 14 Wstęp odległości euklidesowej z i-tego punktu do punktu mediany centralnej. Ważona mediana centralna uwzględnia wartości zmiennej (również wielkości absolutne) charakteryzującej punkty w przestrzeni geograficznej. Zaletą tej charakterystyki rozkładu przestrzennego zmiennej jest minimalizacja odległości między punk- tami o określonych poziomach zmiennej diagnostycznej. Minimalna odległość wyznacza wartość cechy centralnej. W kolejnym podrozdziale (5.2) omówiono statystyki dyspersji wyrażające absolutną miarę rozproszenia punktów w przestrzeni geograficznej. Podob- nie jak w przypadku odchylenia standardowego, również wartości odległości standardowej podlegają wpływom lokalizacji peryferyjnych. W przypadku da- nych przestrzennych wartość standardowej odległości wyznacza promień okręgu o środku wyznaczonym przez średnią centralną. Względna odległość stanowi iloraz odległości standardowej oraz promienia wyznaczającego zakres analizo- wanych obiektów geograficznych. Standardowa miara rozproszenia obiektów przestrzennych pozwala porównywać stopień rozproszenia obiektów w różnych przestrzeniach geograficznych różniących się rozmiarami, a jej obrazem gra- ficznym jest elipsa odchylenia standardowego. Posiada ona tę przewagę nad standardową odległością, że daje możliwość określenia kierunków rozrzutu obser- wacji/obiektów w przestrzeni. W celu zobrazowania powyższych miar tendencji centralnej oraz dyspersji w podsumowaniu podrozdziałów 5.1 i 5.2 zaprezen- towano możliwości niekomercyjnych programów statystycznych w zakresie generowania i wizualizacji opisowych statystyk przestrzennych. W podrozdziale 5.3 zaprezentowano dwie najczęściej wykorzystywane w prak- tyce badawczej metody: metodę eksploracyjnej analizy danych przestrzennych (ESDA) i metodę klasyfikacji danych przestrzennych (cluster analysis). Metoda ESDA to zbiór technik służących do opisu i wizualizacji danych przestrzennych. W przypadku zastosowania analizy skupień duże znaczenie ma wybór odpowied- niej odległości między badanymi obiektami. Najczęściej stosowanymi technikami są: odległość euklidesowa, odległość miejska oraz odległość Czebyszewa. W przy- padku drugiej grupy metod analizie poddano m.in. współczynniki lokalizacji i mierniki koncentracji. W rozdziale szóstym (Operacjonalizacja zależności przestrzennych w postaci macierzy wag) skoncentrowano się na jednym z kluczowych problemów statystyki przestrzennej i ekonometrii przestrzennej, jakim jest operacjonalizacja zależności przestrzennych w postaci macierzy wag. Scharakteryzowano wybrane aspekty budowy i klasyfikacji macierzy wag przestrzennych oraz dokonano analizy problemów związanych z ich doborem. W podrozdziale 6.1 nakreślono podstawy budowy wag przestrzennych i wskazano ich znaczenie dla statystyki przestrzennej. W literaturze przedmiotu [Leenders, 2002] wyróżnia się dwa zasadnicze powody wykorzystania macierzy wag przestrzennych – pierwszy to eliminacja negatywnego wpływu skorelowania obserwacji, a drugi to identyfikacja efektów przestrzennych. Niezależnie od wy- mienionych powodów, można wyróżnić pewne wspólne założenia wyznaczające 15 Wstęp ramy konstrukcyjne. W tym przypadku ważne są założenia dotyczące warto- ści poszczególnych elementów macierzy wag przestrzennych. Założenia te to m.in. zerowe wartości elementów diagonalnych macierzy, nieujemne wartości wszystkich elementów macierzy, reprezentacja w postaci macierzy trójkątnej oraz zastosowanie standaryzacji. Nie zawsze wszystkie założenia są spełnione, a ich naruszenie rodzi określone skutki. W celu uzupełnienia rozważań omówiono sytuacje naruszenia wybranych założeń i wynikające z tego problemy. W podrozdziale 6.2 omówiono szczegółowo różne podejścia do budowy ma- cierzy wag: podejście teoretyczne, podejście topologiczne i podejście empiryczne. Każde z wymienionych podejść determinuje sposób klasyfikacji macierzy wag. W podrozdziale 6.3 scharakteryzowano dwa sposoby klasyfikacji macierzy wag: egzogeniczny, związany z podejściem teoretycznym i w mniejszym stopniu po- dejściem topologicznym, oraz endogeniczny, będący rezultatem zastosowania podejścia empirycznego. Uzupełnieniem tych rozważań jest prezentacja klasyfi- kacji rodzajów wag przestrzennych. Podsumowaniem prezentowanych w rozdziale rozważań jest podrozdział 6.4, w którym scharakteryzowano najistotniejsze pro- blemy związane z doborem wag i wskazano skutki, mogące mieć wpływ na jakość wyników analizy struktur przestrzennych. W rozdziale siódmym (Przegląd macierzy wag przestrzennych) zaprezen- towano wybrane rodzaje wag przestrzennych, koncentrując się na podziale uwzględniającym rodzaju danych (dane punktowe i poligony). W kolejnych pod- rozdziałach omówiono przykłady zastosowań podstawowych typów macierzy wag przestrzennych: macierzy sąsiedztwa (podrozdział 7.1), macierzy odległości (podrozdział 7.2) i macierzy przepływów (podrozdział 7.3). Konstruując macierz sąsiedztwa, należy brać pod uwagę sposób definiowania sąsiedztwa w modelach danych wektorowych (dane punktowe, dane obszarowe) oraz metody wyznaczania granic w przypadku nietypowych poligonów. W macierzach sąsiedztwa waż- nym zagadnieniem jest problem teselacji – zarówno teselacji regularnych, jak i nieregularnych. W konstrukcji macierzy odległości skoncentrowano się na scha- rakteryzowaniu wybranych metryk odległości geograficznych i ekonomicznych (np. bazujących na funkcjach odwrotnych i wykładniczo-odwrotnych) jako sposo- bach ważenia dystansu geograficznego oraz możliwościach sposobu mierzenia odległości. Przegląd kluczowych typów macierzy wag przestrzennych zamyka podrozdział dotyczący macierzy przepływów (np. migracji, czy przepływów han- dlowych) związanych z tzw. danymi dwuczłonowymi (dyadic data). Rozdział 1. Wprowadzenie do statystyki przestrzennej 1.1. Metody analiz przestrzennych – podstawowe definicje i pojęcia Z ogólnej definicji analiz przestrzennych wynika, iż stanowią one zbiór proce- dur, których wyniki są uzależnione od charakteru informacji wejściowych i ich rozmieszczenia w przestrzeni. Zaletą tych metod jest możliwość zamiany danych na użyteczną informację dla odbiorcy uzyskanych wyników, umożliwiając rów- nież odkrycie prawidłowości lub trendów w obserwowanych zmiennych. Oznacza to, że wyniki stosowanych procedur zależą od położenia danych w przestrzeni, a zmiana lokalizacji danych powoduje zmianę wyniku analizy [Waller, Gotway, 2004, s. 26–38]. Podstawowym narzędziem analiz przestrzennych jest tzw. system informacji przestrzennej, którego składowe umożliwiają osiągnięcie zamierzone- go celu badawczego. Do najczęściej stosowanych analiz należą analizy pionowe i analizy poziome. Analizy pionowe znajdują zastosowanie w przypadku badania zależności między obiektami lub między zjawiskami występującymi na określonych po- wierzchniach i na różnych warstwach informacyjnych (np. zgodność zalesienia rzeczywistego z siedliskiem). Analizy poziome mogą być wykorzystane do badania zależności przestrzen- nych obiektów i zjawisk w tej samej warstwie informacyjnej (np. znalezienie najkrótszej drogi, ustalenie kształtu granicy dla badanych obszarów czy ustalenie sąsiedztwa). Istnieją również inne klasyfikacje metod analizy przestrzennej, których rozwój jest związany z informatyzacją i upowszechnieniem specjalistycznego oprogra- mowania. Wśród tych metod można wymienić następujące metody: zapytanie do bazy, pomiary, przekształcenia, statystyki i charakterystyki opisowe, jak również modelowanie (w tym optymalizację i symulację)1. W przypadku metody zapytanie do bazy charakterystyczne jest wyszukiwanie jedynie danych spełniających odpowiednie kryteria i niedokonywanie zmian na danych. Kryteriami zapytania mogą być atrybuty lub lokalizacja obiektu. 1 Obszerny opis metod analizy informacji przestrzennych znajduje się w opracowaniach publiko- wanych w ramach GIS, np. cz. 13: Geovisualization, http://www.dusk.geo.orst.edu/gis/ chapter13_notes.pdf. 17 Rozdział 1. Wprowadzenie do statystyki przestrzennej Zapytanie do bazy może mieć również charakter pytania prostego (co znajduje się we wskazanym miejscu, gdzie znajdują się obiekty o wybranym atrybucie) lub złożonego (gdzie znajdują się obiekty o określonych relacjach, jakie obiekty spełniają zdefiniowane warunki). W metodzie analizy przestrzennej pomiaru są wyznaczane proste charaktery- styki geometryczne obiektów (długość, pole powierzchni, kształt) oraz odległości między punktami w przestrzeni, co wiąże się z wyborem odpowiednich metryk. Pomiar odległości może być związany ze wskazaniem różnicy między rzeczywi- stą długością a długością jej cyfrowej reprezentacji, długością różnicy między krzywą biegnącą po powierzchni terenu a jej rzutem na płaszczyznę odniesienia. Kolejną metodą analiz przestrzennych są przekształcenia, które mogą przy- bierać różne formy: operatorów geometrycznych, arytmetycznych lub logicznych, formę reklasyfikacji i buforowania. O ile zastosowanie różnego rodzaju operato- rów przekształceń nie wymaga szczegółowych wyjaśnień, o tyle warto zwrócić uwagę na ponowną klasyfikację. W ogólnym znaczeniu reklasyfikacja umoż- liwia dokonywanie wszelkich zmian atrybutów obiektów znajdujących się na wybranej warstwie informacyjnej. Ponowna klasyfikacja danych przestrzennych może być oparta na atrybutach, zmianie pikseli umożliwiających ograniczenie liczby obserwacji oraz buforowaniu. Ponowna klasyfikacja obiektów wg atrybutów ma duże znaczenie w prze- kazie informacji od badacza do użytkownika. W wyniku realizacji tego procesu otrzymuje się ograniczony zestaw atrybutów, który posiada informacje użyteczne dla odbiorcy realizującego konkretne zadania badawcze. Ostatecznym rezultatem tego procesu jest nowa mapa tematyczna, tzw. mapa jakościowa, charakteryzująca pewne zjawiska [MacEachren, Kraak, 2001, s. 1–11]. Tworzenie nowych obiektów znajdujących się w określonej odległości od analizowanego obiektu jest związane z buforowaniem. Ta metoda analiz prze- strzennych umożliwia również modyfikowanie odległości przy użyciu dodatkowej informacji w postaci tzw. mapy tarcia (friction layer) lub jako dodatkowy atrybut w bazie danych. Dodatkową zaletą tej metody jest możliwość zastąpienia odległo- ści innymi zmiennymi, np. czasem dotarcia do określonego punktu. W tym kontekście należy wspomnieć o interpolacji przestrzennej, która ma na celu określenie wartości pewnej zmiennej w punkcie, w którym ona nie była mierzona. W celu dokonania interpolacji w pierwszej kolejności należy rozpoznać prawidłowości w rozkładzie przestrzennym danych pomiarowych [Rivoirard, 2006, s. 273–287], wykorzystując do tego celu np. modele liniowe geostatystyki lub predykcję liniową. Metoda umożliwia opracowanie różnych map, w tym map izolowanych, oraz tzw. resampling2 danych rastrowych tworzących poligony. Charakterystyczną 2 Resampling oznacza proces powtórnego próbkowania danych w sytuacji, kiedy pierwotne prób- kowanie okazało się niewystarczające. W statystyce resampling oznacza jedną z trzech następu- jących możliwości: szacowanie nieznanych parametrów rozkładu populacji generalnej za pomocą metody jack-knifing lub metody bootstrap, zamianę miejsca elementów zbioru w przypadku stoso- 18 1.2. Informacje przestrzenne – klasyfikacja, pomiar zmiennych własnością utworzonych w ten sposób poligonów jest to, że ich granice znajdują się w środku odległości między sąsiadującymi punktami. Są to granice wyrażają- ce obszar wpływu dla każdego punktu w badanej przestrzeni lub definiują tzw. wieloboki różnego sąsiedztwa. W tej grupie analiz znajdują się również metody odwrotnej odległości, oszacowanie rozkładu gęstości, operatory sąsiedztwa czy grupowanie przestrzenne3. Specjalną grupę metod analizy przestrzennej (geosta- tystyki) są krigingi. W prezentacji bardzo dużych baz danych przestrzennych ważne jest opisanie takiego zbioru za pomocą wskaźników liczbowych lub pewnych funkcji wyróż- nionych zmiennych. Te zagadnienia znajdują się w nurcie statystyki przestrzennej. Zastosowanie metod statystycznych wymaga jednak rozróżnienia rodzaju danych w obrębie badanego obiektu i ustaleniu, czy są to dane warstwowe, strefowe oraz lokalne, które tworzą jedną warstwę z danymi i podlegają analizie w obrębie pew- nego okna. Reasumując, statystyka przestrzenna w ogólnym znaczeniu jest nauką do- starczającą odpowiednich metod umożliwiających opis struktur przestrzennych i zależności. Metody te pozwalają na analizę zarówno danych geograficznych, jak i innych rodzajów informacji, które mają własność lokalizacji w pewnej prze- strzeni (dane zlokalizowane). Dane przestrzenne mogą być wyrażone w postaci zbioru znaków, zbioru słów lub zbioru liczb (dane statystyczne). 1.2. Informacje przestrzenne – klasyfikacja, pomiar zmiennych W analizach statystycznych wykorzystuje się zbiory liczb charakteryzujące badane jednostki należące do określonej zbiorowości. Możliwa jest również klasyfikacja danych przestrzennych według źródeł informacji oraz według ich typu, czyli postaci. Źródłami informacji przestrzennych są przede wszystkim informacje naturalne – geograficzne oraz ekonomiczno-społeczne. Pierwsza grupa obejmuje informacje uzyskane na podstawie różnego rodzaju pomiarów topologicznych, zdjęć satelitarnych lub samolotowych, nazywanych danymi geograficznymi. Przestrzenne dane geograficzne dotyczą obiektów, zjawisk lub procesów, które można zidentyfikować w układzie współrzędnych. Specyfika danych przestrzennych powoduje konieczność poszukiwania ta- kich metod, które pozwolą na wydobycie informacji o badanych obiektach w przestrzeni, wizualizację danych oraz ilościową analizę struktur przestrzennych i przestrzennych zależności. wania testów permutacji czy losowości oraz walidację modelu danych za pomocą metody bootstrap lub walidacji krzyżowej [Good, 2005]. Resampling jest stosowany również w grafice komputero- wej. Polega on na transformacji tzw. bitmapy powodującej zmianę liczby jej pikseli, powodując rzeczywiste powiększenie, zmniejszenie, zmianę proporcji lub obrót obrazu bitmapowego. 3 Metody te są omówione w kolejnych rozdziałach niniejszej monografii. 19
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Statystyka przestrzenna. Metody analizy struktur przestrzennych
Autor:

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: