Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00785 011106 16907946 na godz. na dobę w sumie
Zrozumieć statystykę - ebook/pdf
Zrozumieć statystykę - ebook/pdf
Autor: Liczba stron: 221
Wydawca: My Book Język publikacji: polski
ISBN: 978-83-7564-263-6 Data wydania:
Lektor:
Kategoria: ebooki >> naukowe i akademickie >> inne
Porównaj ceny (książka, ebook, audiobook).

Od autora: Już od pewnego czasu matematyka (przede wszystkim statystyka) jest nowym mikroskopem biologii, ta zaś stanowi „następną fizykę” dla „królowej nauk” (Cohen 2004). Ukuto nawet odpowiednie określenia uwzględniające specyfikę metodologii, z których najpopularniejszym jest biostatystyka. Czy tego chcemy, czy nie – nie uciekniemy od stosowania technik z repertuaru matematyki w celu poprawy jakości opisu i pełniejszego zrozumienia praw rządzących naturą. Akceptacja takiego stanu rzeczy nie powinna być trudna, gdyż (wierzcie lub nie) na poziomie podstawowym i średnio zaawansowanym statystyka wcale nie jest specjalnie skomplikowana. Niniejszą książkę polecam przede wszystkim studentom i doktorantom biologii, ochrony środowiska, medycyny i kierunków pokrewnych. Niewątpliwie będzie też źródłem przydatnej wiedzy dla pracowników nauki, gdyż prezentowane treści wykraczają w wielu miejscach poza zakres podstawowego kursu statystyki.

Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

1. Wstęp Aby zrozumieć myśli Boga, musimy studiować statystykę, ponieważ jest ona miarą jego celu. Florence Nightingale1 Statystyka jest gramatyką nauki. Karl Pearson2 Jestem pod wrażeniem elegancji definicji statystyki zamieszczo- nej w angielskiej wersji Wikipedii (signum temporis, nawiasem mó- wiąc). Określa się ją tam jako naukę „o efektywnym wykorzysty- waniu danych liczbowych odnoszących się do grup osobników lub eksperymentów”, obejmującą zarówno metody planowania ekspe- rymentów, pozyskiwania danych, jak i ich opisu, analizy oraz in- terpretacji. Statystykę można także traktować jako pewną formę sztuki, gdyż wiele różnych decyzji jest pozostawionych samemu badaczowi. Już od pewnego czasu matematyka (przede wszystkim staty- styka) jest nowym mikroskopem biologii, ta zaś stanowi „następną fizykę” dla „królowej nauk” (Cohen 2004). Ukuto nawet odpowied- nie określenia uwzględniające specyfikę metodologii, z których naj- popularniejszym jest biostatystyka. Czy tego chcemy, czy nie – nie uciekniemy od stosowania technik z repertuaru matematyki w celu poprawy jakości opisu i pełniejszego zrozumienia praw rządzących naturą. Akceptacja takiego stanu rzeczy nie powinna być trudna, gdyż (wierzcie lub nie) na poziomie podstawowym i średnio za- awansowanym statystyka wcale nie jest specjalnie skomplikowana. Niniejszą książkę polecam przede wszystkim studentom i dokto- 1Florence Nightingale (1820-1910) – Angielka, twórczyni współczesnego pie- lęgniarstwa, pionierka technik wizualnej prezentacji danych. 2Karl Pearson (1857-1936) – angielski matematyk, filozof i biolog, jeden z twórców współczesnej statystyki. 11 rantom biologii, ochrony środowiska, medycyny i kierunków po- krewnych. Niewątpliwie będzie też źródłem przydatnej wiedzy dla pracowników nauki, gdyż prezentowane treści wykraczają w wie- lu miejscach poza zakres podstawowego kursu statystyki. Obecna postać tekstu różni się nieznacznie od wersji początkowej – zmiany (poprawki i uzupełnienia) wprowadzone w czerwcu 2011 r. można prześledzić na stronie http://pjadw.tripod.com/errata.htm. Chciałbym gorąco podziękować Kasi (mojej kochanej żonie) za cierpliwość i zrozumienie. Agnieszkę przepraszam za notoryczny brak czasu; masz rację, Maleństwo – tata zbyt dużo czasu spędza przy komputerze. . . Zapraszam do lektury. 12 2. Prawdopodobieństwo i okolice Za każdym razem, gdy mówimy studentom: „oto czym naprawdę jest prawdopodobieństwo”, jesteśmy w błędzie. Prawdopodobieństwo znaczy wiele rzeczy. Glenn Shafer (1991) 2.1 Wprowadzenie Stadion Narodowy, godzina 20.15. Za chwilę rozpocznie się „mecz o wszystko”. Główny arbiter spotkania prosi kapitanów drużyn o podejście, po czym wyjmuje monetę. Po krótkiej wy- mianie zdań srebrzysty krążek zostaje wyrzucony w górę – jeste- śmy świadkami. . . doświadczenia losowego. Jego rezultat zależy od przypadku (stąd nazwa), gdyż zakładamy, że moneta jest „ucz- ciwa”, podobnie zresztą jak sędzia, który będąc profesjonalistą, wprawił monetę w ruch obrotowy. Opisane doświadczenie losowe ma tylko dwa możliwe niepo- dzielne wyniki, czyli mogło zajść jedno z dwóch zdarzeń elementar- nych (ω)3 – wyrzucony został orzeł lub reszka. W tym przypadku przestrzeń zdarzeń elementarnych (Ω)4, zbiór wszystkich zdarzeń elementarnych rozpatrywanego doświadczenia losowego, jest dwu- elementowa. Przestrzeń może być albo zbiorem skończonym (jak powyżej), a przynajmniej przeliczalnym (przestrzeń skokowa, ina- czej dyskretna), albo zbiorem nieprzeliczalnym (przestrzeń ciągła). Przykłady z przyrodniczego podwórka: X Potomek niebieskookiej kobiety (genotyp homozygoty aa) i brązowookiego mężczyzny (genotyp heterozygoty Aa) bę- dzie miał genotyp Aa (ω1) albo aa (ω2) (szanse na każdy 3Omega – mała litera z greckiego alfabetu. 4Omega – duża litera z greckiego alfabetu. 13 z dwóch układów są takie same) – Ω jest zbiorem skończo- nym, dwuelementowym. X Poszukiwania ostatniego wspólnego przodka człowieka i szympansa: zdarzeniem elementarnym (ωi) jest każde zna- lezisko budzących nadzieję szczątków, któremu przypisze się liczbę naturalną od 1 do n, gdzie n symbolizuje sukces. Uzy- skany ciąg stanowi zbiór przeliczalny (w praktyce nieskoń- czony). X Dobowy zapis pracy serca (ωi) ma postać funkcji ciągłej. Ω jest zbiorem nieprzeliczalnym, ponieważ istnieje nieskończe- nie wiele możliwych kształtów elektrokardiogramu. Każdy podzbiór przestrzeni zdarzeń elementarnych jest określany terminem zdarzenie losowe 5. Może on zawierać jeden lub większą liczbę elementów. W przypadku rzutu sześcienną kostką do gry (doświadczenie losowe) zdarzeniem losowym jest zarówno wyrzu- cenie trzech oczek, jak i nieparzystej liczby oczek, a także licz- by oczek większej od dwóch. Zbiór zdarzeń losowych związanych z tym samym doświadczeniem losowym tworzy rodzinę zdarzeń losowych (S ). Zdarzenia losowe mogą być: pewne, niemożliwe lub prawdopodobne. Z punktu widzenia statystyki interesujące są te ostatnie. Zdarzeniami losowymi zajmuje się rachunek prawdopo- dobieństwa stanowiący, bez żadnej przesady, matematyczny fun- dament statystyki. No dobrze, ale czym jest prawdopodobieństwo? 2.2 Koncepcje prawdopodobieństwa Istnieje przynajmniej kilkanaście definicji prawdopodobień- stwa, ale na szczęście nie ma potrzeby zapoznawania się z każdą z nich. W najbardziej ogólnym ujęciu prawdopodobieństwo jest matematycznym sposobem radzenia sobie z problemem niepew- ności. Główne koncepcje tego pojęcia można przyporządkować do dwóch kategorii: obiektywistycznej i subiektywistycznej. Pierwsza 5Operacje na zdarzeniach losowych są więc operacjami na zbiorach. 14 z nich jest najbardziej popularna i zakłada, że prawdopodobień- stwo można przypisać jedynie zdarzeniom powtarzalnym (takim jak rzut kostką do gry lub monetą). Jest ona reprezentowana m.in. przez intuicyjną definicję klasyczną autorstwa Laplace’a6 z 1812 r., według której prawdopodobieństwo wystąpienia zdarzenia A, czyli P(A), jest równe ilorazowi liczby zdarzeń mu sprzyjających (moc zbioru A) i liczby możliwych przypadków (moc zbioru Ω). Możemy to zapisać w następujący sposób: P (A) = = A = Ω (2.2.1) Zakłada się, że zdarzenia są jednakowo możliwe i wzajemnie się wykluczają. Powiedzmy, że interesuje nas prawdopodobieństwo zdarzenia polegającego na wyrzuceniu orła przy jednokrotnym rzucie sy- metryczną monetą. Zbiór możliwych wyników jest dwuelemento- wy (orzeł i reszka), zaś naszemu zdarzeniu sprzyja wyłącznie wy- rzucenie orła. Po podstawieniu otrzymujemy P(O) = 0,5. Prosty problem i proste rozwiązanie. Niestety, zakres stosowalności tego podejścia ogranicza się właśnie do prostych przypadków. Głów- ny problem z definicją klasyczną polega na tym, że wykorzystuje ona pojęcie definiowane (błąd logiczny) – „możliwe” jest synoni- mem „prawdopodobne”. Podobną niedogodność ma definicja geo- metryczna, która za to rozwiązuje inny problem podejścia klasycz- nego – niemożność stosowania w sytuacji, gdy A i Ω są zbiorami nieskończonymi; liczebność tych zbiorów jest zastępowana polem powierzchni lub długością. Definicja częstościowa von Misesa7 (1931 r.), będąca kolejną próbą określenia, na gruncie obiektywizmu, czym jest prawdopo- dobieństwo, utożsamia je z granicą (limes) ciągu częstości. O ile racjonalizm prezentowany przez podejście Laplace’a był oparty na myśleniu w kategoriach matematyki i filozofii, o tyle koncepcja 6Pierre Simon de Laplace (1749–1827) – francuski matematyk, fizyk i astro- nom. 7Richard Edler von Mises (1883–1953) – amerykański matematyk urodzony we Lwowie. 15 częstościowa jest ze swojej natury empiryczna (oparta na obserwa- cjach). Wyobraźmy sobie długą serię doświadczeń losowych, pole- gających na rzucie symetryczną monetą. Interesuje nas prawdopo- dobieństwo wyrzucenia orła, więc po każdym rzucie odnotowujemy względną częstość tego zdarzenia, czyli iloraz liczby wyrzuconych do tej pory orłów i liczby rzutów. Już po wykonaniu kilkudziesię- ciu rzutów monetą powinniśmy zauważyć, że wspomniana wartość zbliża się do pewnej liczby. Jeśli wahania częstości zdarzenia wyka- zują tendencję malejącą, to liczba, ku której dążą, jest szukanym prawdopodobieństwem (ryc. 1). Oczywistą (dla matematyka) wa- dą tej definicji jest to, że nic nie mówi ona o warunku istnienia granicy. Ponadto po każdej serii doświadczeń (w przypadku, gdy była krótka) otrzymamy nieco inne wartości prawdopodobieństwa. l a n d ê g z w æ œ o t s ê z c 0,50 0,25 0 1 50 100 liczba rzutów Ryc. 1. Zapis przykładowych zmian częstości wystąpienia orła w miarę wzrostu liczby wykonanych rzutów symetryczną monetą; ilustracja częstościowej definicji prawdopodobieństwa (von Mise- sa). 16 Przedstawiciele drugiego głównego nurtu, szkoły subiektywi- stycznej, utrzymują, że prawdopodobieństwo reprezentuje subiek- tywny osąd (miarę poziomu ufności), nie zaś obiektywnie mierzal- ną cechę. W związku z tym możemy je stosować także do zdarzeń „jednorazowych”, co nie było możliwe w przypadku stosowania koncepcji obiektywistycznej. Przykładem takiego zdarzenia jest planowana operacja konkretnego pacjenta – interesowałaby nas szansa na powodzenie tej operacji. Żadna z zaprezentowanych definicji nie jest pozbawiona wad, natomiast niektóre z nich są w pewnych okolicznościach bardziej użyteczne. Korzenie dwóch dominujących obecnie szkół statystycz- nych, częstościowej i bayesowskiej 8, tkwią (upraszczając: każda osobno) w omawianych głównych koncepcjach prawdopodobień- stwa. Podejściu bayesowskiemu do prawdopodobieństwa9 poświę- cony jest kolejny podrozdział. Ostatecznie pojęcie prawdopodobieństwa zostało sformalizo- wane przez A. Kołmogorowa10, który w 1933 r. podał aksjomaty- kę teorii prawdopodobieństwa (zestaw aksjomatów, czyli twierdzeń przyjmowanych bez dowodów, i definicji). Wynika z niej, że praw- dopodobieństwo zdarzenia (pomijam pewne założenia) jest liczbą rzeczywistą, dla której zachodzą następujące zależności: X Zakres wartości prawdopodobieństwa zdarzenia losowego A: 0 ¬ P(A)¬1, (2.2.2) przy czym prawdopodobieństwu zdarzenia niemożliwego przyporządkowujemy 0, zaś zdarzenia pewnego 1. X Prawdopodobieństwo zdarzenia przeciwnego: P( ¯A) = 1 – P(A). (2.2.3) 8Thomas Bayes (1702–1761) – angielski matematyk i teolog. 9Nowoczesna interpretacja bayesowska (prawdopodobieństwo jako subiek- tywny stopień wiary w zdarzenie) powstała w latach trzydziestych XX wieku. 10Andriej N. Kołmogorow (1903–1987) – rosyjski matematyk. 17 X Prawdopodobieństwo sumy (alternatywy) np. dwóch zda- rzeń: P(A∪B) = P(A) + P(B) – P(A∩B), (2.2.4) jeśli A i B są zdarzeniami wzajemnie się wykluczającymi, to równanie 2.2.4 przyjmuje postać: P(A∪B) = P(A) + P(B). (2.2.5) X Prawdopodobieństwo iloczynu (koniunkcji) np. dwóch zda- rzeń: P(A∩B) = P(A|B)P(B) = P(B |A)P(A), (2.2.6) jeśli zdarzenia A i B są niezależne, to równanie 2.2.6 możemy uprościć do postaci: P(A∩B) = P(A)P(B). (2.2.7) X Prawdopodobieństwo warunkowe zdarzenia A (jeśli zaszło zdarzenie B; przekształcone równanie 2.2.6): P(A|B) = P(A∩B) / P(B), dla P(B) 0, (2.2.8) ale gdy zdarzenia A i B są niezależne, to P(A|B) = P(A). (2.2.9) Co ważne, propozycja Kołmogorowa jest niezależna od przyjętej przez badacza interpretacji pojęcia prawdopodobieństwa. Na ko- niec garść przykładów: X Ile wynosi prawdopodobieństwo wyrzucenia orła (O) i reszki (R), w dowolnej kolejności, przy dwukrotnym rzucie mone- tą? Zwróćmy uwagę , że mamy tutaj do czynienia z alter- natywą dwóch wzajemnie się wykluczających koniunkcji: (O i R) lub (R i O). Wykorzystując definicję Laplace’a (2.2.1), 18 otrzymujemy P(O) = P(R) = 0,5. Podstawiając do równa- nia 2.2.7 (O i R są w przypadku dwukrotnego rzutu monetą zdarzeniami niezależnymi), otrzymujemy P(O i R) = P(R i O) = 0,5 × 0,5 = 0,25. Na koniec rozwiązujemy równanie 2.2.5: P((O i R) lub (R i O)) = 0,25 + 0,25 = 0,5. Anali- zowaną sytuację możemy także przedstawić graficznie (ryc. 2). a 1 - 2 1 - 2 O R 1 - 2 1 - 2 1 - 2 1 - 2 O R O R b P(A) P( )A P(B|A) P( |A)B P(B| )A A lub A P( )B A | B B B B lub Ryc. 2. Graf ilustrujący prawdopodobieństwa wyrzucenia orła i reszki przy rzucie dwiema symetrycznymi monetami (a) oraz jego forma uogólniona (b). i X Rzucamy sześcienną kostką do gry. Załóżmy, że zdarzenie A polega na wyrzuceniu pięciu oczek, zaś zdarzenie B na wyrzuceniu liczby oczek większej od trzech. Jak łatwo poli- czyć: P(A) = 0,17, czyli 1/6, P(B) = 0,5 (znów wykorzysta- liśmy definicję Laplace’a). Jakie jest prawdopodobieństwo, że wypadło nam pięć oczek, jeśli wyrzucona liczba oczek jest większa od trzech? Ponieważ działania na zdarzeniach to działania na zbiorach (była o tym mowa), A∩B = A. Korzystamy ze wzoru 2.2.8: P(A|B) = 0,17 / 0,5 = 0,34. W obu przypadkach posiłkowaliśmy się klasyczną definicją praw- dopodobieństwa, gdyż jest ona dla tak prostych sytuacji najwy- godniejsza. Nic nie stoi na przeszkodzie uzyskania P(O), P(R), 19 P(A) i P(B) w sposób zgodny z duchem i literą definicji często- ściowej. 2.3 Twierdzenie Bayesa Twierdzenie Bayesa stanowi podstawę subiektywistycznej kon- cepcji prawdopodobieństwa. Stosujemy je wtedy, gdy znając wy- nik zdarzenia, chcemy oszacować prawdopodobieństwo możliwych przyczyn. Twierdzenie głosi, że jeśli A1, A2, . . . , An są wzajemnie się wykluczającymi hipotezami, z których jedna jest prawdziwa, to P (Ai|B) = KP (B|Ai)P (Ai), (2.3.1) gdzie K jest stałą niezależną od A, P(Ai|B) symbolizuje praw- dopodobieństwo a posteriori („po fakcie”, szukane) prawdziwości hipotezy Ai w świetle danych B, P(Ai) – prawdopodobieństwo a priori, czyli zaczątkowe (niezależne od eksperymentu; cecha cha- rakterystyczna dla szkoły bayesowskiej – element subiektywistycz- ny), P(B |Ai) – prawdopodobieństwo danych w świetle hipotezy Ai (w literaturze anglojęzycznej określane też terminem likelihood). Proszę zwrócić uwagę na kierunkowość prawdopodobieństw wa- runkowych występujących we wzorze 2.3.1. K może przyjąć postać odwrotności prawdopodobieństwa za- czątkowego zdarzenia B (danych). Jeżeli rozpatrujemy pojedynczą hipotezę, równanie 2.3.1 przyjmuje następującą postać: P (A|B) = P (B|A)P (A) P (B) dla P (B) 0. (2.3.2) Przykład Zatoka Perska jest najważniejszym obszarem eksploatacji mał- ży z grupy perłopławów (87 światowej „produkcji” pereł11). Po- zyskiwane są dwie odmiany barwne pereł: różowa i białokremowa. Załóżmy, że kamienie różowe stanowią 17 pereł z tego regionu, zaś w skali globalnej udział pereł różowych wynosi 20 . Jakie jest 11Według Wikipedii. 20
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Zrozumieć statystykę
Autor:

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: