Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00417 007287 10471378 na godz. na dobę w sumie
Analiza statystyczna w środowisku R dla początkujących - książka
Analiza statystyczna w środowisku R dla początkujących - książka
Autor: Liczba stron: 280
Wydawca: Helion Język publikacji: polski
ISBN: 978-83-246-3409-5 Data wydania:
Lektor:
Kategoria: ebooki >> komputery i informatyka >> programowanie >> inne - programowanie
Porównaj ceny (książka, ebook, audiobook).

Dowiedz się, jak zwiększyć skuteczność analiz danych dzięki R!

Na wyrażenie 'analiza statystyczna' spora grupa studentów dostaje nerwowych drgawek, a fascynatom rozszerzają się oczy. Ta dziedzina nauki budzi skrajne emocje. Skomplikowana, czasochłonna, wymaga dużej ilości obliczeń, jednak dostarcza istotnych informacji, których właściwą interpretację można przekuć w sukces w różnych dziedzinach życia. Statystyka, tak jak każda inna dyscyplina, dzięki postępującej informatyzacji otrzymała ogromne wsparcie w postaci specjalistycznego oprogramowania. Ta książka poświęcona została środowisku R, którego możliwości w stosunku do ceny są naprawdę imponujące, ponieważ środowisko to jest darmowe i rozpowszechniane na licencji GPL!

Książka ta jest podręcznikiem dla osób, które chciałyby się zaprzyjaźnić z analizą statystyczną i środowiskiem R. W trakcie lektury dowiesz się, jak zainstalować i skonfigurować środowisko R, a potem w nim pracować. Nauczysz się importować dane ze źródeł zewnętrznych, korzystać z funkcji wieloargumentowych, obliczać średnie, standardowe odchylenia i wiele innych wartości, typowych dla statystyki. Ponadto błyskawicznie opanujesz sposoby modelowania za pomocą prostej i wielokrotnej regresji liniowej oraz zobaczysz, jak interpretować wyniki. Poznasz także zaawansowane mechanizmy tworzenia wykresów, grafów i diagramów oraz odkryjesz najlepsze źródła informacji na temat środowiska R. Brzmi interesująco? Przekonaj się sam!

Zaprzyjaźnij się z analizą statystyczną!

Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

Idź do • Spis treści • Przykładowy rozdział • Skorowidz Katalog książek • Katalog online • Zamów drukowany katalog Twój koszyk • Dodaj do koszyka Cennik i informacje • Zamów informacje o nowościach • Zamów cennik Czytelnia • Fragmenty książek online Kontakt Helion SA ul. Kościuszki 1c 44-100 Gliwice tel. 32 230 98 63 e-mail: helion@helion.pl © Helion 1991–2011 Analiza statystyczna w środowisku R dla początkujących Autor: John M. Quick Tłumaczenie: Jacek Janusz ISBN: 978-83-246-3409-5 Tytuł oryginału: Statistical Analysis with R Format: 170×230, stron: 280 Dowiedz się, jak zwiększyć skuteczność analiz danych dzięki R! • Jak rozpocząć przygodę ze środowiskiem R? • Jak przeprowadzić analizę w środowisku R? • Jak przygotować elegancki wykres? Na wyrażenie „analiza statystyczna” spora grupa studentów dostaje nerwowych drgawek, a fascynatom rozszerzają się oczy. Ta dziedzina nauki budzi skrajne emocje. Skomplikowana, czasochłonna, wymaga dużej ilości obliczeń, jednak dostarcza istotnych informacji, których właściwą interpretację można przekuć w sukces w różnych dziedzinach życia. Statystyka, tak jak każda inna dyscyplina, dzięki postępującej informatyzacji otrzymała ogromne wsparcie w postaci specjalistycznego oprogramowania. Ta książka poświęcona została środowisku R, którego możliwości w stosunku do ceny są naprawdę imponujące, ponieważ środowisko to jest darmowe i rozpowszechniane na licencji GPL! Książka ta jest podręcznikiem dla osób, które chciałyby się zaprzyjaźnić z analizą statystyczną i środowiskiem R. W trakcie lektury dowiesz się, jak zainstalować i skonfigurować środowisko R, a potem w nim pracować. Nauczysz się importować dane ze źródeł zewnętrznych, korzystać z funkcji wieloargumentowych, obliczać średnie, standardowe odchylenia i wiele innych wartości, typowych dla statystyki. Ponadto błyskawicznie opanujesz sposoby modelowania za pomocą prostej i wielokrotnej regresji liniowej oraz zobaczysz, jak interpretować wyniki. Poznasz także zaawansowane mechanizmy tworzenia wykresów, grafów i diagramów oraz odkryjesz najlepsze źródła informacji na temat środowiska R. Brzmi interesująco? Przekonaj się sam! • Instalacja środowiska R • Elementarz użytkownika R • Importowanie danych zewnętrznych • Wykorzystanie zmiennych • Wyświetlanie, zapamiętywanie i odczytywanie zawartości obszaru roboczego • Funkcje wieloargumentowe i o zmiennej liczbie argumentów • Średnie, standardowe odchylenia, zakresy • Prosta i wielokrotna regresja liniowa • Interpretacja zmiennych interakcyjnych • Prognozowanie wyników za pomocą modeli regresji • 5 kroków do przeprowadzenia analizy w środowisku R • Tworzenie wykresów, grafów i diagramów • Przydatne zasoby w sieci Zaprzyjaźnij się z analizą statystyczną! Spis treĂci O autorze O recenzentach Wprowadzenie Zagadnienia poruszane w ksiÈĝce Czego potrzebujesz do przeczytania tej ksiÈĝki? Dla kogo jest przeznaczona ta ksiÈĝka? Konwencje Pomoc techniczna Rozdziaï 1. Odkrywanie narzÚdzia analizy danych Co to jest R? Jakie sÈ korzyĂci z uĝywania Ărodowiska R? Dlaczego powinienem uĝywaÊ Ărodowiska R? Dlaczego powinienem przeczytaÊ tÚ ksiÈĝkÚ? Jakie zagadnienia zostanÈ poruszone w tej ksiÈĝce? Podsumowanie Rozdziaï 2. Przygotowanie Ărodowiska R do bitwy Rozdziaï 3. Odkrywanie tajemniczego narzÚdzia analizy danych Opis magicznego kwadratu Zhuge Lianga Podsumowanie Rozdziaï 4. Gromadzenie i porzÈdkowanie informacji 5 7 9 9 10 10 11 12 15 16 16 17 17 18 25 27 41 42 48 49 Spis treĞci Rozdziaï 5. Ocenianie sytuacji Analiza naszych danych Regresja Podsumowanie Rozdziaï 6. Planowanie ataku PrzeglÈd modeli Prognozowanie wyników za pomocÈ modeli regresji Rozwaĝania logistyczne Ocenianie szans realizacji strategii Podsumowanie Rozdziaï 7. Przygotowywanie planów bitwy PrzeglÈd i doprecyzowanie peïnej analizy CzynnoĂci wspólne dla wszystkich analiz przeprowadzanych w Ărodowisku R Podsumowanie Rozdziaï 8. Odprawa u Imperatora Wykresy, grafy i diagramy w Ărodowisku R Podsumowanie Rozdziaï 9. Odprawa u generaïów WiÚcej wykresów, grafów i diagramów w Ărodowisku R Podsumowanie Rozdziaï 10. BÈdě mistrzem strategii Zasoby dostÚpne w Ărodowisku R Zasoby Ărodowiska R dostÚpne w internecie Podsumowanie Dodatek A. Sprawdzian — odpowiedzi na pytania Skorowidz 69 71 87 106 107 107 112 120 124 128 129 129 147 152 153 153 185 187 188 251 253 253 262 265 267 273 4 4 Gromadzenie i porzÈdkowanie informacji Gdy dziÚki rozwiÈzaniu ïamigïówki Zhuge Lianga, udaïo Ci siÚ zaprezentowaÊ swoje umiejÚtnoĂci, jego pomocnik dostarczyï Ci dokumenty opisujÈce zasoby armii Shu. ZawierajÈ one dane o zïocie, wyposaĝeniu oraz ĝoïnierzach. Zanim przystÈpisz do ich analizowania w Ărodowisku R, musisz je najpierw odpowiednio przygotowaÊ i uporzÈdkowaÊ. DziÚki temu Twoje kolejne dziaïania bÚdÈ bardziej zrozumiaïe i sprawne. W tym rozdziale skoncentrujemy siÚ na gromadzeniu i porzÈdkowaniu istniejÈcych informa- cji. Podczas tych dziaïañ zapoznasz siÚ z kilkoma nowymi technikami dostÚpnymi w Ărodowi- sku R. Pod koniec tego rozdziaïu bÚdziesz mógï wykonywaÊ nastÚpujÈce czynnoĂci: Q ImportowaÊ dane zewnÚtrzne do Ărodowiska R. Q UĝywaÊ zmiennych w celu porzÈdkowania i przetwarzania swoich danych. Q ZarzÈdzaÊ obszarem roboczym R. Czas na dziaïanie — importowanie danych zewnÚtrznych Naszym pierwszym zadaniem bÚdzie wczytanie do Ărodowiska R zewnÚtrznych danych z in- formacjami o zasobach. Aby je wykonaÊ, otwórz konsolÚ R i postÚpuj zgodnie z poniĝszymi instrukcjami: Analiza statystyczna w Ğrodowisku R dla początkujących 1. Zdefiniuj katalog roboczy Ărodowiska R za pomocÈ funkcji setwd(dir). ¥cieĝka uĝyta w poniĝszym kodzie jest przykïadowa. Katalog roboczy w Twoim komputerze powinien zostaÊ zdefiniowany w odpowiedniej dla niego lokalizacji. #zdefiniuj katalog roboczy Ărodowiska R #zastÈp przykïadowÈ ĂcieĝkÚ takÈ, która jest odpowiednia dla Ciebie setwd( C:/Users/RUser/Strateg/ ) 2. Skopiuj plik zasobyHanzhong.csv do swojego katalogu roboczego. Plik ten zawiera informacje o zasobach dotyczÈcych armii królestwa Shu, która obecnie stacjonuje w mieĂcie Hanzhong. 3. Wczytaj plik z zasobami do Ărodowiska R za pomocÈ polecenia read.csv(file): #uĝyj polecenia read.csv(file), by wczytaÊ zewnÚtrzny plik z danymi do ´Ărodowiska R #plik zawiera informacje o zasobach królestwa Shu znajdujÈcych siÚ ´w mieĂcie Hanzhong w Chinach read.csv( zasobyHanzhong.csv ) 4. ¥rodowisko R odczyta i wyĂwietli zawartoĂÊ tego pliku, a wynik bÚdzie wyglÈdaÊ jak na poniĝszym rysunku: Dane te zawierajÈ informacje, zgodnie z którymi Twoje siïy w Hanzhong dysponujÈ obecnie zasobami zïota w liczbie 1 000 000 sztuk, zestawami zapasów takĝe w liczbie 1 000 000 sztuk, a ponadto posiadajÈ 100 000 ĝoïnierzy oraz wyposaĝenie, które jest w doskonaïym stanie. Co siÚ zdarzyïo? Po zdefiniowaniu katalogu roboczego zapoznaïeĂ siÚ z nowÈ funkcjÈ. Jej skïadnia róĝni siÚ od skïadni poleceñ, które do tej pory poznaïeĂ. read.csv(file) Nazwa funkcji read.csv(file) zawiera znak kropki, który znajduje siÚ miÚdzy okreĂleniem read a atrybutem csv. Termin csv „informuje” funkcjÚ read o tym, ĝe dane w naszym pliku skïadajÈ siÚ z wartoĂci oddzielonych od siebie przecinkami. Waĝne jest, aby wiedzieÊ, jakiego rodzaju funkcji read powinniĂmy uĝywaÊ, poniewaĝ moĝe istnieÊ kilka alternatywnych form tej funkcji, np. read.S lub read.SPSS. Element file funkcji read.csv(file) jest podobny do skïadnika dir w funkcji setwd(dir). Poniewaĝ umieĂciliĂmy plik z danymi w naszym katalogu roboczym, argument file powinien zawieraÊ jedynie nazwÚ pliku oraz jego rozszerzenie. JeĂli dane zostaïyby umieszczone w in- nej lokalizacji, naleĝaïoby podaÊ peïnÈ ĂcieĝkÚ dostÚpu do pliku. 50 Rozdziaá 4. • Gromadzenie i porządkowanie informacji Pliki z wartoĂciami oddzielonymi przecinkami (csv) W tej ksiÈĝce bÚdziemy wykorzystywaÊ pliki danych zawierajÈce wartoĂci oddzielone prze- cinkami, zwane inaczej plikami CSV. Jest to zalecany rodzaj plików sïuĝÈcy do importowania danych do Ărodowiska R. PowinieneĂ wiedzieÊ, ĝe R moĝe odczytywaÊ dane z wielu rodzajów ěró- deï. Zazwyczaj bÚdziesz mógï zaimportowaÊ dane z dowolnego ěródïa, którego wïaĂnie uĝywasz. Sprawdzian 1. Jaka jest zasadnicza róĝnica miÚdzy argumentami dir i file? a) Argument dir zawiera ĂcieĝkÚ, a argument file zawiera nazwÚ pliku. b) Argument dir zawiera ĂcieĝkÚ do katalogu, natomiast argument file zawiera ĂcieĝkÚ do pliku. c) Funkcje, których nazwy rozpoczynajÈ siÚ od read, uĝywajÈ argumentu file, natomiast funkcje, których nazwy rozpoczynajÈ siÚ od set, uĝywajÈ argumentu dir. d) Nie ma róĝnicy miÚdzy argumentami dir i file. Czas na dziaïanie — tworzenie i uĝywanie zmiennych Wczytanie danych do Ărodowiska R pozwala Ci na ich wyĂwietlenie w konsoli oraz uĝycie w celu wykonania podrÚcznych obliczeñ (jak uczyniliĂmy w rozdziale 3.). Zasadniczo potrzebujesz jednak bardziej uporzÈdkowanej i uniwersalnej metody pozwalajÈcej na manipulowanie danymi. W tym celu moĝesz uĝyÊ zmiennych Ărodowiska R. Zamiast jedynie wczytaÊ do Ărodowiska R nasz plik z zasobami, spróbujmy tym razem odczytaÊ i zapisaÊ dane w zmiennej: 1. Uĝyj nastÚpujÈcego kodu w celu zapisania danych z pliku zasobów w zmiennej o nazwie hanzhongResources: #wczytaj dane z pliku zasobyHanzhong.csv do zmiennej o nazwie ´hanzhongResources hanzhongResources - read.csv( zasobyHanzhong.csv ) 2. ZwróÊ uwagÚ na to, ĝe Ărodowisko R nie wyĂwietliïo ĝadnego rezultatu po wykonaniu powyĝszej czynnoĂci i po prostu udostÚpniïo nowy wiersz w konsoli. Aby sprawdziÊ, jaka jest zawartoĂÊ naszej nowej zmiennej, musimy jÈ wywoïaÊ poprzez podanie jej nazwy w konsoli R. #wyĂwietl zawartoĂÊ zmiennej hanzhongResources #zasoby królestwa Shu w mieĂcie Hanzhong w Chinach hanzhongResources 3. ¥rodowisko R wyĂwietli zawartoĂÊ zmiennej: 51 Analiza statystyczna w Ğrodowisku R dla początkujących Prawdopodobnie zauwaĝyïeĂ, ĝe wywoïanie zmiennej hanzhongResources powoduje powsta- nie takiego samego wyniku, jak wczytanie pierwotnego pliku CSV do Ărodowiska R. Uĝycie zmiennej jest jednakĝe duĝo bardziej efektywne, poniewaĝ nie musimy podawaÊ caïego pole- cenia read.csv(file) za kaĝdym razem, gdy chcemy wyĂwietliÊ jej zawartoĂÊ. Zamiast tego moĝemy po prostu wprowadziÊ nazwÚ zmiennej. Co siÚ zdarzyïo? W Ărodowisku R utworzyïeĂ swojÈ pierwszÈ zmiennÈ i jej uĝyïeĂ. Zmienne sÈ niezbÚdne do przechowywania i przetwarzania danych. Gdy zamierzasz utworzyÊ zmiennÈ w Ărodowisku R, musisz za kaĝdym razem postÈpiÊ podobnie jak w ostatnim Êwiczeniu. Oto cztery etapy pro- cesu tworzenia zmiennej: 1. Rozpocznij, podajÈc nazwÚ zmiennej W naszym poprzednim przykïadzie ciÈg znaków hanzhongResources byï nazwÈ zmiennej. Nazwa powinna byÊ pierwszym elementem, który pojawi siÚ w nowym wierszu konsoli podczas tworzenia zmiennej w Ărodowisku R. 2. Dodaj znak mniejszoĂci oraz minus ( -) Po nazwie zmiennej powinny zostaÊ dodane dwa symbole: znak mniejszoĂci oraz minus ( -)1. Moĝesz przyjÈÊ, ĝe symbol - ma nastÚpujÈce znaczenie: „zostaïa przypisana wartoĂÊ”. W wyniku jego uĝycia informacja znajdujÈca siÚ po prawej stronie symbolu - zostaje przypisana do zmiennej leĝÈcej po jego lewej stronie. Na przykïad wiersz A - B moĝe zostaÊ odczytany jako „zmiennej o nazwie A zostaïa przypisana wartoĂÊ zmiennej B”. Wynika stÈd, ĝe w naszym poprzednim przykïadzie przypisaliĂmy zmiennej o nazwie hanzhongResources zawartoĂÊ pliku zasobyHanzhong.csv. 3. Dodaj ěródïo danych W naszym przykïadzie uĝyte zostaïo ěródïo danych zasobyHanzhong.csv. ½ródïo danych powinno byÊ ostatnim skïadnikiem wprowadzonym w wierszu konsoli podczas tworzenia zmiennej w Ărodowisku R. ½ródïa danych sÈ zazwyczaj zbiorami danych, które sÈ wczytywane do Ărodowiska R, wartoĂciami numerycznymi lub wczeĂniej utworzonymi zmiennymi. 4. Sprawdě zawartoĂÊ zmiennej Gdy po zatwierdzeniu wiersza z kodem Ărodowisko R nie wyĂwietla ĝadnego widocznego wyniku, tak jak ma to miejsce w przypadku tworzenia nowej zmiennej, rozsÈdnÈ czynnoĂciÈ jest zweryfikowanie wyniku naszych dziaïañ. Aby wyĂwietliÊ zawartoĂÊ zmiennej, wprowadě w konsoli R jej nazwÚ, a nastÚpnie naciĂnij klawisz Enter. W naszym przypadku zatwierdzenie ciÈgu znaków hanzhongResources spowoduje wyĂwietlenie w konsoli zasobów armii królestwa Shu stacjonujÈcej w Chinach w mieĂcie Hanzhong. 1 Zamiast - moĝna teĝ uĝywaÊ zwykïego znaku równoĂci — przyp. tïum. 52 Rozdziaá 4. • Gromadzenie i porządkowanie informacji Sprawdzian 1. Które z poniĝszych stwierdzeñ nie okreĂla zalety przechowywania wyniku funkcji read.csv(file) w zmiennej? a) Nazwa zmiennej jest ïatwiejsza do wprowadzenia. b) Nazwa zmiennej jest ïatwiejsza do zapamiÚtania. c) Dane zapamiÚtane w zmiennej nie zostanÈ utracone nawet wówczas, gdy pierwotny plik CSV zostanie przeniesiony lub usuniÚty. d) Zmienna wskazuje jawnie na swoje ěródïo danych. 2. Opisz sïowami znaczenie poniĝszego wiersza konsoli Ărodowiska R: myVariable - myData a) Zmiennej myVariable zostaïa przypisana wartoĂÊ zmiennej myData. b) Zmiennej myData zostaïa przypisana wartoĂÊ zmiennej myVariable. c) WartoĂÊ zmiennej myVariable jest mniejsza niĝ negacja zmiennej myData. d) WartoĂÊ zmiennej myVariable jest wiÚksza niĝ zero oraz mniejsza niĝ negacja zmiennej myData. Do przeÊwiczenia Znasz juĝ proces kryjÈcy siÚ za tworzeniem nowej zmiennej w Ărodowisku R. Plik ĝoïnierze ´WMiastach.csv zawiera informacje o caïkowitej liczbie ĝoïnierzy rozmieszczonych w kaĝdym z wiÚkszych miast na terytorium królestw Shu i Wei. Skopiuj ten plik do swojego katalogu robo- czego. NastÚpnie wykonaj czteroetapowÈ procedurÚ umoĝliwiajÈcÈ stworzenie i sprawdzenie wartoĂci nowej zmiennej o nazwie soldiersByCity. Ta zmienna powinna zawieraÊ wszystkie dane znajdujÈce siÚ w pliku ĝoïnierzeWMiastach.csv. Czas na dziaïanie — dostÚp do danych w zmiennych Obie nasze zmienne hanzhongResources i soldiersByCity zawierajÈ caïy zbiór wartoĂci (w przeci- wieñstwie do pojedynczej wartoĂci). Wiemy juĝ, ĝe wprowadzenie nazwy zmiennej w konsoli R spowoduje wyĂwietlenie jej zawartoĂci na ekranie. Jednakĝe w przypadku zbioru danych czÚsto chcemy mieÊ dostÚp do okreĂlonych kolumn, wierszy i komórek, aby móc przeprowadzaÊ obliczenia. Rozpoczniemy od przetestowania dwóch metod pozwalajÈcych na uzyskanie dostÚpu do ko- lumn w naszej zmiennej soldiersByCity: 1. Najpierw uzyskamy dostÚp do zawartej w zmiennej soldiersByCity kolumny ¿oïnierze poprzez uĝycie notacji zmienna$kolumna: #wyodrÚbnij pojedynczÈ kolumnÚ ze zbioru danych poprzez uĝycie notacji ´zmienna$kolumna #wyĂwietl zawartoĂÊ kolumny ¿oïnierze ze zmiennej soldiersByCity soldiersByCity$¿oïnierze 53 Analiza statystyczna w Ğrodowisku R dla początkujących 2. ¥rodowisko R wyĂwietli zawartoĂÊ kolumny ¿oïnierze. Na poniĝszym rysunku przedstawiono wynik operacji. 3. Tym razem uĝyjmy funkcji attach(zmienna) w celu uproszczenia naszej operacji. #wyodrÚbnij pojedynczÈ kolumnÚ ze zbioru danych poprzez uĝycie funkcji ´attach(zmienna) i uproszczonej notacji #przyïÈcz zmiennÈ soldiersByCity attach(soldiersByCity) #wyĂwietl zawartoĂÊ kolumny ¿oïnierze ze zmiennej soldiersByCity ¿oïnierze 4. ¥rodowisko R wyĂwietli zawartoĂÊ kolumny ¿oïnierze. Obecnie uzyskamy dostÚp do pojedynczego wiersza ze zmiennej soldiersByCity: 5. Uĝyj notacji macierzowej zmienna[wiersz, kolumna], aby wyĂwietliÊ zawartoĂÊ dziesiÈtego wiersza ze zmiennej soldiersByCity: #wyodrÚbnij pojedynczy wiersz ze zbioru danych poprzez uĝycie notacji ´macierzowej zmienna[wiersz, kolumna] #wyĂwietl zawartoĂÊ dziesiÈtego wiersza ze zmiennej soldiersByCity soldiersByCity[10,] 6. ¥rodowisko R wyĂwietli zawartoĂÊ dziesiÈtego wiersza ze zbioru danych soldiersByCity: 7. Notacji macierzowej moĝemy uĝyÊ w podobny sposób, aby uzyskaÊ dostÚp do pojedynczego elementu w naszym zbiorze danych. Uĝyjmy notacji macierzowej, aby wyĂwietliÊ zawartoĂÊ elementu [5, 3] ze zmiennej soldiersByCity: #wyodrÚbnij pojedynczy element ze zbioru danych poprzez uĝycie notacji macierzowej zmienna[wiersz, kolumna] #wyĂwietl zawartoĂÊ elementu [5, 3] ze zmiennej soldiersByCity soldiersByCity[5, 3] 8. ¥rodowisko R wyĂwietli zawartoĂÊ elementu [5, 3], jak pokazano na poniĝszym rysunku: 54 Rozdziaá 4. • Gromadzenie i porządkowanie informacji Co siÚ zdarzyïo? WïaĂnie sprawdziïeĂ w praktyce uzyskiwanie dostÚpu do róĝnego rodzaju zestawów danych zawartych w zmiennej, to znaczy kolumn, wierszy i pojedynczych elementów. Przyjrzyjmy siÚ bliĝej sposobom, które pozwoliïy nam uzyskaÊ dostÚp do danych w zmiennej. Notacja zmienna$kolumna Pojedyncze kolumny znajdujÈce siÚ w zbiorze danych mogÈ staÊ siÚ dostÚpne dziÚki uĝyciu notacji zmienna$kolumna. Potraktuj znak dolara ($) jako odpowiednik sïowa „wybraÊ”. W ten sposób moĝemy przedstawiÊ notacjÚ za pomocÈ sïów. Na przykïad wiersz A$B moĝe zostaÊ odczytany jako „ze zmiennej A wybierz kolumnÚ B”. Podczas naszych dziaïañ wybraliĂmy kolumnÚ ¿oïnierze ze zmiennej soldiersByCity poprzez wprowadzenie nastÚpujÈcego kodu w konsoli R: soldiersByCity$¿oïnierze Funkcja attach(zmienna) Funkcja attach(zmienna) pozwala na uproszczenie skomplikowanych notacji w niektórych, lecz nie we wszystkich przypadkach. Gdy zmienna zostaje przyïÈczona w konsoli Ărodowiska R, jej kolumny mogÈ byÊ dostÚpne po uĝyciu ich nazw bez potrzeby identyfikowania samej zmiennej. Na przykïad po przyïÈczeniu zmiennej soldiersByCity mogliĂmy wyĂwietliÊ za- wartoĂÊ kolumny ¿oïnierze dziÚki zwykïemu wprowadzeniu wiersza ¿oïnierze w konsoli. Ograniczeniem funkcji attach(zmienna) jest to, ĝe w danej chwili do konsoli R moĝe zostaÊ przyïÈczona tylko pojedyncza zmienna. JeĂli na przykïad w tym samym czasie przyïÈczyliby- Ămy obie nasze zmienne hanzhongResources i soldiersByCity, pojawiïby siÚ problem zwiÈzany z kolumnÈ ¿oïnierze. Obie zmienne zawierajÈ tÚ kolumnÚ, ale Ărodowisko R mogïoby siÚ odwo- ïywaÊ jedynie do tej zmiennej, która zostaïa przyïÈczona póěniej. DostÚp do drugiej z nich byïby moĝliwy za pomocÈ notacji zmienna$kolumna. W rzeczywistoĂci Ărodowisko R ostrzeĝe CiÚ, jeĂli przyïÈczysz dwie zmienne zawierajÈce kolumny o tej samej nazwie. Poniĝszy bïÈd pojawi siÚ, gdy najpierw przyïÈczona zostanie zmienna soldiersByCity, a nastÚpnie hanzhong ´Resources: Z drugiej strony, przyïÈczanie zmiennej moĝe byÊ przydatne i efektywne, jeĂli pracujesz z poje- dynczym, lecz duĝym zbiorem danych. Jeĝeli przetwarzasz dane pochodzÈce z jednej zmiennej, nie spowodujesz powstania powyĝszego bïÚdu. Ponadto zawsze moĝesz mieÊ przyïÈczonÈ 55 Analiza statystyczna w Ğrodowisku R dla początkujących jednÈ zmiennÈ, nawet wówczas, gdy pracujesz ze zbiorami danych majÈcymi takie same nazwy kolumn. OczywiĂcie jeĂli Twoje zmienne nie majÈ wspólnych kolumn, podïÈczanie ich wszystkich jest moĝliwe. W kaĝdym razie moĝesz zawsze odwoïaÊ siÚ do kolumn poprzez uĝycie notacji zmienna$kolumna. Zostanie to wykorzystane w dalszej czÚĂci tej ksiÈĝki. ZwróÊ uwagÚ na to, ĝe gdy chcesz odïÈczyÊ zmiennÈ, musisz uĝyÊ funkcji detach(zmienna). Wykonanie polecenia spowoduje sprowadzenie zmiennej do jej wczeĂniejszego stanu, tak jakby nie zostaïa nigdy przyïÈczona. Notacja zmienna[wiersz, kolumna] Podczas odwoïywania siÚ do danych z wiersza lub pojedynczych elementów naleĝy uĝywaÊ notacji zmienna[wiersz, kolumna]. W przypadku wierszy, co sprawdziliĂmy podczas uzyski- wania dostÚpu do dziesiÈtego wiersza w zmiennej soldiersByCity poprzez wykonanie pole- cenia soldiersByCity[10,], pominiÚty zostaje fragment zapisu odnoszÈcy siÚ do kolumny. Taka instrukcja nakazuje Ărodowisku R zwrócenie danych ze wszystkich kolumn w wierszu. Aby uzyskaÊ pojedynczy element, naleĝy podaÊ odpowiednie wartoĂci wiersza i kolumny. Gdy poprzez wykonanie polecenia soldiersByCity[5, 2] odwoïywaliĂmy siÚ do elementu [5, 2] ze zmiennej soldiersByCity, wartoĂÊ 5 reprezentowaïa wiersz elementu, a 2 definiowaïa kolumnÚ. Taka operacja jest podobna do wyboru pojedynczego punktu z wykresu przy uĝyciu wspóï- rzÚdnych x-y, z tÈ róĝnicÈ, ĝe w naszym przypadku wykres zastÚpujemy macierzÈ z danymi. Na marginesie: byÊ moĝe zauwaĝyïeĂ, ĝe notacja zmienna[wiersz, kolumna] moĝe równieĝ sïuĝyÊ do odwoïywania siÚ do kolumn. OsiÈga siÚ to dziÚki pominiÚciu fragmentu dotyczÈcego wartoĂci wiersza. Na przykïad aby uzyskaÊ dostÚp do kolumny Miasto w zmiennej soldiersByCity, moglibyĂmy uĝyÊ kodu soldiersByCity[, 2], który nakazaïby Ărodowisku R zwrócenie da- nych ze wszystkich wierszy w kolumnie Miasto. Sprawdzian 1. Opisz sïowami znaczenie poniĝszego wiersza konsoli R: myVariable$myColumn a) Pomnóĝ wartoĂÊ zmiennej myVariable przez wartoĂÊ zmiennej myColumn. b) Podziel wartoĂÊ zmiennej myVariable przez wartoĂÊ zmiennej myColumn. c) Ze zmiennej myColumn wybierz kolumnÚ myVariable. d) Ze zmiennej myVariable wybierz kolumnÚ myColumn. 2. W jakich okolicznoĂciach przyïÈczanie w konsoli R zmiennych ze zbiorami danych nie jest najlepszym rozwiÈzaniem? a) Przetwarzasz pojedynczy zbiór danych. b) Przetwarzasz wiele zbiorów danych zawierajÈcych identyczne nazwy kolumn. 56 Rozdziaá 4. • Gromadzenie i porządkowanie informacji c) Przetwarzasz wiele zbiorów danych zawierajÈcych identyczne nazwy kolumn, ale chcesz przyïÈczyÊ tylko jeden z nich. d) Przetwarzasz wiele zbiorów danych, które nie zawierajÈ identycznych nazw kolumn. 3. Notacja zmienna[wiersz, kolumna] moĝe zostaÊ uĝyta, by uzyskaÊ dostÚp do danych z nastÚpujÈcych lokalizacji: a) Wierszy. b) Kolumn. c) Elementów. d) Wszystkie powyĝsze opcje sÈ poprawne. Czas na dziaïanie — przetwarzanie danych ze zmiennych UmiejÚtnoĂÊ uzyskania dostÚpu do informacji przechowywanej w zmiennej jest wstÚpem do wykonania czynnoĂci przetwarzania danych. Zmienne i zawarte w nich dane mogÈ byÊ wyko- rzystywane w ten sam sposób, w jaki w rozdziale 2. uĝyliĂmy liczb do przeprowadzenia obli- czeñ. MogÈ one zostaÊ uĝyte w formuïach matematycznych, a takĝe wystÈpiÊ jako argumenty funkcji. 1. Uĝyj zmiennej hanzhongResources, aby obliczyÊ iloĂÊ zasobów, które posiadaïaby armia Shu, jeĂli powódě zniszczyïaby 75 kaĝdego z zasobów: #jeĂli powódě zniszczyïa 75 zasobów Shu w mieĂcie Hanzhong, ile ich ´pozostanie? #pomnóĝ zmiennÈ hanzhongResources przez wartoĂÊ 0,25, by wyznaczyÊ ´pozostaïe 25 pierwotnych zasobów hanzhongResources * 0.25 2. ¥rodowisko R wyĂwietli nastÚpujÈcy wynik obliczeñ: 3. Obecnie zaïóĝmy, ĝe hipotetyczna powódě miaïa wpïyw jedynie na zapasy w mieĂcie Hanzhong, natomiast inne zasoby pozostaïy nienaruszone. Musisz wykonaÊ obliczenie jedynie dla kolumny Zapasy w zmiennej hanzhongResources: #jeĂli powódě zniszczyïa 75 zapasów w mieĂcie Hanzhong, ile ich ´pozostanie? #pomnóĝ kolumnÚ Zapasy przez wartoĂÊ 0,25, by wyznaczyÊ pozostaïe 25 ´pierwotnych zasobów hanzhongResources$Zapasy * 0.25 4. ¥rodowisko R wyĂwietli wynik obliczeñ. ZwróÊ uwagÚ na to, ĝe obliczenia mogÈ zostaÊ wykonane w taki sam sposób dla wierszy, kolumn i elementów. 57 Analiza statystyczna w Ğrodowisku R dla początkujących 5. WartoĂÊ zmiennej moĝe takĝe zostaÊ uĝyta jako argument funkcji. Zaïóĝmy mniej katastroficzny scenariusz i uĝyjmy zmiennej soldiersByCity w celu obliczenia Ăredniej (przeciÚtnej) liczby ĝoïnierzy stacjonujÈcych w jednym mieĂcie królestwa Shu: #uĝyj funkcji mean(dane), aby obliczyÊ ĂredniÈ liczbÚ ĝoïnierzy ´stacjonujÈcych w mieĂcie królestwa Shu #w mieĂcie królestwa Shu stacjonuje przeciÚtnie tylu ĝoïnierzy: mean(soldiersByCity$¿oïnierze) 6. ¥rodowisko R wyĂwietli wynik obliczeñ. ZwróÊ uwagÚ na to, ĝe obliczenia mogÈ byÊ wykonane w taki sam sposób dla danych w wierszach, kolumnach, poszczególnych elementów, a takĝe dla caïych zbiorów danych. 7. Oprócz tego wyniki obliczeñ mogÈ zostaÊ zapamiÚtane w nowych zmiennych, aby moĝna ich byïo uĝyÊ w póěniejszym czasie. Tym razem zapiszemy wynik obliczeñ z punktu 5. w nowej zmiennej o nazwie meanSoldiersByCity: #zapisz ĂredniÈ liczbÚ ĝoïnierzy przypadajÈcych na jedno miasto w zmiennej ´o nazwie meanSoldiersByCity meanSoldiersByCity - mean(soldiersByCity$¿oïnierze) 8. ¥rodowisko R nie wyĂwietli ĝadnego wyniku. Sprawdě zawartoĂÊ zmiennej meanSoldiersByCity poprzez wprowadzenie w konsoli R nastÚpujÈcego kodu: #wyĂwietl zawartoĂÊ zmiennej meanSoldiersByCity meanSoldiersByCity 9. ¥rodowisko R wyĂwietli zawartoĂÊ zmiennej meanSoldiersByCity: Co siÚ zdarzyïo? Zaledwie w kilku wierszach kodu przeÊwiczyïeĂ róĝne sposoby manipulowania danymi, któ- rych bÚdziesz regularnie uĝywaï w Ărodowisku R. Przeanalizujmy kaĝdy z nich oddzielnie. Wykonywanie obliczenia przy uĝyciu caïego zbioru danych Gdy uĝyïeĂ zmiennej hanzhongResources w celu okreĂlenia wpïywu powodzi na kaĝdy z zasobów, odkryïeĂ, ĝe ta operacja wywoïuje ten sam efekt dla wszystkich danych, które zawiera zmienna. Dla celów prezentacyjnych zaïóĝmy istnienie nastÚpujÈcej tabeli z elementami o wartoĂciach 1, 2, 3, 4 znajdujÈcymi siÚ odpowiednio w kolumnach a, b, c, i d: 58 Rozdziaá 4. • Gromadzenie i porządkowanie informacji a 1 b 2 c 3 d 4 Zaïóĝmy, ĝe ta tabela zostaïa zapamiÚtana w zmiennej Ărodowiska R o nazwie lettersAndNumbers. Do tej zmiennej dodaliĂmy wartoĂÊ równÈ jeden, wykorzystujÈc w tym celu nastÚpujÈcÈ instrukcjÚ: lettersAndNumbers + 1 Po tej operacji kaĝdy z elementów tabeli zwiÚkszyï swojÈ wartoĂÊ o jeden: a 2 b 3 c 4 d 5 Jak widaÊ, operacja przeprowadzona na zbiorze danych jest w rzeczywistoĂci wykonywana na kaĝdym z jego elementów. Jednakĝe Ărodowisko R nie zawsze bÚdzie potrafiïo przeprowadziÊ udane obliczenia dla kaĝdego elementu zbioru danych. Na przykïad jeĂli chcielibyĂmy przeprowadziÊ operacjÚ obliczenia numerycznego dla kolumn Królestwo i Miasto zawierajÈcych siÚ w zmiennej soldiersByCity, Ărodowisko R zwróciïoby ostrzeĝenie, wyĂwietlajÈc wartoĂci NA2. Wynika to stÈd, ĝe nasze kolumny Królestwo i Miasto zawierajÈ tekst, co powoduje, ĝe przetwarzanie ich w sposób numeryczny nie ma sensu. Aby pojawiïo siÚ takie ostrzeĝenie, wprowadě w konsoli R poniĝszy kod: #co siÚ stanie, gdy spróbujemy wykonaÊ obliczenie numeryczne na danych ´nienumerycznych? #otrzymamy ostrzeĝenie, poniewaĝ przetwarzanie tekstu w sposób numeryczny nie ´ma sensu soldiersByCity * 5 Uzyskamy nastÚpujÈcy wynik (rysunek na nastÚpnej stronie). Widzimy, ĝe kolumna ¿oïnierze zawiera wartoĂci numeryczne, dlatego kaĝdy jej element zo- staï prawidïowo pomnoĝony przez piÚÊ. Jednakĝe tekst w kolumnach Królestwo i Miasto nie mógï zostaÊ pomnoĝony, dlatego pojawiï siÚ komunikat z ostrzeĝeniem. Aby uniknÈÊ otrzymywa- nia wartoĂci niemajÈcych zastosowania i dezorganizujÈcych dziaïanie konsoli R, waĝne jest, ĝebyĂ byï Ăwiadomy typu swoich danych i stosowaï dla nich odpowiednie rodzaje obliczeñ. 2 NA — ang. not available — niemajÈcy zastosowania, nie dotyczy — przyp. tïum. 59 Analiza statystyczna w Ğrodowisku R dla początkujących Wykonywanie obliczenia dla wiersza, kolumny lub elementu Przetwarzanie danych w wierszu, kolumnie czy elemencie przebiega identycznie jak prze- twarzanie caïego zbioru danych zawartego w zmiennej. RóĝnicÈ nie jest samo obliczanie, lecz raczej to, co zostanie wybrane do jego przeprowadzenia. W zaleĝnoĂci od tego, czy chcesz przetwarzaÊ dane w wierszu, kolumnie lub pojedynczym elemencie, musisz uzyskaÊ do nich dostÚp w odpowiedni sposób. Zapoznaj siÚ z podrozdziaïem zatytuïowanym „Czas na dziaïanie — dostÚp do danych w zmiennych”, aby dowiedzieÊ siÚ wiÚcej o tych metodach. Uĝycie zmiennych jako argumentów funkcji Zarówno caïy zbiór danych zawarty w zmiennej, jak i jedynie jego okreĂlony podzbiór (wiersz, kolumna lub element) mogÈ byÊ uĝywane jako argumenty funkcji. W naszych poprzednich dziaïaniach wykorzystywaliĂmy funkcjÚ mean(dane) w celu obliczenia Ăredniej liczby ĝoïnierzy przypadajÈcych na kaĝde z miast królestwa Shu wystÚpujÈcych w zmiennej soldiersByCity. TÚ operacjÚ moĝna równie ïatwo wykonaÊ dla caïego zbioru danych, pojedynczego wiersza lub elementu. Najlepszy sposób uĝycia zmiennej jako argumentu zaleĝy od tego, jaki jest cel przetwarzania danych, oraz od zastosowania okreĂlonej funkcji. 60 Rozdziaá 4. • Gromadzenie i porządkowanie informacji Zapisywanie wyniku obliczenia w nowej zmiennej Nie zapominaj, ĝe celem istnienia zmiennych jest przechowywanie i porzÈdkowanie Twoich informacji. DoĂÊ czÚsto dla potrzeb kolejnych przetwarzañ bÚdziemy musieli zapisywaÊ w nowej zmiennej wyniki obliczeñ lub rezultaty zwracane przez funkcjÚ. Zmienne i inne obiekty, które powstajÈ podczas naszych dziaïañ, sÈ przechowywane w obszarze roboczym Ărodowiska R, który zostanie omówiony w kolejnym podrozdziale. Sprawdzian Tabela myTable skïada siÚ z dwóch wierszy, trzech kolumn i szeĂciu elementów o wartoĂciach od 1 do 6. Uĝyj tej tabeli, aby odpowiedzieÊ na pytania z punktu 1. i 2. myTable 1 4 2 5 3 6 1. Rozwaĝ nastÚpujÈcy wiersz kodu: myTable * 10 JeĂli ten kod zostaïby uĝyty dla tabeli myTable, jaki byïby wynik dziaïania? Wpisz odpowiednie wartoĂci w puste pola tabeli myTableAfterManipulation1: myTableAfterManipulation1 2. Rozwaĝ nastÚpujÈcy wiersz kodu: myTable[1, 2] + 10 JeĂli ten kod zostaïby uĝyty dla tabeli myTable, jaki byïby wynik dziaïania? Wpisz odpowiednie wartoĂci w puste pola tabeli myTableAfterManipulation2: myTableAfterManipulation2 3. Zinterpretuj sïownie nastÚpujÈcy wiersz konsoli R: myVariable - mean(myData$myColumn) a) Oblicza ĂredniÈ dla zmiennej myColumn, a nastÚpnie przypisuje wynik do zmiennej myVariable. 61 Analiza statystyczna w Ğrodowisku R dla początkujących b) Oblicza ĂredniÈ dla zmiennej myData, a nastÚpnie przypisuje wynik do zmiennej myVariable. c) Dla zmiennej myData wybiera skïadnik myColumn, oblicza jego ĂredniÈ, a nastÚpnie przypisuje wynik do zmiennej myVariable. d) Przypisuje zmiennej myVariable wartoĂÊ zmiennej myData, a nastÚpnie oblicza jej ĂredniÈ. Do przeÊwiczenia Aby przetestowaÊ dziaïanie róĝnych metod sïuĝÈcych do manipulowania danymi, uĝyj danych o zasobach oraz swojej wiedzy o Ărodowisku R i spróbuj rozwiÈzaÊ nastÚpujÈce zadania: 1. PrzypuĂÊmy, ĝe obawiasz siÚ powodzi, która mogïaby doprowadziÊ do zniszczenia Twoich zasobów. Oblicz iloĂÊ zasobów, które pozostaïyby, gdyby powódě zniszczyïa poïowÚ kaĝdego zasobu zapisanego w zmiennej hanzhongResources. ZapamiÚtaj wynik w pojedynczej zmiennej hanzhongResourcesAfterFlood. 2. Aby zanotowaÊ ostatnie przemieszczenie 5000 ĝoïnierzy z miasta Guanghan do Baxi, odejmij 5000 od elementu reprezentujÈcego liczbÚ ĝoïnierzy w Guanghan, a nastÚpnie dodaj 5000 do elementu reprezentujÈcego liczbÚ ĝoïnierzy w Baxi. Informacje o liczbie ĝoïnierzy w miastach sÈ zapisane w zmiennej soldiersByCity. ZapamiÚtaj wynik kaĝdego z obliczeñ w nowej zmiennej. Zmienne powinny mieÊ nazwy guanghanSoldiersAfterRelocation i baxiSoldiersAfterRelocation. 3. Uĝyj funkcji min(dane) i max(dane) oraz zmiennej soldiersByCity, aby obliczyÊ najmniejszÈ i najwiÚkszÈ liczbÚ ĝoïnierzy w mieĂcie. Zapisz wyniki odpowiednio w zmiennych minSoldiersByCity i maxSoldiersByCity. 4. Uĝyj funkcji sum(dane) oraz zmiennej soldiersByCity, aby obliczyÊ caïkowitÈ liczbÚ ĝoïnierzy armii Shu i Wei. NastÚpnie zapamiÚtaj wynik w zmiennej totalSoldiers. JeĂli w trakcie realizacji powyĝszych zadañ otrzymasz komunikat ostrzeĝenia lub bïÚdu, po- staraj siÚ dokïadniej zdefiniowaÊ, jakie dane powinny zostaÊ uĝyte w obliczeniu lub argumen- cie funkcji. Aby dowiedzieÊ siÚ wiÚcej o reagowaniu w przypadku takich sytuacji, wróÊ do wczeĂniejszego podrozdziaïu „Wykonywanie obliczenia przy uĝyciu caïego zbioru danych”. Czas na dziaïanie — zarzÈdzanie Ărodowiskiem R Obszar roboczy Ărodowiska R przechowuje wszystkie obiekty utworzone przez uĝytkownika (w naszym przypadku sÈ to zmienne), które powstaïy w trakcie sesji. Jego zawartoĂÊ moĝe zo- staÊ zapamiÚtana i odtworzona, tak by moĝna jej byïo uĝyÊ w przyszïoĂci. 1. Uĝyj funkcji ls(), aby wyĂwietliÊ zawartoĂÊ obszaru roboczego Ărodowiska R: #wyĂwietl bieĝÈcÈ zawartoĂÊ obszaru roboczego Ărodowiska R ls() 2. ¥rodowisko R wyĂwietli listÚ obiektów w Twoim obszarze roboczym: 62 Rozdziaá 4. • Gromadzenie i porządkowanie informacji 3. Uĝyj funkcji save.image(file), aby zapamiÚtaÊ swój obszar roboczy w katalogu roboczym. Argument file powinien mieÊ postaÊ sensownej nazwy pliku z rozszerzeniem .RData: #zapamiÚtaj obszar roboczy Ărodowiska R w katalogu roboczym za pomocÈ ´funkcji save.image(file) save.image( rDlaPoczÈtkujÈcych_R_04.RData ) 4. ¥rodowisko R zapamiÚta Twój obszar roboczy w pliku. Otwórz katalog roboczy za pomocÈ odpowiedniego narzÚdzia systemu operacyjnego, aby upewniÊ siÚ, ĝe plik ten zostaï rzeczywiĂcie utworzony. 5. Uĝyj polecenia q(), aby wyjĂÊ ze Ărodowiska R. Zignoruj lub odrzuÊ komunikaty, które siÚ pojawiÈ. #zakoñcz sesjÚ R q() 6. ¥rodowisko R zostanie zamkniÚte. 7. Ponownie uruchom Ărodowisko R poprzez klikniÚcie jego ikony. NastÚpnie uĝyj polecenia ls(), aby sprawdziÊ, czy bieĝÈcy obszar roboczy jest pusty: #wyĂwietl bieĝÈcÈ zawartoĂÊ obszaru roboczego Ărodowiska R ls() Uzyskasz nastÚpujÈcy wynik: 8. Zdefiniuj katalog roboczy poprzez wprowadzenie polecenia setwd(dir): #zdefiniuj katalog roboczy setwd( C:/Users/RUser/Strateg ) 9. Uĝyj funkcji load(file), aby wczytaÊ zapisany plik z obszarem roboczym. Argument file powinien byÊ taki sam jak argument uĝyty w punkcie 3.: #wczytaj poprzednio zapamiÚtany obszar roboczy Ărodowiska R za pomocÈ ´funkcji load(file) load( rDlaPoczÈtkujÈcych_R_04.RData ) 63 Analiza statystyczna w Ğrodowisku R dla początkujących 10. Uĝyj polecenia ls(), aby sprawdziÊ, czy zapamiÚtana zawartoĂÊ jest obecnie dostÚpna w obszarze roboczym Ărodowiska R: #wyĂwietl bieĝÈcÈ zawartoĂÊ obszaru roboczego Ărodowiska R ls() Co siÚ zdarzyïo? WïaĂnie sprawdziïeĂ w praktyce dziaïanie podstawowych funkcji zarzÈdzajÈcych obszarem roboczym, których bÚdziesz potrzebowaÊ, by przekazywaÊ swoje dane miÚdzy róĝnymi se- sjami Ărodowiska R. SÈ wĂród nich funkcje sïuĝÈce do wyĂwietlania, zapamiÚtywania i wczy- tywania zawartoĂci Twojego obszaru roboczego w Ărodowisku R. WyĂwietlanie zawartoĂci obszaru roboczego R Obszar roboczy w Ărodowisku R zawiera wszystkie obiekty, które stworzyïeĂ w trakcie swojej sesji. Do tej chwili nasze obiekty przyjmowaïy formÚ zmiennych, które „odczytywaïy” dane z plików CSV lub przechowywaïy wyniki obliczeñ. Funkcja ls() moĝe zostaÊ wywoïana zawsze, aby wyĂwietliÊ zawartoĂÊ obszaru roboczego R. ZapamiÚtywanie zawartoĂci obszaru roboczego R Aby zapamiÚtaÊ obszar roboczy Ărodowiska R, uĝyj funkcji save.image(file). Poniewaĝ dzia- ïaliĂmy w naszym katalogu roboczym, argument file musiaï siÚ skïadaÊ jedynie z nazwy pliku i rozszerzenia .RData. JeĂli obszar roboczy zostaï zapisany w innym miejscu, naleĝy podaÊ peïnÈ ĂcieĝkÚ. PamiÚtaj, aby zawsze dodawaÊ rozszerzenie .Rdata podczas zapamiÚtywania swojego obszaru roboczego, poniewaĝ jest ono niezbÚdne, by Ărodowisko R mogïo poprawnie rozpoznaÊ plik podczas jego ïadowania. Odczytywanie zawartoĂci obszaru roboczego R Aby odczytaÊ zawartoĂÊ obszaru roboczego, uĝyj funkcji load(file). Argument file jest w tym przypadku identyczny z argumentem uĝywanym w funkcji save.image(file). JeĂli wiÚc plik, który chcesz zaïadowaÊ, znajduje siÚ w Twoim katalogu roboczym, bÚdziesz musiaï podaÊ je- 64 Rozdziaá 4. • Gromadzenie i porządkowanie informacji dynie jego nazwÚ oraz rozszerzenie .RData. Jeĝeli jest on umieszczony gdzie indziej, naleĝy wprowadziÊ peïnÈ ĂcieĝkÚ dostÚpu do niego. Zauwaĝ, ĝe w zaleĝnoĂci od posiadanej przez Ciebie wersji Ărodowiska R zapamiÚtanie i wczytanie obszaru roboczego R moĝe zostaÊ wykonane automatycznie podczas uruchamiania lub zamy- kania aplikacji. InnÈ metodÈ jest klikniÚcie odpowiedniej opcji w menu. ByÊ moĝe bÚdziesz chciaï sprawdziÊ dostÚpne opcje menu oraz ustawienia preferencji. Bez wzglÚdu na to zalecamy, abyĂ podczas uĝywania konsoli R zarzÈdzaï jej obszarem roboczym, poniewaĝ pozwoli to na peïnÈ kontrolÚ wykonywanych dziaïañ. Zamykanie Ărodowiska R Jak mogïeĂ zauwaĝyÊ, polecenie q() moĝe zostaÊ wykorzystane do wyjĂcia ze Ărodowiska R. W tym celu moĝesz oczywiĂcie takĝe uĝyÊ odpowiednich opcji menu, skrótów klawiszowych lub innych sposobów dostÚpnych w Twoim komputerze. JeĂli nie zdecydujesz, ĝe obszar roboczy ma zostaÊ zapamiÚtany podczas zamykania Ărodowi- ska R, caïa jego zawartoĂÊ zostanie utracona. PamiÚtaj, aby zapisaÊ obszar roboczy przed wyj- Ăciem ze Ărodowiska R. Rozróĝnienie miÚdzy konsolÈ R a obszarem roboczym Gdy podczas wykonywania wczeĂniejszych czynnoĂci ponownie uruchomiïeĂ Ărodowisko R i wczytaïeĂ zapamiÚtany plik z obszarem roboczym, byÊ moĝe zauwaĝyïeĂ, ĝe zawartoĂÊ ekranu samej konsoli nie zostaïa przywrócona. Ujawnia to waĝnÈ róĝnicÚ miÚdzy konsolÈ Ăro- dowiska R a jego obszarem roboczym. Zasadniczo obszar roboczy sïuĝy do przechowywania wszystkich obiektów uĝytkownika, konsola zaĂ zawiera historiÚ operacji, które zostaïy wyko- nane na tych obiektach. Wyobraě sobie czynnoĂÊ oglÈdania filmu w kinie jako analogiÚ prezentujÈcÈ zwiÈzek miÚdzy obszarem roboczym i konsolÈ. Widownia, ekran i fotele znajdujÈ siÚ w tym samym pomiesz- czeniu (obszarze roboczym). Wszystkie czynnoĂci, jakie wykonujÈ te „obiekty” — kichajÈ, ĂmiejÈ siÚ, jedzÈ, wyĂwietlajÈ film, przyklejajÈ gumÚ do ĝucia do foteli — sÈ zapisywane w hi- storii wraĝeñ odbioru filmu (konsoli). Obszar roboczy zawiera obiekty (takie jak osoby w kinie), konsola zaĂ zapamiÚtuje interakcje, które wystÈpiïy miÚdzy nimi (takie jak wysypanie komuĂ popcornu na gïowÚ). ZapamiÚtywanie stanu konsoli R Poniewaĝ stan konsoli nie jest zapamiÚtywany podczas zapisywania obszaru roboczego, za- pewne chcesz wiedzieÊ, w jaki sposób moĝna zachowaÊ informacje z danej sesji w przypadku konsoli Ărodowiska R. Mimo ĝe w Ărodowisku R nie ma dostÚpnej funkcji, która zapisywaïaby zawartoĂÊ konsoli, mamy do dyspozycji inne opcje. 65 roboczego R? a) .txt b) .R c) .RData d) Nie jest potrzebne uĝycie rozszerzenia. 2. Które z poniĝszych zdañ najlepiej opisuje zwiÈzek miÚdzy konsolÈ a obszarem roboczym Ărodowiska R? a) Obszar roboczy oraz konsola Ărodowiska R mogÈ zostaÊ zapamiÚtane za pomocÈ b) ZawartoĂÊ obszaru roboczego i konsoli Ărodowiska R moĝe zostaÊ wyĂwietlona za c) Konsola Ărodowiska R przechowuje obiekty, a obszar roboczy historiÚ zwiÈzanych d) Obszar roboczy Ărodowiska R przechowuje obiekty, a konsola historiÚ zwiÈzanych funkcji save.image(file). pomocÈ funkcji ls(). z nimi dziaïañ. z nimi dziaïañ. Analiza statystyczna w Ğrodowisku R dla początkujących JednÈ z nich jest skopiowanie i wklejenie treĂci znajdujÈcych siÚ w konsoli do edytora teksto- wego. InnÈ, zaleĝnÈ od posiadanej przez Ciebie wersji Ărodowiska R, moĝe byÊ uĝycie menu w celu zapamiÚtania kopii konsoli jako pliku tekstowego. SÈ to zalecane techniki pozwalajÈce na zapisanie stanu konsoli R. Moĝesz równieĝ zastanowiÊ siÚ nad metodami alternatywnymi. W kaĝdym razie zdecydowanie zalecane jest zapisywanie stanu konsoli R pod koniec kaĝdej sesji. Posiadanie historii Twoich poprzednich dziaïañ moĝe uchroniÊ CiÚ przed wykonaniem tych samych operacji, a jednoczeĂnie pomóc w przyszïej pracy. Pozwala takĝe na zorganizo- wanie i zapamiÚtanie wszystkiego, co jest zwiÈzane z bieĝÈcym projektem, szczególnie wtedy, gdy zarzÈdzasz duĝÈ iloĂciÈ danych oraz wieloma obiektami. Sprawdzian 1. Jakiego rozszerzenia pliku powinieneĂ uĝyÊ podczas zapisywania obszaru 3. Które z poniĝszych stwierdzeñ nie opisujÈ opcji pozwalajÈcej na zapisanie stanu konsoli R? a) Uĝycie wbudowanej funkcji Ărodowiska R. b) Skopiowanie zawartoĂci konsoli do edytora tekstowego. c) Uĝycie opcji menu Ărodowiska R do zapisania zawartoĂci konsoli w pliku tekstowym. d) Zrzut ekranu konsoli Ărodowiska R. Do przeÊwiczenia Twoje koñcowe zadanie w tym rozdziale bÚdzie polegaÊ na zebraniu i uporzÈdkowaniu pozo- staïych danych o zasobach otrzymanych od Zhuge Lianga. Praca ta bÚdzie wymagaïa wczyta- nia pliku CSV do Ărodowiska R, stworzenia nowych zmiennych, uzyskania dostÚpu do danych 66 Rozdziaá 4. • Gromadzenie i porządkowanie informacji i ich przetworzenia, a wreszcie zapisania obszaru roboczego Ărodowiska R oraz zawartoĂci konsoli. Poprzez wykonanie poniĝszych dziaïañ zaprezentuj wysoki poziom posiadanej wie- dzy na temat wspomnianych zagadnieñ, przygotowujÈc na potrzeby analizy dane archiwalne o bitwach. 1. Plik historiaBitew.csv zawiera dane dotyczÈce 120 bitew przeprowadzonych miÚdzy siïami Shu i Wei. Wczytaj te dane do zmiennej o nazwie battleHistory. 2. Uĝyj danych zaimportowanych w punkcie 1., by odpowiedzieÊ na nastÚpujÈce pytanie: jaka liczba ĝoïnierzy królestw Shu i Wei byïa przeciÚtnie zaangaĝowana w walki? ZapamiÚtaj wyniki w oddzielnych zmiennych o nazwach odpowiednio meanSoldiersShu i meanSoldiersWei. 3. Zapisz zawartoĂÊ swojego obszaru roboczego R w nowym pliku o nazwie rDlaPoczÈtkujÈcych_R_04_Êwiczenie.RData. 4. Zapisz zawartoĂÊ swojej konsoli R w nowym pliku o nazwie rDlaPoczÈtkujÈcych_ R_04_Êwiczenie.txt. W razie potrzeby korzystaj z poprzednich podrozdziaïów w celu uzyskania pomocy podczas gromadzenia i porzÈdkowania informacji. Podsumowanie W tym rozdziale dokïadnie przeanalizowaïeĂ metody sïuĝÈce do gromadzenia i porzÈdkowania informacji w Ărodowisku R. MajÈ one bardzo duĝe znaczenie dla odniesienia sukcesu w dziedzi- nach strategii i analityki. UmiejÚtnoĂÊ skutecznego zarzÈdzania danymi jest kluczem do uprosz- czenia sposobu dziaïania oraz sprawienia, ĝe wyniki Twojej pracy bÚdÈ zrozumiaïe dla innych. Podczas gromadzenia i porzÈdkowania danych zdobyïeĂ umiejÚtnoĂci niezbÚdne do: Q Importowania danych zewnÚtrznych do Ărodowiska R. Q Uĝywania zmiennych w celu porzÈdkowania i przetwarzania swoich danych. Q ZarzÈdzania obszarem roboczym R. DysponujÈc przygotowanymi danymi, moĝesz obecnie rozpoczÈÊ szacowanie wyzwañ mili- tarnych dla siï zbrojnych królestwa Shu. W rozdziale 5. ocenimy opcje walki dostÚpne dla armii Shu. Od Ciebie bÚdzie zaleĝaïo przyjÚcie rozwaĝnego toku dziaïañ. 67 Skorowidz B barplot(), 154, 155, 164 dodatkowe argumenty, 188–200 beside, 198 blank, 211 bmp(), 183 boxplot(), 173, 176, 224 range, 224 break, 227 breaks, 228 C c(), 156 cex, 200, 201, 208 chooseCRANmirror(), 257, 259 coef(), 143, 146 col, 162, 163, 164, 218 colors(), 164 Comprehensive R Archive Network, Patrz CRAN cor(), 82, 83, 85, 86 CRAN, 259 serwer lustrzany, 259, 262 csv, 50, 51 czas bieĝÈcy, 36 D dane importowanie, 49 kategoryczne, 79 przekodowanie na postaÊ numerycznÈ, 79 nominalne, 79 szereg, 172 zewnÚtrzne importowanie, 49 #, 47 $, 55 +, 117 -, 52 , 47 A abind, 260 abline(), 206, 211, 249 lty, 211 lwd, 218 reg, 211 AIC, 140 test, 140, 141 AIC(), 140, 141 Akaike Information Criterion, Patrz AIC analiza regresji, 150, Patrz regresja wariancji, Patrz ANOVA analysis of variance, Patrz ANOVA angle, 193, 199 ANOVA, 103, 104 tabela, 105 anova(), 104, 141 argument funkcji, 37 przetwarzanie danych ze zmiennych, 58 uĝycie zmiennej, 60 zmienna liczba, 73 as.numeric(), 79, 80 at, 225 attach(), 54, 55 axis(), 223, 225, 240 at, 225 labels, 225 las, 225 Skorowidz dashed, 211 data bieĝÈca, 36 dataset, 169 date(), 37 density, 193, 199 detach(), 56 dev.off(), 183 digits, 233 dodanie osi do grafiki, 236 dopasowywanie grafiki, 159 argumenty, 162 col, Patrz col main, Patrz main xlab, Patrz xlab xlim, Patrz xlim ylab, Patrz ylab ylim, Patrz ylim dostÚp do kolumny w zmiennej, 53 pojedynczego elementu w zmiennej, 54 wiersza w zmiennej, 54 dotdash, 211 dotted, 211 efekt interakcji, 97 osïabiania, 99 eksportowanie grafiki, 182 element obliczenia dla, 60 E F file, 50, 63, 64, 132 fill, 165 formuïa, 46 freq, 228, 229 function(), 115, 116, 119 funkcja, 37 abline(), Patrz abline() AIC(), 140, 141 anova(), 104, 141 as.numeric(), 79, 80 attach(), 54, 55 axis(), Patrz axis() barplot(), 154, 155, 164 przetwarzanie danych ze zmiennych, 57 274 bmp(), 183 boxplot(), Patrz boxplot() c(), 156 chooseCRANmirror(), 257, 259 coef(), 143, 146 colors(), 164 cor(), 82, 83, 85, 86 definiowanie wïasnej, Patrz function() detach(), 56 dev.off(), 183 getwd(), 37, 38, 148 glm(), 136, 141 graficzna, 161 graphicsFunction(), 162 help(), Patrz help() hist(), 177, 178 install.packages(), 258, 260 jpeg(), 183 legend(), 165, Patrz legend() length(), 163 library(), 258, 260 lines(), Patrz lines() lm(), 88, 89, 94 load(), 64, 69 ls(), 62, 64 magic(), 259 matrix(), 198 max(), 62 mean(), 58, 75 min(), 62 o zmiennej liczbie argumentów, 73 par(), 248 paste(), 233 pdf(), 183 pie(), Patrz pie() plot(), Patrz plot() png(), 183 points(), 204, 209, 240 pomocy, 254 rainbow(), 163 range(), 76, 77 read, 50 read.csv() , 50, 148 read.table(), 131, 132 round(), 233 save.image(), 63, 64, 150 sd(), 75, 77 setwd(), 37, 38, 148 Skorowidz dopasowywanie, 227–230 freq, 228, 229 pogrupowanie kolumn, 227, 228 wyĂwietlanie gÚstoĂci zamiast liczebnoĂci, 228, 229 HLR, Patrz hierarchiczna regresja liniowa horiz, 190, 196 I importowanie danych zewnÚtrznych, 49 instalacja Ărodowiska R, 27–36 install.packages(), 258, 260 interakcja, 97 predyktor, 99 zmienna, 97 jpeg(), 183 J K katalog roboczy, 37, 38 zapamiÚtanie obszaru roboczego, 63 kategoryczne dane, Patrz dane kategoryczne kolory a obszar roboczy, 65 importowanie danych zewnÚtrznych, 49 komentarz, 45 wiersz, 44 rozszerzony, 117 wyĂwietlanie informacji, 47 zapamiÚtywanie stanu, 65 korelacja, 82, 83, 85, 132 interpretowanie, 84 tabela, 85 Kryterium Informacyjne Akaike, Patrz AIC kwartyl dolny, 173 górny, 173 dodanie osi, 236 par(), 248 plot(), 235 uzupeïnianie danych, 237 z wieloma elementami wizualnymi, 242–50 wyglÈd, Patrz dopasowywanie grafiki automatyczne, 163 zdefiniowane, 164 kolumna obliczenia dla, 60 komentarz, 45, 148 konsola R, 36 subset(), 72, 74 sum(), 62 summary(), 76, 77, 91, 136 tiff(), 183 wieloargumentowa, 73 wïasna uĝytkownika, Patrz function() zorientowana na zasoby, 119 zagnieĝdĝona, 250 G getwd(), 37, 38, 148 gÚstoĂÊ, 229 glm(), 136, 141 GNU General Public License, 16 Google, 265 graficzne okno, 156 grafika dopasowywanie, Patrz dopasowywanie grafiki eksportowanie, 182 kolory automatyczne, 163 zdefiniowane, 164 linie poziome i pionowe, 249 opis, 165 tworzenie, 184, 235–241 graficzna funkcja, 161 graphicsFunction(), 162 H header, 132 height, 155 help(), 253, 254, 256 topic, 255 hierarchical linear regression, 101 hierarchiczna regresja liniowa, 101 hist(), 177, 178 histogram, 177 break, 227 breaks, 228 275 Skorowidz L O obliczenia dla elementu, 60 kolumny, 60 wiersza, 60 na zbiorze danych, 59 obszar roboczy, 61, 62 labels, 181, 225, 231 las, 225 legend, 165 legend(), 165, 195, 200, 211, 220, 234, 241 angle, 200 cex, 200 density, 200 length(), 163 library(), 258, 260 liczebnoĂÊ, 229 lines(), 215, 218 col, 218 type, 218 lm(), 88, 89, 94 load(), 64, 69 load.image(), 149 logistyka, 120 longdash, 211 ls(), 62, 64 lty, 211 lwd, 213, 218 magic, 260, 261 magic(), 259 magiczny kwadrat, 42 main, 162 maksimum, 62, 77 matrix(), 198 max(), 62 mean(), 58, 75 mediana, 173 min(), 62 minimum, 62, 77 model regresji, 87 M N nadpisywanie zmiennych, 81 najlepiej dopasowane proste, 211 dodanie do wykresu punktowego, 211 names, 189, 195 nominalne dane, Patrz dane kategoryczne 276 a konsola, 65 odczytanie zawartoĂci, 64 wyĂwietlanie zawartoĂci, 62, 64 zapamiÚtanie, 64 w katalogu roboczym, 63 zarzÈdanie, 62 od do, 172 odchylenie standardowe, 75, 77 odczytanie zawartoĂci obszaru roboczego, 64 odïÈczenie zmiennej, 56 okno graficzne, 156 operator nierównowaĝnoĂci, 73 równowaĝnoĂci, 73 opis, 165 opisowa statystyka , 75 osïabiania efekt, 99 oĂ wykresu dodanie przy tworzeniu grafiki, 236 modyfikacja, 225 przedefiniowanie skali, 210 P Packages, 260 pakiet, 257, 260 uĝycie, 261 wczytywanie, 260 zaleĝny, 260 par(), 248 paste(), 233 pch, 201, 208 pdf(), 183 pie(), 179, 181 labels, 181 plik csv, 51 danych, 51 z wartoĂciami oddzielonymi przecinkami, Patrz csv Skorowidz plot(), 166, 168, 170, 208, 218, 235, 239 zasoby, 253 cex, 208 lwd, 218 pch, 208 type, 171 png(), 183 pobranie Ărodowiska R, 27–31 podsumowanie wyników, 76 points(), 204, 209, 240 polecenie, 37 predyktor, 99 prefiks #, 47 +, 117 , 47 brak, 46 prognozowanie, 140 metodÈ regresji, 114 wyników, 87 prosta regresja liniowa, 88 regresji, 211 dodanie do wykresu punktowego, 211 przedefiniowanie skali na osi, 210 przetwarzanie danych ze zmiennych, 57 jako argument funkcji, 58 w formuïach matematycznych, 57 przewidywanie, 142 przyïÈczenie zmiennej, 55 p-wartoĂÊ, 91, 105 q(), 63, 65 Q R R, 16, 17, 25 formuïa, 46 funkcja, 37 instalacja Ărodowiska, 27–36 konsola, 36 obszar roboczy, Patrz obszar roboczy pobranie Ărodowiska, 27–31 polecenie, 37 rozszerzanie o nowe pakiety, 257 strony internetowe, 263 wyjĂcie ze Ărodowiska, 65 wynik, 46 dostÚpne w internecie, 262-265 zmienna, Patrz zmienna R Project for Statistical Computing, Patrz R rainbow(), 163 range, 221, 224 range(), 76, 77 RData, 63, 64, 65 read, 50 read.csv(), 50, 148 read.table(), 131, 132 reg, 211 regresja regresja, 87, 150 liniowa hierarchiczna, 101 prosta, 88, 89, 90, 92 wielokrotna, 94, 95, 97 model, 87 interakcyjny, 97 liniowy, 90 interpretacja, 92 porównanie modeli, 101 prognozowanie, 114, 140 projektowanie optymalnego modelu, 136 przeciÚcie, 90 przewidywanie, 142 p-wartoĂÊ, 91 równanie, 90 statystyczna istotnoĂÊ, 91 wspóïczynnik, 90 determinacji, 91 wspóïliniowoĂÊ, 99 wyznaczanie wyników z modeli, 114 zmienna niezaleĝna, 87 objaĂniajÈca, 87 objaĂniana, 87 zaleĝna, 87 round(), 233 rozstÚp Êwiartkowy, 224 rozszerzenie RData, Patrz RData równowaĝnoĂÊ, 73 S save.image(), 63, 64, 150 sd(), 75, 77 sep, 132 277 Skorowidz serwer CRAN, 259 lustrzany, 259 setwd(), 37, 38, 148 sliceData, 181 sliceText, 181 solid, 211 space, 189, 196 standardowe odchylenie, 75, 77 statystyczna istotnoĂÊ, 91 statystyka opisowa, Patrz statystyka zbiorcza zbiorcza, 75, 77, 78, 132, 149 strony internetowe na temat R, 263 subset(), 72, 74 sum(), 62 suma, 62 summary(), 76, 77, 91, 136 szereg danych, 172 ¥ Ărednia, 58, 75 Ărodowisko graficzne R, Patrz R obliczeniowe R, Patrz R R, Patrz R T tabela ANOVA, 105 korelacji, 85 test AIC, 141 tiff(), 183 twodash, 211 tworzenie grafiki, Patrz grafika tworzenie dodanie objaĂnieñ, 238 z wieloma elementami wizualnymi, 242–50 wïasnego wykresu, Patrz grafika tworzenie zmiennej, 52 type, 171, 218 U urzÈdzenie graficzne, 183 zamkniÚcie, 184 278 W wariancja, 91 wartoĂÊ maksymalna, 62, 77, 173 minimalna, 62, 77, 173 NA, 86 zmiennej, 51, 52 przypisanie, 52 wektor, 156 width, 189, 196 wieloargumentowa funkcja, Patrz funkcja wieloarguentowa wielokrotna regresja liniowa, 94, 95, 97 wiersz, 44 obliczenia dla, 60 rozszerzony, 117 wspóïczynnik determinacji, 91 wspóïliniowoĂÊ, 99 wycentrowanie zmiennej, 99 wyjĂcie ze Ărodowiska R, 65 wykres, 156 koïowy, 179 dodanie opisu, 231, 232 dopasowywanie, 231–34 labels, 231 opis zawartoĂci procentowych skïadników, 231 liniowy, 170 dodanie nowych relacji, 215, 218 objaĂnienia, 217 dopasowywanie, 220 gruboĂÊ linii, 213, 218 kolor linii, 218 lwd, 213, 218 modyfikacja osi, 225 punktowy, 166 abline(), 206 cex, 201 dataset, 169 dodanie najlepiej dopasowanych prostych, 206 dodanie nowych relacji, 204 dodanie opisów, 205 dopasowywanie, 201–212 pch, 201 points(), 204, Patrz points() pojedynczy, 168 Skorowidz symbole odpowiadajÈce punktom danych, Z wyglÈd symboli oznaczajÈcych punkty, 201, zakres, 75 208 209 skrzynkowy, 173 dïugoĂÊ wÈsów, 221, 224 dopasowywanie, 221–226 pojedynczy, 176 range, 221 rozstÚp Êwiartkowy, 224 stworzenie wïasnych osi, 222, 223 wieloelementowy, 176 sïupkowy, 154 angle, 193, 199 beside, 192, 198 density, 193, 199 dopasowywanie, 188–200 horiz, 190, 196 names, 189, 195 odstÚpy miÚdzy sïupkami, 196 skumulowany, 192 space, 189, 196 sposób cieniowania sïupków, 199 tïo sïupków, 193 width, 189, 196 zmiana orientacji, 190 tworzenie wïasnego, Patrz grafika tworzenie wynik, 46 podsumowanie, 76 prognozowanie, 87 z modelu regresji, 114 zapisywanie w nowej zmiennej, 61 wyĂwietlanie zawartoĂci obszaru roboczego, 64 X Y xaxt, 225 xlab, 162 xlim, 162, 163, 210 yaxt, 225 ylab, 162 ylim, 162, 163, 210, 220 nienumeryczny, 79 zbioru danych, 76, 77 zamykanie Ărodowiska R, 65 zapamiÚtanie obszaru roboczego, 64 zasoby, 253 zawartoĂÊ obszaru roboczego, 62 zbiorcza statystyka, 75, 77, 78, 132, 149 zbiór danych, 58 obliczenia na, 59 zmiana orientacji wykresu sïupkowego, 190 tïa sïupków na wykresie, 193 zmienna, 51, 52 dostÚp do kolumny, 53 pojedynczego elementu, 54 wiersza, 54 interakcyjna, 97 korelowanie, Patrz korelacja liczba argumentów, 73 nadpisywanie, 81 odczytanie danych, 51 odïÈczenie, 56 przetwarzanie danych, Patrz przetwarzanie danych ze zmiennych przyïÈczenie, 55 przypisanie wartoĂci, 52 tworzenie, 52 uĝycie jako argument funkcji, 60 wektorowa, 156 wycentrowanie, 99 wyĂwietlenie zawartoĂci, 52 zapisanie danych, 51 zmienna$kolumna, 53, 55 zmienna[wiersz,kolumna], 56 ½ ěródïo danych, 52 279
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Analiza statystyczna w środowisku R dla początkujących
Autor:

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: