Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00065 005736 11250932 na godz. na dobę w sumie
Microsoft SQL Server 2008 Analysis Services Krok po kroku - ebook/pdf
Microsoft SQL Server 2008 Analysis Services Krok po kroku - ebook/pdf
Autor: Liczba stron:
Wydawca: Promise Język publikacji: polski
ISBN: 978-83-7541-225-3 Data wydania:
Lektor:
Kategoria: ebooki >> komputery i informatyka >> bazy danych
Porównaj ceny (książka, ebook, audiobook).

Praktyczny przewodnik po podstawach usług SQL Server Analysis Services.
Dowiedz się, jak tworzyć, zarządzać i udostępniać kostki przetwarzania anlitycznego w trybie online (OLAP) – krok po kroku. Bez względu na to, czy jesteś projektantem, administratorem czy biznesmanem, ten praktyczny podręcznik pokazuje, jak tworzyć rozwiązania analizy biznesowej (BI) na potrzeby organizacji.
Dowiedz się, jak:

Budować bazy danych Analysis Services przy użyciu Business Intelligence Development Studio (BIDS)
Projektować, wdrażać, przeglądać i modyfikować kostki OLAP
Korzystać z Multidimensional Expressions (MDX)
Przyśpieszyć wykonywanie zapytań za pomocą agregacji
Tworzyć interaktywne kostki zawierające łącza URL i akcje drążenia danych
Włączać analizę finansową i mechanizmy translacyjne
Odczytywać dane i tworzyć raporty
Implementować zabezpieczenia oparte na rolach
Zarządzać i monitorować bazy danych Analysis Services
O autorze
Scott Cameron zajmuje się tworzeniem rozwiązań analizy biznesowej od 12 lat jako starszy menedżer działu Specialized Services w firmie Hitachi Consulting. Jest współautorem książki Microsoft SQL Server 2005 Integration Services Step by Step, a także współpracował przy tworzeniu Microsoft SQL Server 2005 Analysis Services Krok po kroku.

Na dysku CD:
Ćwiczenia praktyczne
Przykładowa baza danych
Elektroniczna wersja książki (eBook) w jęz. angielskim
Wymagania systemowe zawiera Wstęp do książki
(Dla czytelników eBook'a obraz dysku CD towarzyszącego książce jest dostępny na stronie wydawcy - dokładny link podano we wstępie eBook'a).

Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

Microsoft® SQL Server® 2008 Analysis Services Krok po kroku Scott Cameron, Hitachi Consulting przekład: Małgorzata Dąbkowska-Kowalik, Witold Sikorski ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Microsoft® SQL Server® 2008 Analysis Services Krok po kroku Edycja polska Microsoft Press Original English language edition © 2009 by Hitachi Consulting Tytuł oryginału: Microsoft® SQL Server® 2008 Analysis Services Step by Step Polish edition by APN PROMISE Sp. z o. o. Warszawa 2009 APN PROMISE Sp. z o. o., biuro: ul. Kryniczna 2, 03-934 Warszawa tel. +48 22 35 51 642, fax +48 22 35 51 699 e-mail: mspress@promise.pl Wszystkie prawa zastrzeżone. Żadna część niniejszej książki nie może być powielana ani rozpowszechniana w jakiejkolwiek formie i w jakikolwiek sposób (elektroniczny, mechaniczny), włącznie z fotokopiowaniem, nagrywaniem na taśmy lub przy użyciu innych systemów bez pisemnej zgody wydawcy. Microsoft, Microsoft Press, Excel, IntelliSense, Internet Explorer, MSDN, MSN, SharePoint, Silverlight, SQL Server, Visual Studio, Windows oraz Windows Server są zarejestrowanymi znakami towarowymi Microsoft Corporation. Wszystkie inne nazwy handlowe i towarowe występujące w niniejszej publikacji mogą być znakami towarowymi zastrzeżonymi lub nazwami zastrzeżonymi odpowiednich firm odnośnych właścicieli. Przykłady firm, produktów, osób i wydarzeń opisane w niniejszej książce są fikcyjne i nie odnoszą się do żadnych konkretnych firm, produktów, osób i wydarzeń. Ewentualne podobieństwo do jakiejkolwiek rzeczywistej firmy, organizacji, produktu, nazwy domeny, adresu poczty elektronicznej, logo, osoby, miejsca lub zdarzenia jest przypadkowe i niezamierzone. APN PROMISE Sp. z o. o. dołożyła wszelkich starań, aby zapewnić najwyższą jakość tej publikacji. Jednakże nikomu nie udziela się rękojmi ani gwarancji. APN PROMISE Sp. z o. o. nie jest w żadnym wypadku odpowiedzialna za jakiekolwiek szkody będące następstwem korzystania z informacji zawartych w niniejszej publikacji, nawet jeśli APN PROMISE została powiadomiona o możliwości wystąpienia szkód. ISBN: 978-83-7541-053-2 Przekład: Małgorzata Dąbkowska-Kowalik, Witold Sikorski Redakcja: Marek Włodarz Korekta: Magdalena Kalina-Swoboda Skład i łamanie: MAWart Marek Włodarz ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Spis treści Podziękowania .....................................................................................................vii Wprowadzenie ......................................................................................................ix Jak znaleźć właściwy dla siebie punkt startowy ........................................................................ix Konwencje i funkcje stosowane w książce ...................................................................................x Wymagania dotyczące sprzętu i oprogramowania .................................................................xi Pliki ćwiczeń i konfiguracja SQL Server 2008 ..........................................................................xii Znajdowanie dodatkowej informacji online ..............................................................................xv Wsparcie dla książki ............................................................................................................................xv Część I Istota analizy biznesowej a Analysis Services 1 Analiza biznesowa: podstawy analizy danych ....................................................... 3 Wprowadzenie do analizy biznesowej ..................................................................................... 3 Wielowymiarowa analiza danych ............................................................................................... 5 Atrybuty w analizie danych .................................................................................................... 5 Hierarchie w analizie danych ...............................................................................................10 Wymiary w analizie danych .................................................................................................12 Wymiarowa hurtownia danych ................................................................................................17 Tabela faktów ...........................................................................................................................17 Tabele wymiarów ....................................................................................................................19 Klucze zastępcze i wolno zmienne wymiary ...................................................................20 Alternatywne struktury tabel ...............................................................................................22 Wielowymiarowa baza danych OLAP .....................................................................................24 2 Omówienie OLAP i Analysis Services ........................................................................27 Pojęcie OLAP .................................................................................................................................27 Trwale krótki czas reakcji ......................................................................................................28 Zapytania oparte na metadanych ......................................................................................30 Wzory w stylu z arkusza kalkulacyjnego ..........................................................................32 Pojęcie usług Analysis Services .................................................................................................34 Analysis Services i szybkość działania ...............................................................................34 Analysis Services i metadane ...............................................................................................35 Analysis Services i platforma Microsoft Business Intelligence .........................................39 Narzędzia Analysis Services .......................................................................................................41 3 Dostęp do danych źródłowych .....................................................................................43 Tworzenie rozwiązania BI ...........................................................................................................43 Tworzenie źródła danych ...........................................................................................................46 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== iii iv Spis treści Tworzenie widoku źródła danych ............................................................................................48 Modyfikowanie widoku źródła danych ............................................................................53 Część II Podstawy projektowania 4 Tworzenie wymiarów ...........................................................................................................65 Przegląd danych dotyczących wymiarów ..............................................................................66 Tworzenie wymiaru standardowego .......................................................................................70 Wdrażanie bazy danych Analysis Services .......................................................................74 Modyfikowanie wymiaru ......................................................................................................78 Tworzenie wymiaru czasu ..........................................................................................................89 Tworzenie wymiaru nadrzędny-podrzędny ....................................................................... 102 5 Tworzenie kostki .................................................................................................................. 113 Podgląd danych kostki ............................................................................................................. 113 Tworzenie koski za pomocą kreatora .................................................................................. 116 Wymiary pełniące role ....................................................................................................... 121 Wdrażanie i przeglądanie kostki ........................................................................................... 125 Użycie projektanta Cube Designer do modyfikowania kostki ...................................... 136 Dodawanie do kostki przyjaznych nazw ....................................................................... 136 Formatowanie miar ............................................................................................................. 137 Modyfikacja interakcji wymiarów i grup miar.............................................................. 140 Dodawanie miar i grup miar do kostki .......................................................................... 143 Tworzenie elementu obliczanego ................................................................................... 146 Ponowne wdrożenie i przeglądanie kostki ................................................................... 149 6 Tworzenie zaawansowanych miar i obliczeń ..................................................... 153 Używanie funkcji agregacji ..................................................................................................... 154 Użycie MDX do pobierania wartości z kostki .................................................................... 166 Tworzenie elementów obliczanych ...................................................................................... 171 Stosowanie formatowania warunkowego ..................................................................... 173 Obliczanie udziału ............................................................................................................... 174 Tworzenie elementów obliczanych poza wymiarem Measures .............................. 180 Skrypty obliczeniowe ............................................................................................................... 184 Tworzenie kluczowych wskaźników wydajności (KPI) ..................................................... 187 7 Zaawansowane projektowanie wymiarów .......................................................... 193 Korzystanie z wymiarów .......................................................................................................... 194 Tworzenie wymiarów wskaźnikowych ................................................................................. 194 Tworzenie wymiaru faktów ..................................................................................................... 201 Tworzenie wymiaru wiele-do-wielu ..................................................................................... 207 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Spis treści v Część III Projektowanie zaawansowane 8 Praca z Account Intelligence ....................................................................................... 215 Projektowanie kostki analizy finansowej............................................................................. 216 Praca z Account Intelligence .................................................................................................. 217 Tworzenie wymiaru Account .................................................................................................. 218 Praca z nieaddytywnymi miarami finansowymi .......................................................... 227 Tworzenie nieaddytywnego elementu obliczanego .................................................. 227 Praca z wymiarem Scenario .............................................................................................. 231 9 Obsługa konwersji walut i wielu języków ............................................................ 235 Obsługa konwersji obcych walut .......................................................................................... 235 Obsługa tłumaczenia języków obcych ................................................................................ 247 10 Interakcja z kostką .............................................................................................................. 253 Implementowanie akcji ............................................................................................................ 253 Tworzenie akcji standardowych ....................................................................................... 254 Tworzenie akcji eksploracji szczegółów ......................................................................... 258 Łączenie z raportami usług Reporting Services .......................................................... 263 Użycie zapisu zwrotnego do modyfikacji danych Analysis Services ........................... 272 Włączanie zapisu zwrotnego wymiaru .......................................................................... 272 Włączanie zapisu zwrotnego kostki ................................................................................ 275 11 Pobieranie danych z usług Analysis Services..................................................... 281 Tworzenie perspektyw ............................................................................................................. 282 Tworzenie zapytań MDX.......................................................................................................... 285 Dostęp do usług Analysis Services za pomocą Excel 2007 ............................................ 290 Tworzenie raportów usług Reporting Services ................................................................. 308 12 Implementowanie zabezpieczeń ............................................................................... 317 Pojęcie ról .................................................................................................................................... 317 Zabezpieczanie dostępu administracyjnego ..................................................................... 319 Przyznawanie dostępu administracyjnego na poziomie serwera .......................... 319 Przydzielanie dostępu administracyjnego na poziomie bazy danych .................. 322 Zabezpieczanie dostępu do danych .................................................................................... 325 Przyznawanie dostępu do kostki ..................................................................................... 325 Ograniczanie dostępu do elementów wymiaru .......................................................... 326 Ograniczanie dostępu do komórek ................................................................................ 334 13 Projektowanie agregacji ................................................................................................. 339 Pojęcie projektu agregacji ....................................................................................................... 339 Użycie kreatora Aggregation Design ................................................................................... 342 Relacje atrybutów, hierarchie zdefiniowane przez użytkownika oraz projekt agregacji ............................................................................................................. 349 Projektowanie agregacji ..................................................................................................... 355 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== vi Spis treści Zmiana liczby partycji ......................................................................................................... 356 Zastosowanie kreatora Usage-Based Optimization Wizard .......................................... 359 Część IV Zarządzanie środowiskiem produkcyjnym 14 Zarządzanie partycjami oraz przetwarzaniem bazy danych .................... 369 Praca z magazynami danych .................................................................................................. 370 Pojęcie trybów magazynowania wymiarów ................................................................. 371 Tryby magazynowania partycji ........................................................................................ 372 Zmienianie danych w hurtowni ....................................................................................... 375 Zarządzanie przetwarzaniem usług Analysis Services..................................................... 377 Przetwarzanie wymiaru ...................................................................................................... 378 Przetwarzanie kostki ........................................................................................................... 382 Aktywne buforowanie ........................................................................................................ 385 Praca z partycjami ..................................................................................................................... 391 Pojęcie strategii partycji ..................................................................................................... 391 Tworzenie partycji ................................................................................................................ 392 15 Zarządzanie wdrażaniem ............................................................................................... 401 Przegląd wdrażania................................................................................................................... 401 Mechanizmy wdrażania ........................................................................................................... 402 Wdrażanie za pomocą Business Intelligence Development Studio ............................ 402 Wdrożenie przy użyciu kreatora Deployment Wizard .................................................... 405 Interfejs użytkownika kreatora Deployment Wizard ................................................. 405 Pojęcie skryptów wdrażania ................................................................................................... 409 Migracja baz danych i przywracanie po awarii ................................................................. 411 Odłączanie i dołączanie bazy danych Analysis Services ........................................... 411 Synchronizowanie baz danych ......................................................................................... 413 Tworzenie kopii zapasowej i przywracanie bazy danych .......................................... 413 16 Zaawansowane monitorowanie oraz narzędzia zarządzania ................... 417 Monitorowanie Analysis Services przy użyciu Reliability And Performance Monitor .......................................................................................................... 418 Monitorowanie usług Analysis Services za pomocą SQL Server Profiler ................... 426 Dynamic Management Views w usługach Analysis Services ......................................... 432 Indeks ..................................................................................................................436 O autorze ............................................................................................................454 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Podziękowania Jestem bardzo wdzięczny za pomoc i wsparcie, jakie podczas pisania książki „SQL Server 2008 Analysis Services Krok po kroku” otrzymałem z Hitachi Consulting. Kevin Davis zarządzał projektem, zapewniał codzienną motywację i wykonał niezwykłą pracę z harmonogramem, koordynując wszystkie wysiłki współautorów i autorów współ- pracujących oraz komunikację z Microsoft Press. Współautorzy Dave DuVarney, Joe Kasprzak i Bryan Smith oraz autorzy współpracujący Harlan Smith, Phillip Duong, Shay Jones, Robert Brawn i Renee De Voursney hojnie poświęcili swój osobisty czas i zmniejszyli moje obciążenie pracą. Reed Jacobsen, mój wieloletni nauczyciel oraz Stacia Misner, Paul Turley, Richard Osbourn i Ryan Clay wnieśli swoją wiedzę tech- niczną. Hilary Feier dodawała otuchy. Ona też oraz Carr Krueger, Drew Naukum i Lance Baldwin, zaaranżowali wsparcie ze strony Hitachi Consulting, co dało mi czas na napisanie tej książki. David Han i Mary Gianopoulos wykonywali dodatkowe zarzą- dzanie projektem. Doceniam też, że firma Microsoft Press dała mi możliwość napisania tej książki i wdzięczny jestem za wsparcie, jakie otrzymałem od zespołu wydawców. Podzię- kowania otrzymuje Ken Jones, menedżer programu i Sally Stickney, edytor, którzy sponsorowali i inicjowali projekt; Lynn Finnel, edytor projektu, która okazała wiele cierpliwości i prowadziła zespół redaktorów. Składam też podziękowania redaktorom technicznym, którymi byli John Welch, Matthew Roche i Phillippe Freddi, i pomagali mi przy zapewnieniu, aby wyjaśnienia i procedury były poprawne i zrozumiałe oraz edytorom: Megan Smith-Creed, Becka McKay, Julie Hotchkiss i Tom Lewis. Dziękuję wreszcie moje żonie. Tarya cierpliwie wytrzymała wiele dni, kiedy budzik dzwonił wcześnie rano. Przepraszam, jeśli kogoś pominąłem. Wszystkim, którzy przyczynili się do powsta- nia tej książki serdecznie dziękuję. Scott Cameron Marzec 2009 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== vii vii ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wprowadzenie Microsoft SQL Server 2008 Analysis Services to wielowymiarowy komponent prze- twarzania analitycznego online (OLAP) dostępny w Microsoft SQL Server 2008, który integruje dane relacyjne i OLAP na potrzeby rozwiązań analizy biznesowej (Business intelligence, BI). Celem tej książki jest pokazanie sposobów korzystania z narzędzi i funkcji Analysis Services, aby łatwo tworzyć, zarządzać i współdzielić kostki OLAP w ramach organizacji. Ćwiczenia realizowane krok po kroku pomagają w przygotowa- niu się do własnego wdrożenia rozwiązań BI. Pomocą w poznaniu wielu funkcji Analysis Services jest podział tej książki na cztery części. Część I, „Podstawowe informacje o analizie biznesowej (BI) i Analysis Services”, omawia BI, analizę wielowymiarową oraz OLAP, a także wyjaśnia, jak usługi Analysis Services implementują korzyści płynące z OLAP. Część II, „Podstawy projektowania,”, uczy projektowania źródeł danych, widoków źródeł danych, wymiarów i kostek. W część III, „Projektowanie zaawansowane”, pokazano, jak korzystać z wyrażeń wie- lowymiarowych (Multidimensional Expressions, MDX) i agregować funkcje w celu wykonywania złożonych obliczeń i podsumowań oraz tworzenia kluczowych wskaź- ników wydajności (key performance indicators, KPI). Ponadto w tej części opisano funkcje Analysis Services służące do zaawansowanego projektowania wymiarów, ana- lizy finansowej, globalizacji i wielu interakcji rozszerzających możliwości analityczne kostek. Poznajemy tam także sposoby tworzenia raportów analitycznych za pomocą Microsoft Office Excel i SQL Server 2008 Reporting Services. W części IV, „Zarządze- nie eksploatacją”, wyjaśniono, jak kontrolować zabezpieczenia w dostępie do kostek i ograniczać dane dostępne dla określonego użytkownika, jak projektować partycje w celu zarządzania skalowalnością bazy danych oraz jak zarządzać bazami danych Analysis Services i je monitorować. Jak znaleźć właściwy dla siebie punkt startowy Książka ta obejmuje pełny cykl życia rozwiązania Analysis Services od projektu do wdrożenia. Osoby odpowiedzialne za wybrany wycinek działań mogą przeczytać tylko rozdziały odnoszące się do ich sytuacji, pomijając pozostałą część książki. Poniż- sza tabela pomoże w ustaleniu najlepszego punktu wyjścia. Kim jesteś Użytkownik informacji, który korzysta z OLAP przy podejmowaniu decyzji Kroki do wykonania 1. Instalacja plików ćwiczeń zgodnie z opisem w punkcie „Instalacja i użytkowanie plików ćwiczeń”. 2. Praca z częściami I i II, aby zaznajomić się z podstawowymi możliwościami Analysis Services. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== ix ix Kim jesteś Analityk BI, który projektuje modele OLAP i prototypy dla BI Kroki do wykonania 3. Przejrzenie ciekawszych rozdziałów z części III, aby zrozumieć dodatkowe funkcje, które mogą spełnić analityczne potrzeby użytkownika. 1. Instalacja plików ćwiczeń zgodnie z opisem w punkcie „Instalacja i użytkowanie plików ćwiczeń”. 2. Przejrzenie części I, aby zobaczyć pojęcia BI i nauczyć się sposobu implementacji OLAP przez Analysis Services. 3. Praca z częścią II, aby rozwinąć umiejętności potrzebne do utworzenia prototypowej kostki. 4. Przejrzenie interesujących rozdziałów z części III i IV, aby poznać zaawansowane funkcje Analysis Services i zrozumieć, w jaki sposób użytkownicy uzyskują dostęp do kostki oraz nauczyć się zarządzania kostką po wdrożeniu jej do eksploatacji. Administrator, który utrzymuje zasoby serwera lub procesy migracji produkcji 1. Instalacja plików ćwiczeń zgodnie z opisem w punkcie „Instalacja i użytkowanie plików ćwiczeń”. 2. Przejrzenie części I, II i III, aby zrozumieć funkcje włączone Architekt BI, który projektuje i wdraża rozwiązania analityczne do Analysis Services. 3. Praca z częścią IV, aby nauczyć się sposobu zarządzania kostką i zabezpieczenia dostępu do kostki i jej zawartości na serwerze, a także konfigurowania, monitorowania i zarządzania komponentami oraz wydajnością serwera. 1. Instalacja plików ćwiczeń zgodnie z opisem w punkcie „Instalacja i użytkowanie plików ćwiczeń”. 2. Wykonanie części I, aby zapoznać się z korzyściami płynącymi z Analysis Services. 3. Praca z częściami II i III, aby nauczyć się jak tworzyć wymiary i kostki oraz jak implementować zaawansowane techniki projektowania. 4. Wykonanie części IV, aby zrozumieć sposób projektowania kostek, które implementują funkcje zabezpieczeń, wydajności i przetwarzania Analysis Services. Konwencje i funkcje stosowane w książce Książka prezentuje informacje przy użyciu konwencji, dzięki której informacje są czy- telne i łatwe do śledzenia. Przed rozpoczęciem lektury warto przeczytać poniższą listę, która tłumaczy konwencje i wskazuje pomocne funkcje. Konwencje n Każde ćwiczenie składa się z serii zadań. Każde zadanie jest prezentowane jako ciąg ponumerowanych kroków (1, 2 i tak dalej). x Wprowadzenie ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== n Uwagi zatytułowane „wskazówka” podają dodatkowe informacje lub alternatywne metody służące pomyślnemu wykonaniu danego kroku. n Uwagi zatytułowane „ważne” zwracają uwagę na informacje, które trzeba sprawdzić przed kontynuowaniem ćwiczenia. n Tekst wpisywany przez użytkownika jest pogrubiony. n Znak plus (+) między nazwami dwóch klawiszy oznacza, że trzeba nacisnąć te kla- wisze jednocześnie. Na przykład Naciśnij „Alt+Tab” oznacza, że trzeba przytrzymać klawisz Alt i nacisnąć klawisz tabulatora. Wymagania dotyczące sprzętu i oprogramowania Aby wykonać ćwiczenia praktyczne zawarte w tej książce, potrzebny jest następujący sprzęt i oprogramowanie: n Wersja 32- lub 64-bitowa SQL Server 2008 wydanie Enterprise lub SQL Server 2008 wydanie Developer. Trzeba zainstalować następujące komponenty SQL Ser- wer 2008: Database Engine, Analysis Services i Reporting Services. Podczas insta- lacji dodajemy nasz ID logowania z systemu Windows do listy administratorów systemów SQL Server i Analysis Services. WskazóWka W  pełni funkcjonalną wersję próbną SQL Server 2008 Enterprise Edition, działającą przez 180 dni, można pobrać z  witryny: http://www.microsoft. com/s qlserver/2008/en/us/trial-software.aspx. n SQL Server 2008 Enterprise Edition wymaga systemu Microsoft Windows Server 2008 lub Windows Server 2003 SP2. SQL Server 2008 Developer Edition wymaga systemu Microsoft Windows Server 2008, Windows Server 2003 SP2, Windows Vista lub Windows XP SP2. n Procesor 1.0 GHz Pentium III (zalecany jest 2.0 GHz lub szybszy dla 32-bitowej wersji SQL Server 2008. n Procesor 1.4 GHz (zalecany 2.0 GHz lub szybszy) AMD Opteron, AMD Athlon 64, Intel Xeon z obsługą Intel EM64T, Intel Pentium IV z obsługą EM64T lub 1.0 Ghz albo szybszy procesor Itanium dla 64-bitowego SQL Server 2008. n Dostępna pamięć fizyczna RAM 512 MB (zalecane 2 GB lub więcej). n Karta VGA lub wyższej rozdzielczości, o minimalnej rozdzielczości 1 024 x 768 pikseli. n Stacja CD-ROM lub DVD-ROM. n Mysz Microsoft lub inne kompatybilne urządzenie. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== xi Szczegółowe wymagania dotyczące instalacji SQL Server 2008 można znaleźć w artykule „Hardware and Software Requirements for Installing SQL Server 2008”, na SQL Server Books Online (http://msdn.microsoft.com/en-us/library/ms143506.aspx). Ćwiczenia „krok po kroku”, zawarte w tej książce i towarzyszące im pliki do ćwi- czeń były testowane za pomocą Windows Vista Enterprise Service Pack 1 i Microsoft SQL Server 2008 Developer Edition. W przypadku użycia innej wersji systemu ope- racyjnego lub SQL Server 2008 mogą wystąpić pewne drobne różnice. Pliki ćwiczeń i konfiguracja SQL Server 2008 Obraz dysku CD towarzyszącego książce jest dostępny na stronie wydawcy przy opisie książki w zakładce Dodatkowe informacje, pod adresem: http://www.ksiazki.promise.pl/aspx/produkt.aspx?pid=51059 Na podstawie tego obrazu można wykonać fizyczny dysk CD lub zainstalować go jako napęd wirtualny. Dysk ten zawiera zawiera pliki do ćwiczeń, których będziemy używać podczas wykonywania zadań praktycznych. Pliki te i szczegółowe instrukcje w kolejnych lekcjach umożliwiają naukę poprzez praktykę, co stanowi łatwy i efektyw- ny sposób nabywania i zapamiętywania nowych umiejętności. Płyta CD zawiera także bazę danych SQL Server 2008, która jest źródłem danych dla rozwiązań analitycznych tworzonych w tej książce. Instalacja plików do ćwiczeń Instalacja plików ćwiczeń na swoim komputerze wymaga wykonania podanych niżej kroków. 1. Wkładamy dysk do stacji CD-ROM/montujemy obraz dysku jako napęd wirtualny. UWaga Umowa licencyjna użytkownika końcowego otworzy się automatycznie. Jeśli umowa nie pojawi się, trzeba na pulpicie otworzyć Computer (Komputer) lub menu Start, dwukrotnie kliknąć ikonę stacji CD-ROM, a następnie dwukrotnie kliknąć StartCD.exe. 2. Pobieramy umowę licencyjną użytkownika końcowego. Jeśli akceptujemy warunki, wybieramy akceptację i klikamy Next. Pojawi się menu z opcjami związanymi z tą książką. 3. Klikamy pliki Install Practice (Instaluj ćwiczenia). 4. Wykonujemy pojawiające się polecenia. Pliki ćwiczeń zostaną skopiowane z płyty CD na dysk twardy. Domyślnym folde- rem instalacji jest C:\Microsoft Press\Analysis Services 2008 SBS. Jeśli instalujemy xii Wprowadzenie ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== pliki ćwiczeń w innej lokalizacji, trzeba będzie ją podać podczas pracy nad ćwi- czeniami. Każdy rozdział książki tłumaczy, kiedy i jak używać plików ćwiczeń dla danego rozdziału. Gdy trzeba będzie użyć danego pliku ćwiczeń, w książce znajdą się instrukcje, jak go otworzyć. WskazóWka W  folderze C:\Microsoft Press\Analysis Services 2008 SBS\Answers znajduje się oddzielny folder dla każdego rozdziału, w którym wprowadzamy zmiany do plików ćwiczeń. Po ukończeniu rozdziału pliki z tych folderów są kopiami plików przykładowych. Można się do nich odwołać, aby sprawdzić wyniki wszystkich ukoń- czonych ćwiczeń z rozdziału. 5. Usuwamy płytę CD ze stacji CD-ROM. Konfiguracja SQL Server 2008 Ćwiczenia z tej książki pozwolą utworzyć bazę danych Analysis Services i zapełnić ją za pomocą danych zapisanych w bazie danych SQL Server. W ćwiczeniach przyj- muje się, że na naszym komputerze jest zainstalowany SQL Server 2008. Poniższe kroki poprowadzą nas przez proces konfiguracji SQL Server i Analysis Services, aby można było wykonywać ćwiczenia. Wykonanie tych kroków wymaga uprzedniej instalacji plików ćwiczeń; trzeba być także członkiem grupy Administrators na swoim komputerze. Usługi Analysis Services będą wymagały połączenia z SQL Server, trzeba więc wcześniej poznać nazwę loginu użytkownika systemu Windows dla Analysis Services, a następnie przyznać uprawnienia dla SQL Server na tę nazwę użytkownika. 1. W pasku narzędzi Microsoft Windows klikamy Start. W polu Search (Szukaj) wpi- sujemy services, a następnie w grupie Programs wybieramy Services (Usługi). Jeśli pojawia się okno dialogowe User Account Control (Kontrola konta użytkownika), klikamy Continue. [Jeśli korzystamy z Windows XP lub Windows Server 2003, klikamy Start, wybieramy Control Panel (Panel sterowania), potem Administrative Tools (Narzędzia administracyjne), a następnie Services.] 2. W oknie Services znajdujemy kolumnę Name (Nazwa) SQL Server Analysis Servi- ces i zapisujemy wartość w kolumnie Log On As (Zaloguj się jako). Ważne Nazwa loginu użytkownika Analysis Services będzie złożona z dwóch czę- ści w formacie NazwaDomeny\NazwaUżytkownika lub .\NazwaUżytkownika, lub też może to być Usługa Sieciowa lub Usługa Lokalna. Nazwy tej użyjemy w kroku 5. 3. Zamykamy okno Services. 4. W pasku narzędzi Microsoft Windows klikamy przycisk Start, a następnie klikamy Computer. W Windows Explorer przechodzimy do C:\Microsoft Press\Analysis ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== xiii Services 2008 SBS\Setup. Prawym przyciskiem klikamy SSAS_Login.sql i wybie- ramy Open. W oknie dialogowym Connect To Database Engine (Połącz z mecha- nizmem bazy danych) klikamy Cancel. Otwiera się Microsoft SQL Server Management Studio z plikiem SSAS_Login.sql wyświetlonym w trybie edycji. Ten plik skryptu SQL tworzy login SQL Server dla Analysis Services (o ile nie istnieje), a następnie nadaje temu loginowi uprawnie- nia. Trzeba dokonać edycji skryptu i podać nazwę loginu użytkownika Analysis Services, którą poznaliśmy w kroku 2. 5. W drugim wierszu pliku znajdujemy DOMAIN\ACCOUNT i zastępujemy go dwu- częściową nazwą ustaloną w kroku 2. Ważne Jeśli w  kroku 2. ustalimy, że  nazwa loginu użytkownika Analysis Services to Usługa sieciowa lub Usługa lokalna, to będzie trzeba zastąpić DOMAIN\ACCOUNT przez NT Authority\Network Service lub NT Authority\Local Service. Jeśli nazwa użytkownika poznana w kroku 2. ma format NazwaDomeny\Nazwa- Użytkownika, trzeba użyć nazwy dwuczęściowej. Jeśli poznana nazwa użytkowni- ka ma format .\NazwaUżytkownika, trzeba zastąpić kropkę (.) nazwą komputera lokalnego. Na przykład na komputerze autora login Analysis Services ma postać .\AS_Service. Nazwa komputera to Hitachi, więc trzeba zastąpić DOMAIN\ AC COUNT przez Hitachi\AS_Service. W tym przypadku drugi wiersz skryptu powinien wyglądać tak: SET @user = Hitachi\AS_Service ; 6. W menu File wybieramy Exit. W oknie dialogowym klikamy Yes, aby zapisać zmiany w SSAS_Login.sql. 7. W Windows Explorer klikamy prawym przyciskiem Setup.cmd i wybieramy Open. Ten plik poleceń przyłącza bazę danych Microsoft SQL Server 2008, która stanowi źródło danych dla tworzonego i używanego w książce rozwiązania analitycznego. Potem wykonuje skrypt zmodyfikowany w kroku 5. Możemy teraz zacząć wykonywać kolejne ćwiczenia. Odinstalowanie plików ćwiczeń Aby usunąć z komputera pliki ćwiczeń, należy wykonać podane niżej kroki. 1. W Control Panel otwieramy Add Or Remove Programs (Dadaj lub usuń programy). 2. Z listy Currently Installed Programs (Zainstalowane program) wybieramy Microsoft SQL Server 2008 Analysis Services Step by Step. 3. Klikamy Remove (Usuń). xiv Wprowadzenie ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 4. W celu usunięcia plików ćwiczeń postępujemy zgodnie z pojawiającymi się instrukcjami. Znajdowanie dodatkowej informacji online W miarę pojawiania się nowego lub zaktualizowanego materiału uzupełniającego tę książkę, jest on umieszczany w Internecie, w witrynie Microsoft Press Online Deve- loper Tools. Materiały, które można tam znaleźć, obejmują aktualizacje zawartości książki, artykuły, łącza do wspomagającej zawartości, erraty, przykładowe rozdziały i wiele więcej. Witryna jest dostępna pod adresem: www.microsoft.com/learning/books/ online/developer i jest okresowo aktualizowana. Wsparcie dla książki Dołożono wszelkich starań, aby książka i zawartość płyty CD były dokładne i najwyż- szej jakości. W miarę pojawiania się poprawek lub zmian, są one dodawane do arty- kułu w bazie wiedzy Microsoft Knowledge Base. Microsoft Press zapewnia obsługę tej książki i płyty CD na poniższej witrynie: http://www.microsoft.com/learning/support/books/ Pytania i komentarze Wszelkie komentarze, pytania lub pomysły związane z tą książką lub dołączoną do niej płytą CD, lub też pytania, na które nie można znaleźć odpowiedzi na podanych wyżej witrynach, może wysłać pocztą elektroniczną do Microsoft Press na adres: mspinput@microsoft.com lub też pocztą tradycyjną: Microsoft Press Attn: Microsoft SQL Server 2008 Analysis Services Step by Step Editor One Microsoft Way Redmond, WA 98052-6399 Zwracamy uwagę, że pod tymi adresami nie jest oferowane wsparcie techniczne dla oprogramowania firmy Microsoft. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== xv ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== CZęść I Istota analizy biznesowej a Analysis Services Rozdział 1: Analiza biznesowa: podstawy analizy danych 3 Rozdział 2: Omówienie OLAP i Analysis Services 27 Rozdział 3: Dostęp do danych źródłowych 43 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== RoZd ZIAł 1 Analiza biznesowa: podstawy analizy danych W tym rozdziale nauczymy się, jak: n Zrozumieć potrzeby i struktury systemu BI. n Zrozumieć koncepcję wielowymiarowej analizy danych. n Hurtownia danych implementuje przestrzenny model danych. n Usługi Analysis Services implementują przestrzenny model danych. Wprowadzenie do analizy biznesowej Analiza biznesowa (Business Intelligence, BI) dotyczy informacji wyprowadzonych z danych zawartych w systemach operacyjnych naszej firmy i źródeł zewnętrznych. BI powinna pomagać w szybszym podejmowaniu dobrych decyzji. Przypuśćmy, że zarzą- dzamy niewielką nową firmą, Adventure Works Cycles, która produkuje i sprzedaje rowery, części do nich, stroje i akcesoria na rynkach Ameryki Północnej, Europy i Azji. Firma musi się rozrastać, ale ma zbyt małe zasoby, aby wspomóc rozwój. Trzeba podjąć odpowiednie decyzje, a to wymaga określonych informacji. Bieżące trendy biznesowe można znaleźć na łamach Wall Street Journal, zaś przeglądarka jest na stale ustawio- na na witrynę www.bloomberg.com. Te informacje wraz z doświadczeniem pozwalają na podjęcie subiektywnej decyzji, „na wyczucie”. Ale potrzebne są decyzje obiek- tywne, oparte na liczbach. Potrzebne liczby znajdują się w systemach przetwarzania zamówień, księgowości, kadrach i innych zasobach firmy. Trzeba też uzyskać progno- zy rynkowe dotyczące konkurencji i dane na temat przewidywanych kursów walut. Potrzebne jest narzędzie, które połączy te wszystkie informacje i poda gotowe wyniki. Takim narzędziem jest system BI. Jest to rozwiązanie do zbierania danych z wielu źródeł, przekształcania ich tak, aby były spójne, umieszczenia ich w jednej lokalizacji oraz prezentowania umożliwiającego analizę i podejmowanie decyzji. System BI może składać się z pięciu warstw: 1. Warstwy źródła danych 2. Warstwy transformacji danych 3. Warstwy przechowywania i odzyskiwania danych 4. Warstwy analitycznej 5. Warstwy prezentacji ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== 3 Warstwa źródła danych składa się z systemów danych, które są używane przez organi- zację do prowadzenia codziennej działalności, danych w plikach tekstowych, arkuszy Microsoft Office Excel lub baz danych Microsoft Office Access oraz danych pozyski- wanych ze źródeł zewnętrznych. Ponieważ dane pochodzą z wielu różnych źródeł, tworzenie raportów i wykonywanie analiz jest bardzo trudne. Warstwa transformacji danych jest używana do pobierania danych z wielu różnych źródeł, ich modyfikacji, aby były wewnętrznie spójne, oraz ładowania danych do systemu przechowywania danych. Warstwa przechowywania i odzyskiwania danych jest hurtownią danych utworzo- nych w systemie zarządzania relacyjną bazą danych. Hurtownia danych jest systemem zapisów i zawiera wartości istotne dla organizacji. Hurtownia danych dojrzałej fir- my zawiera dane związane ze wszystkimi aspektami przedsiębiorstwa. Jest to miejsce skomplikowane i pełne ruchu. Dane są uzupełniane co miesiąc, co tydzień, codziennie, a nawet częściej. Raporty i analityczne zapytania są wykonywane w dzień i w nocy. Aby zmniejszyć obciążenie hurtowni danych i uprościć dostęp użytkowników, dane doty- czące pojedynczych obszarów tematycznych są wydobywane z hurtowni, sumowane i ładowane do minihurtowni danych (data marts). Są to relacyjne bazy danych lub też wielowymiarowe bazy danych OLAP (online analytical processing). Usługa Analysis Services stanowi jeden z przykładów wielowymiarowej bazy danych OLAP. Celem warstwy analitycznej naszego systemu BI jest przekształcenie danych na informacje i zapewnienie szybkiego i łatwego dostępu do tych informacji dla decy- dentów. Wielowymiarowe bazy danych OLAP tworzą warstwę analityczną systemu BI. Gdy szczegółowe dane z hurtowni danych zostają załadowane do wielowymiarowej bazy danych OLAP, wstępnie obliczane są zsumowane wartości. Ponieważ są one prze- chowywane w bazie danych, raporty i zapytania analityczne są wykonywane szybko. Gdy dane są ładowane do wielowymiarowej bazy danych OLAP, dodawane są do nich metadane. Metadane zawarte w bazie danych OLAP obejmują informacje o relacjach i hierarchiach danych, sposobie sortowania i podsumowywania danych oraz o spo- sobie formatowania ich w celu prezentacji. Metadane zawarte w bazie danych OLAP są tym, co zmienia dane w informacje. W bazie danych OLAP mogą być tworzone i zapisywane złożone obliczenia. Dzięki temu dostęp do informacji jest łatwiejszy, gdyż twórcy raportów i zapytań nie muszą wciąż tworzyć obliczeń, zaś każda osoba w organizacji może korzystać z dokładnie tych samych wzorów obliczeniowych. Narzędzia do tworzenia raportów i wizualizacji tworzą warstwę prezentacji systemu BI. Aplikacje w warstwie prezentacji systemu BI mogą przeszukiwać hurtownie i mini- hurtownie danych lub wielowymiarowe bazy danych OLAP, prezentując ich zawar- tość w różnorodnych formatach. Nasz system BI może wysyłać raporty na telefony komórkowe naszych zewnętrznych przedstawicieli handlowych i pracowników działu dostaw, aby kierować ich codziennymi działaniami. Analityczne diagramy przepływu pracy ilustrują złożone procesy biznesowe, pokazując w każdym węźle informacje, które pozwalają decydentom na podejmowanie wartościowych decyzji. Interakcyjne raporty analityczne z możliwościami typu „slice-and-dice”, tabelami przestawnymi 4 Rozdział 1 Analiza biznesowa: podstawy analizy danych ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== i możliwością eksploracji szczegółów oraz wielowymiarowe wizualizacje danych pomagają menedżerom i analitykom w wyszukiwaniu błędów oraz znajdowaniu infor- macji, umożliwiając bardziej efektywne działanie organizacji i korzystanie z nowych możliwości. Raporty tablicowe z kluczowymi wskaźnikami pozwalają zarządzającym na szybkie określenie, czy organizacja spełnia swoje cele strategiczne. Zestawu elementów składających się na system BI nie można traktować dogmatycz- nie. System BI może mieć wszystkie wymienione warstwy lub tylko kilka z nich. Jeśli na przykład używamy Analysis Services w systemie monitoringu zbliżonym do cza- su rzeczywistego, można co kilka minut ładować dane bezpośrednio z bazy danych kontroli systemu eksploatacyjnego do wielowymiarowej bazy danych OLAP. Warstwa prezentacji w systemie czyta dane z Analysis Services i wyświetla diagram pokazu- jący każdą maszynę linii produkcyjnej i to, czy w danej chwili działa ona dobrze w porównaniu ze średnią liczoną w dłuższym czasie. Taki system BI nie ma hurtowni danych, zaś przekształcanie danych i warstwy analityczne są ze sobą połączone. Zło- żoność systemu BI nie jest istotna. Naprawdę ważne jest, aby dostarczał on informacji właściwych do podejmowania decyzji, zrozumiałych oraz czytelnych, niezawodnych, a także dawał szybki i łatwy dostęp do nich i możliwość posługiwania się nimi, oraz udostępniał je, gdy będą potrzebne. Wielowymiarowa analiza danych Systemu BI używamy, aby wykonywać wielowymiarową analizę danych. Niech ta ter- minologia nas nie przeraża. Większość z nas wykonuje już od pewnego czasu wielo- wymiarową analizę danych. Każdy, kto kiedyś czytał raport pokazujący dane liczbowe według różnych atrybutów – na przykład przeglądy według klientów w poszczegól- nych miesiącach – wykonywał właśnie wielowymiarową analizę danych. W takim przypadku wymiarami używanymi w naszym przeglądzie są klienci oraz miesiące. W tej części poznamy koncepcje związane z wielowymiarową analizą danych, takie jak atrybuty, hierarchie i wymiary. Przygotuje nas to do rozdziału 2., „Usługi anali- tyczne OLAP”, w którym poznamy wielowymiarowe bazy danych OLAP i szczególne zalety Analysis Services. Atrybuty w analizie danych Aby lepiej zrozumieć atrybuty i hierarchie, rozważmy scenariusz, w którym prezes firmy Adventure Works Cycles zechce wiedzieć więcej o tym, jak pracuje jego firma. Poprosi on analityka biznesowego o raport. Otrzymaną odpowiedź pokazuje zawartość tabeli 1-1. Tabela 1-1 Praca firmy Adventure Works 42 ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wielowymiarowa analiza danych 5 Wynik taki wprawia w osłupienie. Wiadomo, że odpowiada na jakieś pytanie, ale na jakie? Raport nie ma żadnej wartości. Liczby bez właściwego kontekstu są danymi, ale nie niosą informacji. W BI podsumowana wartość liczbowa używana do monitorowania działania organizacji nosi nazwę miary. Gdy patrzymy na informacje liczbowe, jedną z pierwszych rzeczy jest ustalenie, jakie miary chcemy oglądać. Miara może repre- zentować sprzedaż w dolarach (Sales Dollars), wysyłane jednostki (Shipment Units), liczbę braków na godzinę (Defects Per Hour) lub reakcję na kampanię reklamową (Ad Campaign Responses). Jeśli pytamy o liczbę jednostek sprzedaży firmy Adventure Works, otrzymujemy raport pokazany w tabeli 1-2. Tabela 1-2 Sprzedaż firmy Adventure Works Units Sold 70 Dodanie etykiety do liczb przekształciło dane w informacje. Można zobaczyć, że liczba 70 reprezentuje Units Sold, liczbę sprzedanych sztuk. Etykieta to metadane – dane opisujące dane. Jednym ze sposobów, w jaki aplikacja BI przekształca dane na infor- macje, jest dodawanie metadanych. Oglądanie pojedynczej liczby nie mówi nam wiele. Chcemy otrzymać coś bardziej informacyjnego. Na przykład, jak firma daje sobie radę w poszczególnych okresach. Możemy porosić o analizę w rozbiciu na miesiące. Nowy raport pokazuje tabela 1-3. Tabela 1-3 Units Sold dla Adventure Works według Month (Miesiąc) Jan 2011 Feb 2011 Mar 2011 Apr 2011 4 14 27 25 Mamy teraz więcej informacji, gdyż możemy zobaczyć więcej metadanych. Jednym z atrybutów każdej wartości Units Sold jest miesiąc, w którym nastąpiła sprzedaż. Nasza firma działa od czterech miesięcy, więc na górze raportu znajdujemy cztery etykiety atrybutu, jakim są miesiące. Zauważmy także, że etykiety miesięcy są upo- rządkowane chronologicznie, a nie alfabetycznie lub losowo. Kolejność pojawiania się etykiet atrybutu to także metadane, które są istotne dla zrozumienia jak firma dawała sobie radę w kolejnych miesiącach. Raport miesięczny wciąż nas nie satysfakcjonuje. Firma sprzedaje więcej niż jeden produkt. Jaka jest sprzedaż każdego z produktów w tym okresie? Prosimy więc o nowy raport, który zawiera Units Sold według produktów i miesięcy, co widać w tabeli 1-4. 6 Rozdział 1 Analiza biznesowa: podstawy analizy danych ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Tabela 1-4 Units Sold dla Adventure Works według Product i Month Jan 2011 Feb 2011 Mar 2011 Apr 2011 Mountain-500 Black, 40 Mountain-500 Black, 44 Mountain-500 Black, 48 Mountain-500 Silver, 40 Mountain-500 Silver, 44 Mountain-500 Silver, 48 Road-750 Black, 44 Road-750 Black, 48 Hitch Rack 1 2 1 3 2 1 1 1 6 1 2 2 1 10 5 6 2 1 1 1 1 7 9 3 Mamy teraz znacznie więcej informacji, gdyż możemy zobaczyć jeszcze więcej metada- nych. Każda wartość pozycji Units Sold ma dwa atrybuty: określony miesiąc i rodzaj sprzedanego produktu. Firma produkuje trzy modele produktu w różnych rozmiarach i kolorach, co daje dziewięć unikatowych produktów. Po lewej stronie raportu pojawia się więc dziewięć etykiet atrybutów: po jednym dla każdego produktu. Ponieważ to mała firma, można łatwo zrozumieć zasady jej działalności, patrząc na raport, taki jak w tabeli 1-4, gdzie widzimy szczegóły liczbowe. Jednak w miarę roz- woju firmy i zwiększania się liczby wytwarzanych produktów, podobny raport może liczyć wiele stron. Wiele szczegółowych wierszy tego raportu spowoduje, że trudno będzie odczytać trendy w działaniu naszej firmy. Pogląd, iż zbyt wiele szczegółów może utrudnić zrozumienie sposobu działania firmy, jest poparty badaniami psychologiczny- mi, które wskazują, że większość ludzi może przyswoić około siedmiu elementów lub siedmiu grup elementów. Badania te pokazują, że grupowanie – czyli agregacja – sta- nowi sposób postępowania z nadmiarem informacji. Ponieważ Adventure Works roś- nie, będziemy chcieli zgrupować rosnącą liczbę pojedynczych produktów do postaci modelu, podkategorii i kategorii. W optymalnej sytuacji każda grupa będzie zawierać około siedmiu elementów. Możemy zacząć tworzenie grup produktów, patrząc na ich wspólne atrybuty. Tabela 1-5 pokazuje, jak można podzielić nazwę produktu na atrybuty nazwy modelu, koloru i rozmiaru. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wielowymiarowa analiza danych 7 Tabela 1-5 Atrybuty produktu Product (Produkt) Mountain-500 Black, 40 Mountain-500 Black, 44 Mountain-500 Black, 48 Mountain-500 Silver, 40 Mountain-500 Silver, 44 Mountain-500 Silver, 48 Road-750 Black, 44 Road-750 Black, 48 Hitch Rack Model (Model) Mountain-500 Mountain-500 Mountain-500 Mountain-500 Mountain-500 Mountain-500 Road-750 Road-750 Hitch Rack Color (Kolor) Black Black Black Silver Silver Silver Black Black Size (Rozmiar) 40 44 48 40 44 48 44 48 Mamy więc w raporcie trzy dodatkowe listy etykiet atrybutów produktu, których moż- na użyć do tworzenia grup w raporcie. Ponieważ określenie lista etykiet atrybutów jest dość długie, w praktyce BI mówi się o nich po prostu atrybuty. Etykiety z każdej listy związane są ze sobą i należą do tego samego atrybutu, więc etykiety nazywamy ele- mentami. Tak więc w tym przykładzie atrybut Model ma trzy elementy: Hitch Rack, Mountain-500 i Road-750. Atrybut Color ma dwa elementy: Black i Silver. Atrybut Product jest atrybutem kluczowym. Atrybut kluczowy jednoznacznie iden- tyfikuje elementy wszystkich innych atrybutów. Jeśli oglądamy element atrybutu Product, to znamy elementy wszystkich innych atrybutów tego produktu. Wiemy na przykład, że produkt Mountain-500 Silver ma rozmiar 42 i jest rowerem koloru srebrnego, model Mountain-500. Innym sposobem identyfikacji atrybutu kluczowego jest utworzenie listy powiązanych atrybutów, co widać w tabeli 1-5, w której atrybuty kluczowe są unikatowe. Model nie jest atrybutem kluczowym. Jeśli patrzymy na ele- ment Mountain-500 atrybutu Model, nie wiemy jaki jest jego atrybut Color ani Size. Możemy także zobaczyć, że elementy atrybutu Model powtarzają się w tabeli 1-5. Można teraz wymagać, aby analityk utworzył raport grupujący produkty według modelu, co widać w tabeli 1-6. Tabela 1.6- Units Sold dla firmy Adventure Works według atrybutów Model, Product i Month Jan 2011 Feb 2011 Mar 2011 Apr 2011 Mountain-500 Mountain-500 Black, 40 Mountain-500 Black, 44 Mountain-500 Black, 48 Mountain-500 Silver, 40 Mountain-500 Silver, 44 Mountain-500 Silver, 48 3 1 2 8 3 2 1 1 1 6 1 2 2 1 6 2 1 1 1 1 8 Rozdział 1 Analiza biznesowa: podstawy analizy danych ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Tabela 1.6- Units Sold dla firmy Adventure Works według atrybutów Model, Product i Month Jan 2011 Feb 2011 Mar 2011 Apr 2011 Road-750 Road-750 Black, 44 Road-750 Black, 48 Hitch Rack Hitch Rack 15 10 5 6 6 16 7 9 3 3 1 1 6 6 Nasz raport zawiera teraz informacje podsumowujące. Wartość Units Sold dla każdego Modelu stanowi sumę, czyli inaczej wartość zagregowaną wartości Units Sold dla okre- ślonego Productu. Elementy atrybutów Model i Product są ustawione hierarchicznie, gdzie elementy atrybutu Model tworzą górny poziom hierarchii, zaś elementy atrybutu Product – poziom dolny. Możliwość ustawienia produktów i modeli w sposób hierar- chiczny i zagregowania wartości produktu do wartości wspólnych dla modelu tworzy dodatkowe metadane, które zwiększają możliwość podawania informacji przez nasze dane. Raport w tabeli 1-6 jest zbliżony do czegoś, czego można użyć w sytuacji, gdy firma Adventure Works produkuje wiele produktów. Gdy mamy do czynienia z hierarchią, nie musimy wyświetlać wszystkich jej poziomów. W naszym przypadku chcemy zoba- czyć tylko poziom Model, więc prosimy analityka o wyłączenie z raportu poziomu Pro- duct. Tabela 1-7 pokazuje raport podsumowujący, który daje nam bardziej zrozumiały ogląd jakości działania firmy. Tabela 1-7 Units Sold dla Adventure Works według Model i Month Mountain-500 Road-750 Hitch Rack Jan 2011 Feb 2011 Mar 2011 Apr 2011 3 1 8 6 6 15 6 6 16 3 Zobaczyliśmy do tej pory, jak atrybut na poziomie szczegółowym można rozdzielić na zbiór powiązanych atrybutów. Podczas wykonywania wielowymiarowej analizy danych możemy pracować z wieloma innymi atrybutami. Na przykład będziemy często tworzyć raporty zawierające datę, pracownika, położenie geograficzne, klienta i inne atrybuty. Wiemy też, jak atrybuty produktu i modeli można zorganizować w prostą hierarchię, a następnie wykorzystać ją do utworzenia raportu grupującego i podsu- mowującego dane szczegółowe. W kolejnym punkcie znajduje się więcej informacji na temat tworzenia hierarchii. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wielowymiarowa analiza danych 9 Hierarchie w analizie danych Hierarchię tworzymy, organizując dane według poziomów. Hierarchia Product by Model (Produkty według modeli) pokazuje tylko dwa poziomy, ale hierarchia może mieć wiele poziomów. Można, na przykład, utworzyć hierarchię Date (Data) z wieloma poziomami, wykorzystując atrybut Month jako najniższy poziom, a następnie dodając poziomy pośrednie utworzone z elementów członkowskich atrybutów Quarter (Kwar- tał) i Year (Rok). Można następnie dodać jeszcze jeden poziom na szczycie hierarchii Date jako poziom All (Wszystkie). Poziom ten zawiera jeden element członkowski – All Dates (Wszystkie daty) – stanowiący agregację wszystkich elementów poziomu Year. Rysunek 1-1 pokazuje niektóre elementy członkowskie hierarchii Date ustawione na poziomach All, Year, Quarter i Month. All Year All Dates 2010 2011 Quarter 2010 Qtr 3 2010 Qtr 4 2011 Qtr 1 2011 Qtr 2 Month Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Rysunek 1-1 Hierarchia Date Wszystkie elementy hierarchii można traktować jako połączone relacjami nadrzędny- -podrzędny. Element nadrzędny jest powiązany z elementami kolejnego, niższego poziomu. Element tamtego poziomu jest elementem podrzędnym dla powiązanych z nim elementów poziomu o jeden wyższego. Rysunek 1-1 pokazuje, że 2011 jest nad- rzędny dla Qtr I 2011 i Qtr II 2011. Można też zobaczyć, że Feb 2011 jest podrzędny dla Qtr I 2011. Hierarchia Date stanowi hierarchię naturalną. W hierarchii tego rodzaju każdy element podrzędny ma tylko jeden element nadrzędny. Hierarchie Size by Color (Wielkość według kolorów) nie jest hierarchią naturalną. Element 40 poziomu Size ma dwa elementy nadrzędne: elementy poziomu Color – Black i Silver. Rysunek 1-1 pokazuje także, że hierarchia może mieć wiele gałęzi. Gdy dochodzi- my do końca gałęzi drzewa, możemy tam znaleźć liście. Na końcu gałęzi hierarchii są elementy liście. Hierarchia może mieć element All lub nie mieć go, ale każda hierar- chia musi mieć elementy liści. Każdy atrybut można przekształcić w hierarchię atrybutów, która ma tylko dwa poziomy. Używając atrybutu jako poziomu liścia, a następnie dodając poziom All, można utworzyć hierarchię Color, która ma element poziomu All jako All Products (Wszystkie produkty) oraz elementy liści Black i Silver. 10 Rozdział 1 Analiza biznesowa: podstawy analizy danych ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Niektóre hierarchie, jak hierarchia Date, są zrównoważone. Jak pokazuje rysunek 1-1, nie ma znaczenia, jaką ścieżką poruszamy się wzdłuż gałęzi, gdyż na każdym poziomie znajdziemy element, zaś każda ścieżka ma taką samą liczbę poziomów. W hierarchii zrównoważonej można łatwo nadawać nazwy poziomom. Niektóre hierarchie są niezrównoważone. Schemat organizacyjny firmy jest często niezrównoważony. Na przykład wiele firm ma dużo więcej pracowników, a więc więcej poziomów zarządzania, na poziomie produkcji niż w dziale kadr. Struktury podziału pracy i plany kont stanowią kolejne przykłady niezrównoważonych hierarchii. W nie- zbilansowanej hierarchii często trudno jest nazwać poszczególne poziomy, natomiast elementami liści są zawsze te elementy, które nie mają pod sobą żadnych elementów podrzędnych. Rysunek 2-1 pokazuje, że w hierarchii niezrównoważonej niezależnie od ścieżki, jaką poruszamy się wzdłuż gałęzi, na każdym poziomie znajdziemy jakieś elementy. Jednak niektóre ścieżki mogą mieć więcej poziomów od innych. Inaczej mówiąc, elementy liści mogą należeć do różnych poziomów. Ken Sanchez David Bradley Laura Norman David Barber Wendy Kahn Sheela Ward Erin Hagens Gordon Hee Rysunek 1-2 Schemat organizacyjny W niektórych hierarchiach następuje pewne rozmycie między zrównoważeniem i nie- zrównoważeniem. Na przykład w hierarchii geograficznej można łatwo nazwać pozio- my – All, Country (Kraj), State/Provinece (Stan/Prowincja) i City (Miasto) – ale niektó- re kraje mogą nie mieć podziału na stany czy też prowincje. Są to hierarchie wadliwe (ang. ragged). Rysunek 1-3 pokazuje, że niezależnie od wybranej ścieżki, każda ścieżka ma tę samą liczbę poziomów. Jednak niektóre ścieżki na niektórych poziomach nie mają elementów. W hierarchii wadliwej elementy liści zawsze należą do tego samego poziomu. ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wielowymiarowa analiza danych 11 All All Countries Country USA UK State/ Province OR WA City Portland Astoria Seattle Spokane London High Wycombe Oxford Rysunek 1-3 Hierarchia wadliwa Hierarchie są tworzone przez podział atrybutów na poziomy. Hierarchia może mieć tylko dwa poziomy lub dowolną większą liczbę poziomów. Najniższy poziom hierar- chii nazywany jest poziomem liścia, potem są poziomy pośrednie, a na końcu poziom najwyższy. W większości hierarchii najwyższym poziomem jest All. Zawiera on jeden element o nazwie All. O elementach hierarchii można myśleć w kategoriach relacji nadrzędny-podrzędny, czyli jest poziom nadrzędny i podrzędny. Jeśli element pod- rzędny ma tylko jeden element nadrzędny, wtedy hierarchię określamy jako naturalną. Jeśli hierarchia jest zrównoważona, to na każdej jej ścieżce znajduje się tyle samo poziomów, a każdy poziom ma element. W hierarchii niezrównoważonej różne ścieżki hierarchii mogą mieć różną liczbę poziomów, zaś w hierarchii wadliwej każda ścieżka ma tę samą liczbę poziomów, ale nie każdy poziom zawiera jakieś elementy. Wymiary w analizie danych Aby rozpocząć naukę o wymiarach, przejrzyjmy kilka raportów, pokazanych wcześ- niej. Tabela 1-8 pokazuje raport Units Sold według Month w firmie Adventure Works, który wcześniej był przedstawiony w tabeli 1-3. Liczba miesięcy – cztery – określa liczbę wartości zawartych w raporcie. Jest to analogiczne do obliczenia odległości w świecie fizycznym: długość linii jest po prostu jej długością. Tabela 1-8 Units Sold dla firmy Adventure Works według Month Jan 2011 Feb 2011 Mar 2011 Apr 2011 4 14 27 25 Tabela 1-9 pokazuje raport zawierający sprzedaż firmy Adventure Works dla Units Sold według Model i Month, który wcześniej pojawił się w tabeli 1-7. W raporcie tym miesięczne wartości Units Sold są podzielone według elementów członkowskich atrybutu Model. Potencjalna liczba wartości w raporcie jest równa liczbie modeli 12 Rozdział 1 Analiza biznesowa: podstawy analizy danych ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== pomnożonej przez liczbę miesięcy, mamy więc do 12 możliwych wartości do rozwa- żenia. Przypomina to obliczenie powierzchni prostokąta: pole powierzchni prostokąta jest równe długości pomnożonej przez szerokość. Raport swoim kształtem przypomina prostokąt. Tabela 1-9 Units Sold dla firmy Adventure Works według Model i Month Mountain-500 Road-750 Hitch Rack Jan 2011 3 1 Feb 2011 Mar 2011 Apr 2011 8 6 6 15 6 6 16 3 Porównanie z prostokątem dotyczy jednak jedynie działań arytmetycznych związanych z obliczaniem liczby wartości, nie zaś z kształtem raportu. Można łatwo przekształ- cić raport, umieszczając atrybut Month w wierszach, a wtedy raport przyjmie postać pokazaną w tabeli 1-10. Tabela 1-10 Units Sold dla firmy Adventure Works według Model i Month Hitch Rack Hitch Rack Hitch Rack Hitch Rack Mountain-500 Mountain-500 Mountain-500 Mountain-500 Road-750 Road-750 Road-750 Road-750 Jan 2011 Feb 2011 Mar 2011 Apr 2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 1 6 6 3 3 8 6 6 15 16 Niezależnie od tego, czy wartości w raporcie tworzą prostokąt jak w tabeli 1-19, czy też ułożone są liniowo, jak w tabeli 1-10, to przy czterech elementach atrybutu Month i trzech elementach atrybutu Model mamy nadal 12 możliwych wartości. Nasz raport ma 12 możliwych wartości, gdyż elementy atrybutu Model i elementy atrybutu Month są niezależne. Każdy model ma swoją własną wartość sprzedaży dla każdego miesiąca – nawet jeśli wynosi ona zero. Rozważmy nowy raport. Przypuśćmy, że Adventure Works sprzedaje produkty w dwóch różnych stanach i chcielibyśmy znać liczbę sztuk każdego modelu sprzedaną w każdym stanie. Ponadto, poza obejrzeniem tych wielkości według miesięcy, chce- my mieć sumę dla wszystkich miesięcy. Aby wygenerować ten raport, analityk doda ##7#52#aSUZPUk1BVC1WaXJ0dWFsbw== Wielowymiarowa analiza danych 13 atrybut State (Stan) do wierszy raportu i zastąpi atrybut Month hierarchią atrybutów Month. Nowy raport pokazano w tabeli 1-11. Tabela 1-11 Units Sold dla firmy Adventure Works według State, Model i Month All Months Jan 2011 Feb 2011 Mar 2011 Apr 2011 WA Hitch Rack Mountain-500 Road-750 OR Hitch Rack Mountain-500 Road-750 9 18 19 7 5 12 2 1 1 4 6 2 2 3 5 9 3 1 6 2 5 10 1 1 6 Raport ma teraz dwa elementy w hierarchii atrybutu State trzy elementy atrybutu Model oraz pięć ele
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Microsoft SQL Server 2008 Analysis Services Krok po kroku
Autor:

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: