Cyfroteka.pl

klikaj i czytaj online

Cyfro
Czytomierz
00180 006130 13248881 na godz. na dobę w sumie
Podstawy projektowania interfejsów użytkownika - ebook/pdf
Podstawy projektowania interfejsów użytkownika - ebook/pdf
Autor: , Liczba stron: 144
Wydawca: Helion Język publikacji: polski
ISBN: 978-83-283-4221-7 Data wydania:
Lektor:
Kategoria: ebooki >> komputery i informatyka >> webmasterstwo >> inne
Porównaj ceny (książka, ebook (-20%), audiobook).

Dobry interfejs użytkownika to podstawa sukcesu każdej aplikacji!

Interfejs użytkownika to wizytówka każdej aplikacji komputerowej i strony WWW, a także brama zapewniająca dostęp do ich funkcji. Nawet najlepsze, najbardziej wydajne i oferujące największe możliwości oprogramowanie ma niewielkie szanse na rynkowy sukces, jeśli jego interfejs będzie toporny, brzydki lub nieintuicyjny, a używanie go — męczące. Ludzie po prostu lubią korzystać z ładnie i funkcjonalnie zaprojektowanego oprogramowania i chcą to robić w jak najprostszy sposób, nie tracąc przy tym zbyt wiele czasu na naukę.

Budowanie przyjaznych interfejsów użytkownika to sztuka, którą zdecydowanie warto opanować, gdy tworzy się oprogramowanie komunikujące się z ludźmi. Pomoże Ci w tym książka 'Podstawy projektowania interfejsów użytkownika',  wprowadzająca w tę rozbudowaną i interesującą dziedzinę wiedzy. Znajdziesz w niej opis wybranych urządzeń wejścia–wyjścia oraz stosowanych obecnie elementów interfejsów, informacje na temat sposobów tworzenia projektów interfejsów i ich rozwoju, a także praktyczne przykłady zarówno dobrych, jak i złych rozwiązań w tej dziedzinie.

Dobrze programujesz? Zacznij też dobrze projektować swoje interfejsy użytkownika!


Witold Malina — ukończył Wydział Elektroniki Politechniki Gdańskiej. W 2003 r. uzyskał tytuł profesora nauk technicznych. W latach 1981–2000 był kierownikiem Katedry Technik Programowania, a w latach 1984–1990 prodziekanem. W czasie działalności naukowo-dydaktycznej brał udział w projektach ministerialnych (CPBR nr. 8.1, cztery granty KBN) oraz programie europejskim Tempus JEP.
Był inicjatorem i współwykonawcą takich programów, jak automatyczna analiza sygnałów EKG, systemu komputerowej analizy dziekanatów PG (grant rektora PG), dydaktycznego systemu rozpoznawania obrazów, systemu automatycznej analizy testów egzaminacyjnych. Był wykładowcą wielu przedmiotów, najczęściej prowadził zajęcia z przetwarzania i rozpoznawania obrazów oraz technik programowania. Wykładał również w Akademii Marynarki Wojennej w Gdyni, Wyższej Szkole Inżynierskiej w Olsztynie oraz Społecznej Akademii Nauk w Słupsku. Ostatnio zajmował się metodami inteligentnego przetwarzania informacji oraz projektowaniem przyjaznych interfejsów. Jest autorem lub współautorem 14 książek i ponad 120 publikacji.

Mariusz Szwoch — ukończył Wydział Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej. W 2002 r. uzyskał stopień doktora nauk technicznych. Od 1990 r. pracował na Wydziale ETI PG w Katedrze Technik Programowania, a potem Inteligentnych Systemów Interaktywnych. Jego zainteresowania związane z pracą naukową i dydaktyczną obejmują m.in. techniki programowania, multimedia, systemy interaktywne i tworzenie gier wideo. Jest autorem lub współautorem 3 książek i ponad 80 publikacji, a także twórcą kilku systemów informatycznych.

Znajdź podobne książki Ostatnio czytane w tej kategorii

Darmowy fragment publikacji:

Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną, fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje naruszenie praw autorskich niniejszej publikacji. Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich właścicieli. Autor oraz Wydawnictwo HELION dołożyli wszelkich starań, by zawarte w tej książce informacje były kompletne i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane z tym ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Wydawnictwo HELION nie ponoszą również żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji zawartych w książce. Redaktor prowadzący: Małgorzata Kulik Projekt okładki Studio Gravite / Olsztyn Obarek, Pokoński, Pazdrijowski, Zaprucki Grafika na okładce została wykorzystana za zgodą Shutterstock.com Wydawnictwo HELION ul. Kościuszki 1c, 44-100 GLIWICE tel. 32 231 22 19, 32 230 98 63 e-mail: helion@helion.pl WWW: http://helion.pl (księgarnia internetowa, katalog książek) Drogi Czytelniku! Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres http://helion.pl/user/opinie/poprin Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję. ISBN: 978-83-283-3790-9 Copyright © Helion 2018 Printed in Poland. • Kup książkę • Poleć książkę • Oceń książkę • Księgarnia internetowa • Lubię to! » Nasza społeczność Spis treści Wstęp .............................................................................................. 5 Rozdział 1. Wprowadzenie do interfejsów użytkownika ........................................ 7 1.1. Interfejs użytkownika ................................................................................................ 7 1.2. Komputer i jego otoczenie ....................................................................................... 10 1.3. Historia rozwoju interfejsów człowieka z komputerem ........................................... 11 1.4. Interfejs dla osób niepełnosprawnych .................................................................... 16 Rozdział 2. Urządzenia interakcji ...................................................................... 19 2.1. Urządzenia wejściowe ............................................................................................. 20 2.2. Urządzenia wyjściowe ............................................................................................. 27 2.3. Uwagi końcowe ....................................................................................................... 31 Rozdział 3. Style interakcji człowieka z komputerem ......................................... 33 3.1. Wprowadzenie ......................................................................................................... 33 3.2. Interfejs tekstowy i języki poleceń .......................................................................... 34 3.3. Graficzny interfejs użytkownika .............................................................................. 36 3.3.1. Charakterystyka GUI ..................................................................................... 37 3.3.2. Kategorie kontrolek ....................................................................................... 37 3.4. Menu ........................................................................................................................ 39 3.4.1. Menu pojedyncze i liniowe ........................................................................... 41 3.4.2. Menu drzewiaste i grafy menu ...................................................................... 43 3.4.3. Menu stałe i kontekstowe .............................................................................. 50 3.4.4. Uwagi końcowe ............................................................................................. 55 3.5. Okna ........................................................................................................................ 58 3.5.1. Struktura i zawartość okna ............................................................................ 58 3.5.2. Rodzaje okien ................................................................................................ 61 3.5.3. Zarządzanie wieloma oknami ........................................................................ 63 3.6. Ikony i kafelki .......................................................................................................... 69 3.6.1. Ikony ............................................................................................................. 69 3.6.2. Kafelki ........................................................................................................... 72 3.7. Manipulacja bezpośrednia ....................................................................................... 73 3.7.1. Kursory ......................................................................................................... 74 3.7.2. Zastosowania manipulacji ............................................................................. 75 3.7.3. Wady i zalety manipulacji bezpośredniej ...................................................... 75 Poleć książkęKup książkę 4 Podstawy projektowania interfejsów użytkownika 3.8. Formularze ............................................................................................................... 78 3.8.1. Numer telefonu .............................................................................................. 81 3.8.2. Daty ............................................................................................................... 81 3.8.3. Czas ............................................................................................................... 81 3.8.4. Waluta ........................................................................................................... 82 3.8.5. Uwagi końcowe ............................................................................................. 82 Rozdział 4. Systemy multimedialne i multimodalne ........................................... 83 4.1. Multimedia — rozwój i zastosowanie ..................................................................... 83 4.2. Sygnały akustyczne i język naturalny .................................................................... 86 4.2.1. Interfejsy dźwiękowe .................................................................................... 86 4.2.2. Systemy informacji głosowej ........................................................................ 88 4.2.3. Generacja (synteza) mowy ............................................................................ 88 4.2.4. Rozpoznawanie słów ..................................................................................... 89 4.2.5. Mowa ciągła .................................................................................................. 89 4.3. Gesty ........................................................................................................................ 91 4.4. Uwagi końcowe ........................................................................................................ 91 Rozdział 5. Projektowanie interfejsu człowiek – komputer ................................. 93 5.1. Wprowadzenie ......................................................................................................... 93 5.2. Analiza zadań i użytkowników ................................................................................ 94 5.3. Projektowanie struktury interfejsu ........................................................................... 95 5.4. Wybór urządzeń interfejsu i stylu interakcji ............................................................ 98 5.5. Prezentacja informacji wyjściowej ........................................................................ 100 5.5.1. Diagram Gutenberga ................................................................................... 100 5.5.2. Projektowanie ekranów aplikacji ................................................................ 101 5.5.3. Wybór kolorów ........................................................................................... 103 5.6. Formy pomocy dla użytkownika ........................................................................... 104 5.7. Prototypowanie i ocena interfejsu .......................................................................... 105 5.7.1. Narzędzia prototypowania graficznego interfejsu użytkownika .................. 106 5.7.2. Ocena interfejsu .......................................................................................... 110 5.7.3. Uwagi końcowe ........................................................................................... 110 Rozdział 6. Rzeczywistość wirtualna i rozszerzona ........................................... 113 6.1. Rzeczywistość wirtualna ....................................................................................... 113 6.1.1. Interfejs i interakcja ..................................................................................... 115 6.1.2. Zastosowania VR ........................................................................................ 118 6.2. Rzeczywistość rozszerzona .................................................................................... 122 6.3. Uwagi końcowe ..................................................................................................... 126 Zakończenie ................................................................................ 129 Literatura ..................................................................................... 131 Żródła zdjęć .................................................................................. 135 Skorowidz .................................................................................... 137 Poleć książkęKup książkę Rozdział 4. Systemy multimedialne i multimodalne Dzięki nieustannemu udoskonalaniu sprzętu komputerowego zwiększają się jego moż- liwości współpracy z różnymi urządzeniami cyfrowymi, co pozwala na wzbogacanie metod interakcji człowieka z komputerem i w efekcie rozwoju interfejsu aplikacji. Ten kierunek rozwoju urzeczywistnia się w postaci systemów multimodalnych i w ten sposób wymiana informacji z komputerem może angażować wiele kanałów percepcji użytkownika. 4.1. Multimedia — rozwój i zastosowanie Systemy multimedialne stanowią kolejny wielki etap rozwoju systemów komputero- wych PC, wyrażający się szeroką integracją urządzeń peryferyjnych z komputerem. Twórcy dążą do tego, by nowe aplikacje mogły używać dźwięku, obrazu i wideo jako części standardowego interfejsu użytkownika i by zostały zaakceptowane tak samo, jak miało to miejsce w przypadku interfejsów graficznych, które zastąpiły używany wcześniej tryb tekstowy. Główne kierunki zastosowania multimediów są opisane ni- żej [1, 2, 25, 34, 38]. Pierwsze systemy multimedialne bazowały na idei hipertekstu i były systemami gene- ralnie tekstowymi, wzbogaconymi o obrazy cyfrowe i ewentualnie dźwięk. Ich atrak- cyjność polegała głównie na powiązaniu zgromadzonych informacji i ciekawej pre- zentacji multimedialnej. Szybki rozwój urządzeń multimedialnych, takich jak karty graficzne, karty dźwiękowe, wideo, CD-ROM itp., przyczynił się do istotnego posze- rzenia funkcji w zakresie przetwarzania, przechowywania i wyszukiwania informacji multimedialnej. Koncepcja programowania obiektowego oraz systemy operacyjne wyso- kiego poziomu umożliwiły projektowanie prostych i łatwych w użyciu systemów Poleć książkęKup książkę 84 Podstawy projektowania interfejsów użytkownika multimedialnych. Stało się przy tym możliwe przetwarzanie danych w czasie rzeczy- wistym oraz samodzielne sterowanie programem przez użytkownika, tj. praca inte- raktywna. Wytwarzanie aplikacji multimedialnych, zwłaszcza opartych na niestandardowych urządzeniach wejściowych i wyjściowych, jest zadaniem złożonym, w którym należy wziąć pod uwagę czynniki takie jak różnorodność sprzętu i oprogramowania oraz użyt- kowników, a także rozmaite warunki użytkowania, co jest istotne przy korzystaniu z optycznego lub akustycznego wejścia do systemu. Wytworzenie niezawodnego i uni- wersalnego oprogramowania, wykorzystującego cały potencjał sprzętu, wymaga stoso- wania nowoczesnych rozwiązań i metodologii wytwarzania oprogramowania, które kładą duży nacisk na etapy testowania, co z kolei znacząco podnosi koszt całego procesu. Powoduje to, że rozwój nowatorskich technologii i urządzeń, które mogłyby nadać programom multimedialnym nowy wymiar (takich jak interfejsy trójwymiarowe, ak- cesoria dla rzeczywistości wirtualnej czy rozpoznawanie mowy), przebiega stosun- kowo wolno. Obecnie właściwie każdy nowy zestaw komputerowy zasługuje na miano multime- dialnego, ponieważ już standardem są karty graficzne wyświetlające kolorowy obraz wysokiej rozdzielczości, karty dźwiękowe i dyski optyczne. Ponadto taki komplet może zostać wyposażony w kamerę, mikrofon oraz wzmacniacz z kolumnami głośnikowymi (rysunek 4.1) [36]. Krótko mówiąc, typowy zestaw multimedialny to taki, którego apli- kacje mogą posługiwać się tekstem, dźwiękiem, obrazem i wideo. Rysunek 4.1. Przykład konfiguracji multimedialnej komputera osobistego Miejsce interfejsu w systemie multimedialnym pokazano na rysunku 4.2. System multimedialny musi być traktowany przez projektantów z jednej strony jako narzędzie do przetwarzania informacji w konkretnym celu (np. do wspomagania decyzji z zakresu marketingu, finansów czy w grach), z drugiej zaś jako medium, które za- chęci użytkownika do korzystania z aplikacji (tutaj ważna jest estetyka, łatwość ko- munikacji itp.). Aplikacja multimedialna może być prezentacją pasywną, porównywalną z programem telewizyjnym, lub też interaktywnym systemem pozwalającym użytkow- nikowi na sterowanie nieliniowym przebiegiem wykonania zadania. Poleć książkęKup książkę Rozdział 4.  Systemy multimedialne i multimodalne 85 Rysunek 4.2. Interfejs i multimedia w dialogu człowieka z komputerem Obok branży rozrywkowej to edukacja stanowi największy rynek zbytu systemów multimedialnych, najlepiej bowiem wykorzystuje ich istotę, czyli możliwość prezen- tacji zagadnień. Dobrze znane są tu przykłady licznych programów do nauki języków obcych, encyklopedie multimedialne czy też multimedialne wersje podręczników szkol- nych i filmów do różnych przedmiotów. Dzięki ich zastosowaniu w szkołach można ciekawiej prowadzić lekcje, uczniowie zaś mogą łatwiej rozwiązywać zadania i roz- wijać własne zainteresowania pogłębiające ich wiedzę. Z drugiej strony rynek zalewany jest przez dziesiątki pozycji wykorzystujących co prawda technologie multimedialne, lecz z punktu widzenia edukacyjnego bezużytecznych lub wręcz zawierających me- rytoryczne błędy. Zmusza to nauczycieli do szczególnie dokładnej selekcji oprogramo- wania, zwłaszcza że zakup pojedynczej kopii programu komputerowego może oznaczać spory wydatek. Natomiast podzielany powszechnie pogląd, że komputer multimedialny podłączony do internetu stanowi uniwersalną receptę na podniesienie poziomu kształce- nia, jest z pewnością błędny. Z uwagi na wysokie koszty wytwarzania i użytkowania aplikacji multimedialnych ich rozwój ma sens, jeżeli poniesione wydatki zostaną zrekompensowane poprzez dużą liczbę sprzedanych licencji, jak ma to miejsce w sektorze edukacji i rozrywki (ang. edu- tainment = education+entertainment), lub poprzez inne wymierne korzyści odbiorcy biznesowego, np. redukcję czasu szkolenia czy zmniejszenie liczby personelu przy jednoczesnym zagwarantowaniu jakości i efektywności szkolenia. Świat biznesu i admi- nistracji docenia efektywność działania systemów multimedialnych. Na przykład baza danych skupiająca pracowników administracji może być znacznie poszerzona i oprócz pól tekstowych może zawierać zdjęcia i nagrania głosu poszczególnych osób. Pojawiły się także komputerowe systemy wspomagania decyzji, a coraz większą popularność zdobywają multimedialne systemy identyfikacji i kontroli wykorzystujące techniki rozpoznawania obrazu i dźwięku, niekiedy dysponujące możliwością analizy nagrań głosu i wideo. Systemy multimedialne znajdują obecnie zastosowanie w wielu dziedzi- nach życia. Można tu wymienić m.in.: systemy do śledzenia obiektów i monitoringu w miejscach publicznych (na ulicy, lotniskach, dworcach, w sklepach itp.) czy do opieki nad osobami starszymi i niepełnosprawnymi. Zastosowanie kamery termowizyjnej na podczerwień stwarza dodatkowe możliwości wykorzystania takich systemów przez wojsko lub służbę zdrowia. Poleć książkęKup książkę 86 Podstawy projektowania interfejsów użytkownika 4.2. Sygnały akustyczne i język naturalny Użycie języka naturalnego we współdziałaniu z komputerem jest postrzegane jako najbardziej pożądany styl interakcji, pozwalający użytkownikowi komunikować się z systemem w sposób swobodny. Mowa jest szybką metodą komunikacji i doskonale sprawdza się w sytuacjach, w których użytkownik nie może wydawać poleceń za po- mocą innych form interakcji. Język naturalny jest odpowiedni dla każdego użytkownika, chociaż przeprowadzany za jego pomocą dialog wcale nie musi być szybszy. Nadzieja, że komputer będzie reagował na polecenia i odpowiadał na pytania wydawane głosem, nieustannie inspiruje naukowców i inżynierów. W ostatnim czasie zanotowano ogromny postęp w zakresie rozpoznawania i generowania mowy. Zastosowanie prak- tyczne głosu w interakcji ma jednak sens tylko wtedy, kiedy użytkownicy mogą działać szybko i z małym poziomem błędu [2]. Projektowanie z użyciem interakcji audio obejmuje przynajmniej pięć odmian:  systemy z sygnałami akustycznymi,  systemy informacji głosowej,  generacja (synteza) mowy,  rozpoznawanie słów,  rozpoznawanie mowy ciągłej. W rozpoznawaniu słów i mowy wyróżniamy dwa rodzaje systemów:  systemy mowy zależnej (od mówcy),  systemy mowy niezależnej. Wymienione grupy mogą być łączone na różne sposoby i prowadzić do różnych sys- temów. 4.2.1. Interfejsy dźwiękowe Dźwięk ma duże znaczenie w przekazywaniu informacji. Każdy dźwięk charakteryzuje się swoją częstotliwością, siłą (głośnością) i tembrem (barwą). Człowiek słyszy dźwięki w zakresie częstotliwości od 20 Hz do 15 kHz. Do zaprojektowania interfejsu można użyć różnych dźwięków i sygnałów mowy. Wyszukiwanie i badanie wymyślnych form prezentacji informacji często odnosi się do audiowizualizacji lub interfejsu dźwiękowego. Na przykład wczesne dalekopisy generowały dźwięk dzwonka, aby ostrzec użytkowni- ka, że skończył się papier lub poinformować, że przyszła nowa wiadomość. Później systemy komputerowe dodały różne dźwięki do wskazywania zagrożenia lub sygnali- zowania zakończenia pewnej akcji. Niektóre urządzenia, takie jak kamera cyfrowa, gene- Poleć książkęKup książkę Rozdział 4.  Systemy multimedialne i multimodalne 87 rują elektroniczne dźwięki potwierdzające daną akcję (jako sprzężenie zwrotne). Z dru- giej strony po kilku godzinach pracy takie dźwięki mogą raczej zakłócać, niż pomagać, szczególnie w pomieszczeniu z kilkoma urządzeniami i użytkownikami. Dźwięki możemy podzielić na takie, które występują w sposób naturalny w środowi- sku, lub abstrakcyjne — generowane przez sztuczne źródło. W pierwszym przypadku mogą to być dźwięki takie jak skrzypienie drzwi, przelewanie płynu lub dzwonienie, które pomagają wzmocnić wizualne metafory zastosowane w graficznym interfejsie. W dźwiękach naturalnych rozpoznaje się nie tylko samo źródło, ale i jego charakter. W drugim przypadku do reprezentacji obiektów i akcji są używane ikony dźwiękowe (ang. auditory icons). Na przykład „katalog” oznacza zwykle zbiór kartek papieru, dlatego podczas jego likwidowania (przenoszenia do kosza) emitowany jest dźwięk nisz- czonego papieru. W innej sytuacji efekt dźwiękowy można utworzyć, ale jego zna- czenia trzeba się nauczyć. Na przykład kopiowanie nie ma przypisanego dźwięku, ale może być sygnalizowane przez odgłos przelewania płynu do pojemnika, przy czym wysokość towarzyszącego dźwięku rośnie wraz z postępem kopiowania. Dźwięki mogą przekazywać wiele informacji bardzo ekonomicznie. Gdy do skrzynki pocztowej nadejdzie plik — usłyszymy szelest, gdy plik jest duży — wystąpi niski, ciężki dźwięk, jeżeli będzie to plik tekstowy — szmer, a gdy skompilowany program — dźwięk metalu. Różnorodność użytych sygnałów i dźwięków może być atrybutem menu akustycznego, właściwego w sytuacji, gdy użytkownik np. prowadzi samochód i ma zajęte ręce i oczy. Menu akustyczne jest także użyteczne w interfejsie telefonicznym i w rozmaitych infor- matorach powszechnego dostępu. W menu akustycznym podpowiedzi i listy opcji są wypowiadane do użytkownika, który odpowiada, używając stosownych przycisków klawiatury, ekranu dotykowego albo własnego głosu. Ikony dźwiękowe możemy podzielić na kilka kategorii ze względu na funkcje, jakie pełnią:  zawiadomienie użytkownika o konkretnym zdarzeniu, np. pojawieniu się nowej poczty,  potwierdzenie efektów działań użytkownika, np. zapisania lub skasowania pliku,  sygnalizacja zmian stanu, wynikająca z działania użytkownika,  wskazywanie użytkownikowi wybranych obiektów,  proponowanie podpowiedzi (w rodzaju sugerowanych odpowiedzi tak lub nie),  sygnalizacja działania w toku (monitorowanie działania). W ten sposób aplikacje mogą skutecznie i w przewidziany sposób wpływać na działania użytkownika. Emisja sygnałów dźwiękowych trwa krótko, zwykle od 0,1 do 2 sekund. Rozwiązania akustyczne mogą wykorzystywać indywidualne dźwięki, a bardziej zło- żone informacje prezentować przez kombinację dźwięku i muzyki. Od projektantów dźwięku oczekuje się także uczestnictwa w nowych projektach, szczególnie mobilnych. Poleć książkęKup książkę 88 Podstawy projektowania interfejsów użytkownika 4.2.2. Systemy informacji głosowej Znaczenie języków naturalnych w nowoczesnych systemach telefonicznych i infor- macyjnych stale rośnie. Potrafią one wspierać użytkownika w realizacji niektórych zadań. Na przykład podczas próby połączenia telefonicznego z pożądanym departa- mentem czy osobą w danej organizacji system, używając nagranej wiadomości, udo- stępnia użytkownikowi kilka ponumerowanych możliwości wyboru. Użytkownik wska- zuje opcję, wypowiadając lub naciskając odpowiedni numer na klawiaturze telefonu. Następnie system może przedstawić kolejny zbiór opcji. Proces ten trwa do momentu zebrania informacji koniecznych do zrealizowania połączenia. Powyższy przykład pokazuje, że nawet system posługujący się bardzo ograniczonym słownictwem może być przydatny. Systemy informacji głosowej są popularne, ponieważ umożliwiają obsługiwanie klien- tów przez całą dobę i nie są drogie. Mają one także szerokie zastosowanie w nawigacji samochodowej, serwisach internetowych, pomieszczeniach dyspozytorskich i kontrol- nych (np. komunikat typu: „Uwaga, podnosi się temperatura!”), poczcie głosowej, grach dla dzieci itp. 4.2.3. Generacja (synteza) mowy Generacja mowy jest niekwestionowanym sukcesem naukowym i technologicznym, co więcej — ma wiele zastosowań praktycznych. Syntezator mowy może być użyty do roz- szerzenia graficznego interfejsu użytkownika, a w sieciach Web do tworzenia przegląda- rek głosowych. Umożliwia on czytanie na głos dokumentów, gazet czy danych staty- stycznych. Możliwość zamiany tekstu na głos jest bardzo atrakcyjna zwłaszcza dla niewidomych. Takie rozwiązanie jest zaimplementowane w interfejsie Microsoft Win- dows Narrator oraz w sieci Web w przeglądarkach głosowych (ang. voice browsers) do czytania fragmentów tekstu. Dobrze gdy generowane wiadomości są proste i krótkie. Jednym z ciekawych osiągnięć z tego obszaru jest polski syntezator mowy IVONA1. Spółka Unikkon Integral opracowała w 2009 r. program MagicScribe, który rozpo- znaje mowę i zamienia ją na tekst. Z kolei program opracowany specjalnie dla lekarzy pozwala im poświęcać dużo mniej czasu na tworzenie dokumentacji (program jest bowiem trzy razy szybszy niż przeciętna osoba pisząca na komputerze). Opracowano też podobne programy, które służą prawnikom, administracji, firmom, a nawet studen- tom, którzy chcą automatycznie tworzyć notatki. Dalsze badania koncentrują się na użyciu tej metody w telekomunikacji w celu odczytu SMS-ów i uwolnienia użytkow- nika od męczącego odpisywania na małej klawiaturze. Duże znaczenie ma opracowanie syntezatorów dla urządzeń mobilnych, które to stają się na rynku ważniejsze od kom- puterów osobistych. 1 http://www.ivona.com/pl/. Poleć książkęKup książkę Rozdział 4.  Systemy multimedialne i multimodalne 89 Firma IVO Software opracowała kolejną, ulepszoną wersję syntezatora mowy — IVONA 2. Nowy syntezator jest bardziej inteligentny. Potrafi generować pojedyncze słowa i całe zdania oraz czytać książki z jakością zbliżoną do ludzkiej mowy, ponadto jest dziesięciokrotnie szybszy od poprzedniego. W języku polskim oferuje cztery rodzaje głosów, a w języku angielskim sześć. 4.2.4. Rozpoznawanie słów Obecnie automatyczne rozpoznawanie izolowanych słów osiągnęło dość wysoki po- ziom, co otwiera przed nim szerokie pole zastosowania. Współczesne urządzenia roz- poznają słowa wypowiedziane przez konkretną osobę z niezawodnością 90 – 98 dla zbioru 100 – 1000 słów lub nawet większych. Rozpoznawanie słów funkcjonuje do- brze w wyspecjalizowanych zastosowaniach — w wojsku, lotnictwie, w medycynie (np. na sali operacyjnej), w laboratoriach i biurach — ale nie jako ogólny środek interakcji. Podczas codziennego korzystania z komputera, kiedy używa się monitora z ekranem, głos ma marginalne znaczenie. Klawiatura i urządzenie wskazujące z bezpośrednią manipulacją są często szybsze w działaniu niż rozpoznawanie mowy. Chociaż kombi- nacja głosu i bezpośredniej manipulacji może być użyteczna, to polecenia błędnie podane na wejście głosowe mogą być trudne do naprawy, a i efektywna reakcja sys- temu może być zbyt wolna. Problemy pojawiają się, kiedy zmienia się poziom natężenia głosu, użytkownik jest chory lub zestresowany albo słowa są do siebie podobne. Projekty badawcze skupiają się na poprawie jakości rozpoznawania głosu w trudnych warunkach, zwiększeniu podstawowego słownika do ponad 10 tys. słów, ograniczeniu czasu rozpoznawania przy rozszerzeniu zasobu słów i eliminacji konieczności nauczenia się przez urządzenie specyficznego głosu poszczególnych użytkowników. System mowy zależnej od mówcy daje większą dokładność niż system z mówcą niezależnym, ale ten drugi eliminuje etap treningu i w ten sposób rozszerza zakres komercyjnych zastosowań. 4.2.5. Mowa ciągła Badania naukowe poświęcane rozpoznawaniu mowy ciągłej prowadzone są z nadzieją na komercyjny sukces. Jednak użytkownicy są często rozczarowani poziomem błę- dów i trudnością ich poprawienia. Projektantom programów komputerowych kłopot sprawiają zwykle rozmyte granice między wypowiadanymi słowami. Do innych pro- blemów należą: różnorodność akcentów, odmienne poziomy wypowiadania, wpływ emocji na intonację oraz skala zakłóceń i szumów. Jednak większość błędów wynika z semantycznej interpretacji i braku kontekstowego rozumienia, które człowiek łatwo wykorzystuje w celu wyeliminowania niejednoznaczności. Język naturalny silnie zależy od kontekstu, przez co często jest dwuznaczny. Poleć książkęKup książkę 90 Podstawy projektowania interfejsów użytkownika Systemy rozpoznawania mowy ciągłej umożliwiają użytkownikowi na przykład dyk- towanie tekstów i składanie raportów słownych do automatycznej translacji. Przeglą- danie i poprawianie ich na komputerze odbywa się zwykle na ekranie przy użyciu klawiatury. Zastosowanie metod sztucznej inteligencji pozwala na dalsze ułatwienia w zakresie poprawiania tekstu oraz automatycznego opracowania streszczenia. Oprócz rozpoznawania treści w niektórych sytuacjach zachodzi potrzeba automatyczne- go rozpoznawania głosu (czyli mówcy). Jest to możliwe, ponieważ w sygnale mowy poza informacjami określającymi treść wypowiedzi są zawarte również informacje osobnicze charakteryzujące indywidualny głos mówcy. Tego rodzaju cechy osobnicze głosu za- warte w sygnale mowy umożliwiają rozpoznanie mówcy na podstawie jego wypowiedzi. Rozpoznawanie mowy może być użyte do identyfikacji osób. Spotykamy się z tym na co dzień, gdy musimy rozpoznać głos drugiej osoby podczas rozmowy telefonicznej lub głos aktora w audycji radiowej. Zastosowanie takiej identyfikacji w systemach komputerowych może umożliwiać uprawnionym osobom dostęp do komputera w celu korzystania z jego oprogramowania i baz danych. Innym ważnym obszarem wykorzy- stania rozpoznawania głosu jest bankowość (np. przy weryfikacji klientów podczas transakcji bankowych, kontroli telefonicznego dostępu do kont bankowych czy podczas korzystania z kart kredytowych), ale także wojsko (np. do zwiększenia bezpieczeń- stwa). W przypadku takiego systemu wskazane jest, aby dokonał on identyfikacji mówcy już po kilku wypowiedzianych słowach. Pomimo dużego zainteresowania oraz ciągłego postępu technicznego, na razie możliwości praktycznego zastosowania rozpo- znawania mowy ciągłej są dość ograniczone. Automatyczne rozpoznawanie głosów ma głównie dwa cele: identyfikację głosów oraz ich weryfikację. Identyfikacja głosów to procedura przypisania nieznanej wypowiedzi do mówcy z ustalonego zbioru. Inaczej mówiąc, w populacji M mówców należy wskazać tego, którego cechy osobnicze głosu są najbardziej zbliżone do cech głosu zawartych w analizowanej wypowiedzi. Weryfikacja głosów jest natomiast procedurą potwierdzenia lub odrzucenia przez przedstawiającego się mówcę zgłoszonej tożsa- mości na podstawie próbki mowy. Systemy autoryzacji głosowej są jeszcze dość zawodne, ponieważ cechy ludzkiego głosu mogą się zmieniać w znaczący sposób — nawet z godziny na godzinę. Jednak duże znaczenie praktyczne porozumiewania się z komputerem za pomocą głosu po- woduje, że prowadzone są intensywne badania nad opracowaniem skutecznych pro- cedur rozpoznawania mowy i mówców. Zastosowanie rozpoznawania mowy w menu drzewiastym może być sukcesem, jeżeli użytkownik zna interesujące go nazwy. Gorzej, kiedy struktura menu się rozszerza i wydłuża lub kiedy segmenty odbieranej informacji słownej są rozwlekłe — to fru- struje użytkownika. Opóźnienie pojawiania się głosu na wyjściu, jego ulotna natura i ewentualne trudności w zrozumieniu pozostają dużym wyzwaniem. Pomimo wystę- pujących ograniczeń systemy tego rodzaju oferują duże korzyści dla szerokiego grona osób niepełnosprawnych, które swoje polecenia mogą wydawać właśnie głosem. W dobie intensywnego wykorzystania i rozwoju interfejsów graficznych obserwuje się ewolucję wszystkich interfejsów użytkownika w kierunku interfejsu multimedial- nego, w którym do zaprezentowania informacji zostają połączone dane różnych typów, takie jak tekst, dźwięk, obraz statyczny i dynamiczny, czyli wideo. Poleć książkęKup książkę Rozdział 4.  Systemy multimedialne i multimodalne 91 4.3. Gesty Ciągły rozwój technologii sprzętu komputerowego pozwala na wprowadzanie no- wych form komunikacji między człowiekiem i komputerem [4, 28]. Ważną nową formą przekazywania informacji jest analiza zachowania człowieka, tj. jego ciała, a w szczególności gestów wyrażanych za pomocą ruchu i pozycji ręki, dłoni i kciuków. Osobliwość tej metody sprawia, że sprawdza się ona w pewnych sytuacjach, w których inne sposoby interakcji mogą nie być odpowiednie lub efektywne, np. wśród ludzi upo- śledzonych. Ogólnie gesty ręki możemy klasyfikować jako statyczne i zmienne w czasie. Gesty statyczne reprezentują znaki izolowane, podczas gdy druga grupa wyraża sekwencje podlegające zmianom w czasie. Rozpoznawanie znaków ciągłych (podobnie jak mo- wy ciągłej) jest o wiele trudniejsze, ponieważ między gestami nie ma wyraźnych przerw. Przy rozpoznawaniu języka znaków i mowy ciągłej występują zatem podobne problemy, ponieważ oba procesy są zmienne w czasie. Według przeznaczenia gesty możemy podzielić na:  konwersacyjne,  sterujące,  służące do manipulacji,  komunikacyjne. Gesty konwersacyjne są wyrażane za pomocą języka znaków, który charakteryzuje się specjalnym zbiorem słów i gramatyką. Słowa w tym języku ujawniane są w postaci gestów (znaków), które mogą być (w pewnym stopniu) zmienne podczas dialogu. Przykładem gestów sterujących są gesty nawigacyjne, gdzie wychwytywana jest orienta- cja ręki, która wskazuje kierunek w przestrzeni (w środowisku rzeczywistym lub wirtualnym) do nawigacji. Gesty manipulacyjne stanowią sposób interakcji człowieka z obiektami wirtualnymi (rysunek 3.37), natomiast gesty komunikacyjne obejmują spe- cjalne przypadki, które analizowane są na studiach psychologicznych. Z powyższego opisu widać, że ewolucja interfejsu użytkownika od formy tekstowej, klawiatury i myszki zrobiła ogromny postęp, a rozpoznawanie gestów, chociaż wciąż jest w początkowej fazie rozwoju, nabrało już dużego znaczenia praktycznego. Wyko- rzystanie do sterowania komputerem gestów, odręcznego pisma i głosu stanowi ważny etap postępu interfejsu multimodalnego. 4.4. Uwagi końcowe Rozszerzeniem interfejsu jednomodalnego, np. interfejsu WIMP, opartego na metafo- rach, jest wprowadzenie interfejsu multimodalnego. Interfejs multimodalny jest połącze- niem (kombinacją) różnych kanałów informacji (tekstowego, akustycznego, wizualnego), Poleć książkęKup książkę 92 Podstawy projektowania interfejsów użytkownika co umożliwia różne sposoby interakcji, np. za pomocą śledzenia gałek ocznych, czy- tania z ruchu warg, rozpoznawania twarzy, pisma itp. Interfejs użytkownika stał się jednym z najważniejszych elementów oprogramowania. Jego szczególne znaczenie wynika z faktu, że użytkownik nie widzi innych części systemu poza jego interfejsem. Mimo że ukuto określenie „przyjazny dla użytkowni- ka” (ang. user friendly) i przyjęto, że sterowanie komputerem powinno opierać się na grafice oraz być zorientowane na człowieka, i mimo że interfejs graficzny udoskona- lano przez wiele lat — nadal praca z komputerem nie dla wszystkich użytkowników jest łatwa. Jef Raskin zwraca uwagę, że obecne systemy stają się coraz większe i co- raz bardziej skomplikowane oraz że pomimo ciągłych ulepszeń ich interfejsów wciąż używa się pojęć bardzo specyficznych (np. „system plików” czy „otoczenie siecio- we”), których zrozumienie stanowi podstawę sprawnej pracy z komputerem. Systemy mają również wiele ustawień parametrów i właściwości, których poznanie i wykorzy- stanie przez przeciętnego użytkownika nie jest proste. Do powstania przyjaznego interfejsu może przyczynić się budowa systemów o więk- szej inteligencji. Innym kierunkiem rozwoju interfejsu jest np. stworzenie użytkowniko- wi możliwości posługiwania się językiem naturalnym. Zapytania w języku natural- nym są dla użytkownika dużo łatwiejsze niż zapytania w wymyślonych do tego celu językach formalnych. Na wyższy poziom mogą wznieść interfejs użytkownika nowe urządzenia wejścia-wyjścia, jeszcze lepiej wykorzystujące głos, odręczne pismo czy nawet myśli. Koncepcje łączące najnowsze rozwiązania sprzętowe z osiągnięciami sztucznej inteli- gencji stanowią obecnie podstawę dalszego rozwoju badań nad interfejsem. Inteli- gentny multimodalny interfejs powinien zwiększyć możliwości interakcji użytkowni- ka z komputerem. Zastosowanie odpowiednich mediów pozwoli zaś na poszerzenie strumienia informacji przepływającego między człowiekiem a maszyną. Aby osiągnięcie takich korzyści stało się w pełni możliwe, konieczne jest zrozumienie charakteru in- formacji i jej powiązania z poszczególnymi mediami. Korzyścią interakcji multimodalnej jest to, że człowiek może komunikować się w in- ny sposób niż tradycyjny oraz że komputer może lepiej zrozumieć polecenie, jakie powinien wykonać. Jest to szczególnie ważne w sytuacji, kiedy nie nastąpiło dokład- ne rozpoznanie instrukcji wydanej za pomocą gestu lub głosu. Od wielu lat trwają prace nad rozwojem interfejsów multimedialnych i multimodalnych pozwalających na wykorzystywanie różnych kanałów interakcji z komputerem. Interfejsy tego typu pozwalają m.in. na zdalne sterowanie komputerem w sytuacji, gdy użytkownik nie może zarządzać nim bezpośrednio. Jednym z przykładów możli- wości podejścia multimodalnego jest sterowanie programami komputerowymi za po- mocą całego ciała, gestów lub głosem, tak jak w interfejsie typu NUI (ang. natural user interface) [14] stosowanym obecnie w konsoli Microsoft Xbox oraz w nowocze- snych telewizorach. Poleć książkęKup książkę Skorowidz A aplikacje RAD, 106 AR, augmented reality, 113 external, 125 internal, 125 awatar, 117 B BCI, brain-computer interface, 17 belka tytułowa, 58 C CAVE, 30, 118, 119 charakterystyka stylów interakcji, 99 CLI, command-line interface, 12, 34 czarodziej, 14 czas, 81 czcionka, 79 D dane tabelaryczne, 39 daty, 39, 81 dekompozycja funkcjonalna zadania, 96 diagram Gutenberga, 100 dostęp do sieci komputerowej, 11 doznanie akustyczne, 116 drukarka 3D, 27 drzewo, 43 katalogów, 47 dżojstik, 24, 26 E F efekty dźwiękowe, 30 ekran aplikacji, 101 dotykowy, 25, 26 LCD, 26 ładowania, 38 elementy grupujące, 39 okna głównego, 60 formularz, 38, 78–82 jakość, 79 konstruowanie, 78 wypełnianie, 78, 99 G generowanie mowy, 88 gesty, 91 komunikacyjne, 91 konwersacyjne, 91 służące do manipulacji, 91 sterujące, 91 głośniki, 30 graficzne nakładki ekranowe, 38 graficzny interfejs użytkownika, GUI, 13, 36 kategorie kontrolek, 37 narzędzia prototypowania, 106 GUI, graphical user interface, 13, 36 Poleć książkęKup książkę 138 Podstawy projektowania interfejsów użytkownika H HIG, human interface guidelines, 14 historia rozwoju interfejsów, 11 HUD, head-up display, 123, 124 I I3, Immersion, Imagination, Interaction, 114 IDE, Integrated Application Development, 106 ikona, 69 animowana, 72 dźwiękowa, 72, 87 ikony, 38 informacje o programie, 39 inspektor właściwości, 39 interakcja, 115 z komputerem, 33 interfejs BCI, 17 CLI, 12 dla osób niepełnosprawnych, 16 dźwiękowy, 86 graficzny, 74 Metro, 73 multimedialny, 92 multimodalny, 92 neuronalny, 18 NUI, 92 ocena, 105, 110 projektowanie, 93 prototypowanie, 105, 106 sprzętowy, 7 tekstowy, 34 użytkownika, 7 w systemie multimedialnym, 84 J język naturalny, 86, 89, 99 poleceń wierszowych, 34, 99 SQL, 35 VRML, 114 XAML, 109 K kafelki, 69, 72 karty, Patrz zakładki kask HMD, 29, 115, 118 kategorie kontrolek, 37 klawiatura, 21 programowa, 22 specjalna, 17 kolory, 39, 103 komputer, 10 komunikaty, 39 konfiguracja multimedialna komputera, 84 konsola operatorska, 21 systemowa, 11, 35 kontrolery gier, 24 kontrolki, 37 grupowanie, 38 nawigacja, 38 wprowadzanie danych, 38 wykonywanie akcji, 38 wyświetlanie informacji, 38 konwencje kolorów, 103 kursor, 74 L LCD, 29 LED, light emitting diode, 29 linia statusu, 59 liniowe struktury menu, 40 listy, 39, 101 łącza, 39 Ł M manipulacja bezpośrednia, 73, 75 językowa, 76 manipulator, 26 kulkowy, 26 Microsoft Kinect, 75 mapa strony internetowej, 48 mechanizm przeciągnij i upuść, 108 menu, 39 drzewiaste, 43, 45 grafy, 43 kontekstowe, 52 kontekstowe pulpitu, 54 liniowe, 41 podręczne, 52 pojedyncze, 41 Poleć książkęKup książkę Skorowidz 139 przestrzenne graficzne, 46 sieci, 48 stałe, 50 struktury grafowe, 49 systemy, 39, 40 miniaturowy dżojstik, 26 monitor, 28 mowa ciągła, 89 multimedia, 83 mysz, 22, 26 typu 3D, 23 N narzędzia prototypowania GUI, 106 nawigacja, 115 NLS, oN-Line System, 12 NUI, natural user interface, 92 numer telefonu, 81 O ocena interfejsu, 110 OCR, optical character recognition, 32 okna, 39, 58 aktywacja, 59 dialogowe, 12, 39, 56, 61 główne, 61 modalne, 62 otwarcie, 59 przesuwanie zawartości, 60 ramka, 59 rodzaje, 61 z zakładkami, 68 zamknięcie, 59 zarządzanie, 63 zmiana rozmiaru, 60 okruszki, 39 okulary OLED, 29 opisy, 38 AR Google Glass, 124 OHMD, 123 P pad, 24 panele, 39 paski adresowe, 39 informacyjne, 38 menu, 39 narzędziowe, 39, 54, 59, 107 postępu, 38 statusu, 38, 59 pióro świetlne, 26 wskazujące, 25 płytka dotykowa, 24, 26 podpowiedzi, 38 pola danych specjalnych, 81 tekstowe, 39 wielokrotnego wyboru, 39 wyboru, 56 polecenia menu File, 44 systemów operacyjnych, 35 pomoc dla użytkownika, 104 poszukiwanie informacji, 48 powiadomienia, 38 prezentacja informacji wyjściowej, 100 program GIMP, 67 projektowanie ekranów aplikacji, 101 interfejsu, 93 analiza użytkowników, 94 analiza zadań, 94 menu, 95 pomoc dla użytkownika, 104 prezentacja informacji, 100 struktura, 95 wizualne, 107, 109 prototypowanie, 105 przechowywanie danych multimedialnych, 11 przetwarzanie wsadowe, 36 przyciski radiowe, 39 R RAD, rapid application development, 106 ramka, 39 reprezentacje drzewa, 39 rękawice wirtualnej rzeczywistości, 26, 115 rodzaje okien, 61 urządzeń sterujących, 26 rozpoznawanie głosu, 90 mowy, 19, 32, 86, 89, 90 pisma, 32 znaków ciągłych, 91 Poleć książkęKup książkę 140 Podstawy projektowania interfejsów użytkownika rozwijalne listy, 39 rozwój interfejsów, 11 rysik, 26 rzeczywistość rozszerzona, AR, 114, 122 wirtualna, VR, 113 S SaaS, Software as a Service, 11 SAR, spatial augmented reality, 123 schematy poszukiwania informacji, 48 sensory T tablet piórkowy, 25 tabliczka graficzna, 26 touchpad, 24 trójwymiarowa wizualizacja, 120 TTY, TeleTYpe writer, 11 TUI, text-based user interface, 12 typy urządzeń wejściowych, 20 U UDK, Unreal Development Kit, 59 unifikacja interfejsu, 73 urządzenia interakcji, 19 sterujące, 26 śledzące postać użytkownika, 26 wzrok, 26 typu VR, 117 wejściowe, 20 wizualne, 28 wyjściowe, 27 USB, universal serial bus, 31 usługi sieciowe, 11 V VR, virtual reality, 113 urządzenia, 117 zastosowania, 118 VRD, virtual retinal display, 123 W widżet, 37 wiersz polecenia, 35 WIMP, 13, 36, 37, 69 wizualizacja wyników zapytania, 47 wprowadzanie danych, 39 wskaźnik, 38 kulkowy, 23 wstążka, 39 wybór kolorów, 103 stylu interakcji, 98 układu okien, 65 urządzeń interfejsu, 98 z menu, 99 SQL, structured query language, 35 sterowniki nożne, 26 struktura biometryczne, 26 głębi, 26 skrót klawiaturowy Alt+Esc, 64 Alt+Tab, 63 Ctrl+Alt+Delete, 63 Windows+Tab, 64 drzewa, 43 interfejsu, 95 styl Aero, 96 Luna, 96 style interakcji, 33, 99 sygnały akustyczne, 86 symulatory lotu, 121 synteza mowy, 86 system komputerowy, 10 NLS, 12 systemy informacji głosowej, 86, 88 mowy niezależnej, 86 mowy zależnej, 86 multimedialne, 83 przestrzennej rzeczywistości wzbogaconej, 123 z sygnałami akustycznymi, 86 Ś środowisko 3D, 115 wirtualne, 115 Poleć książkęKup książkę Skorowidz WYSIWYG, 106, 107 wyświetlacz, 28 typu HUD, 123 typu OLED, 29 141 Z zakładki, 39, 67 arkuszy, 68 zanurzenie, immersion, 114 zarządzanie wieloma oknami, 63 zastosowania drzewa, 44 manipulacji, 75 VR, 118 Poleć książkęKup książkę 142 Podstawy projektowania interfejsów użytkownika Poleć książkęKup książkę
Pobierz darmowy fragment (pdf)

Gdzie kupić całą publikację:

Podstawy projektowania interfejsów użytkownika
Autor:
,

Opinie na temat publikacji:


Inne popularne pozycje z tej kategorii:


Czytaj również:


Prowadzisz stronę lub blog? Wstaw link do fragmentu tej książki i współpracuj z Cyfroteką: