Lektury obowiązkowe konsultanta Business Intelligence
sample image

Lektury obowiązkowe konsultanta Business Intelligence

Nic nie zastąpi praktyki, ale wielokrotnie w kontekście BI padają pytania - od czego zacząć, jaką książkę przeczytać. W tym artykule postaram się podać kilka pozycji godnych uwagi oraz kolejność w jakiej warto je przeczytać. Zakładam, że odbiorcą jest osoba, która docelowo chciałaby zajmować się BI z punktu widzenia konsultanta, czyli umieć połączyć siły światów biznesu i technologii w ramach inicjatyw klasy Business Intelligence.

Spis Treści

Wstępniak

Muszę przyznać, że niniejszy artykuł jest skutkiem mojego lenistwa. Jestem wielokrotnie pytany przez różne osoby, jak najlepiej zabrać się do Business Intelligence i skąd czerpać wiedzę. Teraz nie będę już musiał wygłaszać kolejny raz tego samego 10-cio minutowego monologu, tylko prześlę odpowiedniego linka :-) Implikacją tego jest również fakt, iż ta publikacja przedstawia moje subiektywne zdanie oraz jest podsumowaniem moich własnych doświadczeń, stąd być może ktoś uzna, że jest lepsza droga, lub ciekawsze pozycje do przeczytania w zakresie BI.

Kontekst biznesowy i powody stosowania Business Intelligence

Warto zacząć od szerszego spojrzenia na analitykę biznesową i umiejscowienia jej w ramach przedsiębiorstwa oraz zrozumienia jej roli w budowaniu przewagi konkurencyjnej firmy. „Inteligencja analityczna w biznesie: nowa nauka zwyciężania” autorstwa Thomasa H. Davenporta oraz Jeanne G. Harris to podsumowanie badania firmy Accenture przeprowadzonego na firmach, które wykorzystują analitykę, jako jedną z najważniejszych swoich kompetencji. Autorzy prezentują wnioski z analizy w postaci pięciostopniowej skali zaawansowania analitycznego organizacji oraz mapy drogowej wskazującej, jak firma może przechodzić na jej wyższe poziomy, aż do uzyskania miana konkurenta analitycznego. Zwracają w szczególności uwagę na kluczowe aspekty poza-technologiczne we wdrażaniu kultury analitycznej w przedsiębiorstwie. Książka jest dość krótka i można ją z przyjemnością przeczytać „do poduszki” w dwa dni.

Pozycja ta nie porusza żadnych kwestii technologicznych, jednak doskonale wprowadza w kontekst biznesowy korzystania z BI, odpowiadając na poziomie biznesowym na pytania jak? oraz po co?. Dodatkowo podkreśla niezwykle istotny, a często pomijany czynnik wdrożenia BI - ludzi. To ludzie muszą wierzyć w sens podejmowania decyzji na bazie faktów i wiedzy i to ludzie są odbiorcami systemów BI.

Ogólna wiedza na temat zagadnień związanych z Business Intelligence

Business Intelligence, systemy wspomagania decyzji biznesowych” autorstwa dr. Jerzego Surmy z SGH to pierwsza polska książka poświęcona BI. Pozycja ta wprowadza w tematykę BI, w przystępny sposób omawiając jego historię, główne zagadnienia Hurtowni Danych, OLAP, jak również zaawansowanej analityki biznesowej, omawia też zastosowania BI oraz jego umiejscowienie w kontekście budowania wartości przedsiębiorstwa. Aspekty technologiczne ujęte są w tej książce w bardzo przystępny sposób, stąd czytelnik o dowolnym profilu jest w stanie ją „skonsumować” jednego dnia i przyswoić przekrojową wiedzę z zakresu Business Intelligence.

Spojrzenie na BI od strony programu/projektu

Książka „The Data Warehouse Lifecycle Toolkit” podchodzi do zagadnienia Hurtowni Danych oraz Business Intelligence z perspektywy projektu, a nawet programu - inicjatywy biznesowej w korporacji. Pokazuje charakterystykę wdrażania Business Intelligence oraz definiuje model zwany Kimball Lifecycle, ubierający w ramy proces wdrażania BI wraz z najlepszymi praktykami. Jest to najpopularniejszy na świecie model, stosowany przez znaczącą większość praktyków BI. Należy też zaznaczyć, że nie odnosi się ona wprost do zaawansowanej analityki biznesowej (np. eksploracji danych), a koncentruje głównie na zagadnieniach związanych z projektowaniem, budowaniem i wdrażaniem Hurtowni Danych oraz systemów na niej opartych.

Książka przedstawia też w pewnym skrócie wiedzę technologiczną, zawartą w pozostałych pozycjach z pod ręki Kimballa i jego Kimball Group - "The Data Warehouse Toolkit" oraz "The Data Warehouse ETL Toolkit". Skierowana również do osób biznesowych, korzystających z narzędzie BI, lub zarządzających projektami DW/BI.

Nie jest to już pozycja, którą można przeczytać w jeden, czy dwa dni. Nie należy się spieszyć przy jej czytaniu, ponieważ zawiera dużo kluczowej wiedzy, nad którą warto się zastanowić i przeanalizować. Książka nie została też do tej pory przetłumaczona na język polski i nie jest dostępna w polskich księgarniach (chociaż widziałem ją ostatnio na stronach jednej z księgarni internetowych w astronomicznej cenie).

Biblia modelowania wielowymiarowego

Pozycji tej nie trzeba polecać - klasyka gatunku. Lektura obowiązkowa dla każdego, kto chce profesjonalnie zajmować się projektowaniem Hurtowni Danych i modeli wielowymiarowych. Opis dobrych praktyk, wskazówki dla projektantów, wytłumaczenie podstawowych pojęć i koncepcji, takich jak wolno zmieniające się wymiary (SCD), rodzaje tabel faktów (tranzakcyjne, migawki, migawki akumulowane), czy różne rodzaje wymiarów (mini wymiary, wymiary 'śmieciowe', wymiary zdegenerowane, wielowartościowe, etc.) i inne.

Książka „The Data Warehouse Toolkit” jest już bardziej techniczna, jednak napisana jest w sposób bardzo przystępny dla osób biznesowych. Nie doczekała się ona również polskiego wydania.

Wszystko o ETL

Integracja danych jest jednym z najbardziej technicznych i najbardziej kosztownych etapów projektu klasy BI/DW. Przyjmuje się, że średni pochłania ona ok. 70% zasobów w projekcie. Dokładne zrozumienie jej charakterystyki i najlepszych praktyk jest ważne nie tylko dla zespołu zajmującego się bezpośrednio integracją danych, ale również dla osób pełniących kluczowe funkcje w projekcie BI/DW/

The Data Warehouse ETL Toolkit” opisuje dogłębnie kluczowe aspekty tworzenia procesów ETL, m. in. kwestie dotyczące wymagań dla integracji danych, wykorzystywane architektury i struktury danych, projektowanie przepływu danych, zagadnienia związane z jakością danych (Data Quality), ładowanie struktur wielowymiarowych, wdrażanie i utrzymanie systemów ETL, zarządzanie metadanymi, jak również kwestie zarządzania projektem oraz najnowsze trendy w dziedzinie.

Bill Inmon, czyli podejście alternatywne

Alternatywą dla literatury spod ręki Ralpha Kimballa i jego Kimball Group są książki autorstwa innej sławy dziedziny Business Intelligence i Hurtowni Danych - Billa Inmona. Są to „Building the Data Warehouse” oraz „DW 2.0”. Podczas gdy podejście Ralpha Kimballa można sklasyfikować jako od szczegółu do ogółu (bottom-up), gdzie architektura Hurtowni Danych powstaje z analizy kolejnych procesów biznesowych, o tyle podejście Inmona można zaliczyć do tych z rodziny top-down.

Pierwsza z wymienionych książek prezentuje koncepcję Inmona związaną z projektowaniem i budową Hurtowni Danych. Druga to uaktualnione spojrzenie na architekturę współczesnych Hurtowni Danych, ze szczególnym naciskiem na uwzględnienie w niej nowych, często nieustrukturalizowanych danych. Nie jest to jednak pozycja godna polecenia, ponieważ wydaje się, jakby autor chciał zmieścić jak najmniej wartościowej treści, na jak największej liczbie stron.

Pozycje uzupełniające oraz czego nie warto czytać

Z innych ciekawych pozycji na temat klasycznego BI i jego zastosowań, warto przeczytać „The Performance Manager. Proven Strategies for Turning Information Into Higher Business Performance” wydane dawniej przez Cognos (obecnie IBM). Książkę można darmowo zamówić na stronach IBM. Pokazuje ona jak w poszczególnych obszarach działalności organizacji można stosować Business Intelligence w celu zarządzania wydajnością.

Business Intelligence for Telecommunications” z jednej strony jest kompletnym opisem dziedziny BI, z drugiej umiejscawia ją w kontekście Telekomunikacji i zastosowań BI w ramach niej.

Popularna w polskich księgarniach (czasem jedyna na temat BI) jest również książka „Projektowanie Hurtowni Danych. Zarządzanie kontaktami z klientami (CRM)” Chrisa Todmana. Warto przeczytać tę pozycję, jednak należy to robić świadomie, z pewną dozą dystansu i nieufności do tego, co pisze autor. Jest to dość stara pozycja i nie koniecznie we wszystkich aspektach aktualna.

Inną pozycją dostępną w języku polskim jest „Hurtownie Danych. Podstawy organizacji i funkcjonowania”. Książka jest absolutnie nie warta czytania z perspektywy osoby zarówno biznesowej, jak i technicznej, chyba że ktoś pisze pracę naukową i monografia na temat state-of-the-art w publikacjach na temat hurtowni danych sprzed prawie dekady jest mu potrzebna.

Zaawansowana analityka biznesowa

Do tej pory mamy już bardzo mocne podstawy w kontekście projektowania i budowania hurtowni danych, systemów ETL oraz modeli wielowymiarowych. Kolejnym krokiem jest zapoznanie się z aspektami zaawansowanej analityki biznesowej, która z reguły korzysta z danych zgromadzonych w hurtowniach. Książka „Mastering Data Mining. The Art and Science of Customer Relationship Management”, mimo że minęło już sporo czasu od jej wydania, jest wciąż aktualna i jest wciąż doskonałą pozycją, która na praktycznych przykładach wprowadza w kluczowe aspekty wykorzystania eksploracji danych do rozwiązywania realnych problemów biznesowych. Znajdziemy w niej opis kompletnej metodyki wdrażania eksploracji danych tzw. The Virtuous Cycle of Data Mining, opis kontekstu biznesowego tego typu inicjatyw, zbiór najlepszych praktyk oraz masę praktycznych przykładów (opisanych bardziej na poziomie biznesowym niż technicznym).

Przystępny wstęp do eksploracji danych od strony technicznej

Odkrywanie wiedzy w danych. Wstęp do eksploracji danych” Daniela T. Larose to doskonała pozycja, aby zrozumieć podstawy merytoryczne eksploracji danych. Książka jest napisana w bardzo przystępny sposób, nawet dla osób typowo biznesowych. Pozwala poznać charakterystykę podstawowych metod i algorytmów eksploracji danych, co jest kluczowe podczas korzystania z narzędzi oraz wyników analiz je wykorzystujących. Osoby zainteresowane bardziej zaawansowanymi metodami eksploracji danych mogą przeczytać inną pozycję tego samego autora „Metody i modele eksploracji danych”.

Pogłębienie wiedzy

W celu pogłębienia wiedzy warto zwrócić uwagę na kilka dodatkowych książek. „Eksploracja zasobów sieciowych. Analiza struktury, zawartości i użytkowania sieci WWW.” to kolejna pozycja Daniela T. Larose, poświęcona analizie danych pochodzących z sieci WWW.

Data Mining: Practical Machine Learning Tools and Techniques (Third Edition)” Wittena i Franka to podręcznik teoretycznie i praktycznie wprowadzający w eksplorację danych na bazie znanego open-source’owego pakietu WEKA.

Data Mining: Concepts and Techniques, Second Edition” to doskonały, kompletny i co warte podkreślenia akademicki podręcznik poświęcony eksploracji danych oraz wszelkim aspektom z nią związanych. Książka jest przeznaczona zdecydowanie dla osób o zacięciu technicznym.

Podsumowanie

Przedstawione pozycje są tylko niewielkim podzbiorem dostępnych na rynku książek w tematyce BI, a ich dobór jest tylko pewną moją propozycją drogi wejścia w tematykę BI.

. Jak wspomniałem na początku, żadna książka nie zastąpi praktyki, jednak lektura wymienionych pozycji jest w stanie dać solidne podstawy teoretyczne. Najwięcej uczymy się zawsze na projektach, ale kilka wieczorów spędzonych przy książkach z pewnością pozwoli nam ominąć kilka niebezpiecznych pułapek.

Bibliografia:

Berry J. A. Michael, Linoff Gordon, Mastering Data Mining, Wiley 2000
Ralph Kimball, Margy Ross, Bob Becker, Joy Mundy, Warren Thornwaite, The Data Warehouse Lifecycle Toolkit. Practical Techniques for Building Data Warehouse and Business Intelligence Systems., Wiley Computer Publishing, 2008
William H. Inmon, Building the Data Warehouse (3rd Edition), Wiley Publishing, 2002
William H. Inmon, DW 2.0 - Architecture for the Next Generation of Data Warehousing, Morgan Kaufmann, 2008
Roland P. Mosimann, Patrick Mosimann, Meg Dussault, The Performance Manager, Proven Strategies for Turning Information Into Higher Business Performance, Cognos Incprporated, 2007
Larose T. Daniel, Odkrywanie wiedzy z danych, PWN 2006
Jerzy Surma, Business Intelligence. Systemy wspomagania decyzji biznesowych., PWN 2010
Matthias Jarke, Maurizio Lenzerini, Yannis Vassiliou, Panos Vassiliadis, Hurtownie danych. Podstawy organizacji i funkcjonowania., WAiP, 2003.
Daniel T. Larose, Metody i modele eksploracji danych, PWN, 2008.
Ralph Kimball, Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition), Wiley 2002
Chris Todman, Projektowanie hurtowni danych Zarządzanie kontaktami z klientami (CRM), WNT, 2003
Jiawei Han, Micheline Kamber, Jian Pei, Data Mining: Concepts and Techniques, Second Edition, Morgan Kaufmann, 2005.
Ian H. Witten, Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Morgan Kaufmann 2010
Ralph Kimball, Joe Caserta, The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data, Wiley Publishing Inc.
Robert S. Kaplan, David P. Norton, Strategiczna Karta Wyników, Wydawnictwo Naukowe PWN, Warszawa, 2007.
Deepak Pareek, Business Intelligence for Telecommunications, Auerbach Publications, 2006
Zdravko Markov, Daniel T. Larose, Eksploracja zasobów internetowych, PWN 2009

Marcin Choiński

Author_Marcin_Choinski

Pasjonat wszystkiego co związane z Hurtowniami Danych oraz Business Intelligence. Posiada kilkuletnie doświadczenie w kierowaniu projektami BI i Data Mining oraz budowaniu produktów klasy DW/BI. Współwłaściciel i red. nacz. portalu BI.PL. Prywatnie entuzjasta biegania oraz zjeżdżania z góry na jednej desce.

Share |
Komentarze
Nie ma jeszcze żadnych komentarzy
Business Intelligence Portal | BI.PL