Data Science i Big Data w zarządzaniu
Studia podyplomowe Data Science i Big Data w zarządzaniu mają na celu dostarczenie kadrze managerskiej całościowego spojrzenia na ogół zagadnień związanych z Big Data i Data Science.
Od lat przedsiębiorstwa przechodzą od niewielkich ilości danych i analizy opartej wyłącznie o wiedzę ekspercką, często skrzywioną spojrzeniem osoby analizującej problem, na decyzje oparte na informacji i wiedzy płynących z gromadzonych danych.
Nowocześni liderzy powinni być świadomi możliwości, które niesie ze sobą poprawna praca z danymi oraz analiza i automatyzacja związanych z nimi procesów. W szczególności powinni patrzeć ponad sloganami i rozumieć, w jaki sposób technologie i metody analityczne mogą przynieść wartość przedsiębiorstwu. Rozwijając własne zdolności analityczne zyskują lepszą zdolność monitorowania postępów prac i podejmowania decyzji w oparciu o kwantyfikowane miary sukcesu.
Cel studiów
Studia podyplomowe Data Science i Big Data w zarządzaniu mają na celu dostarczenie kadrze managerskiej całościowego spojrzenia na ogół zagadnień związanych z Big Data i Data Science.
Poza zdobyciem wiedzy w zakresie specyfiki dużych danych, integracji i gromadzenia danych z różnych źródeł oraz architektury rozwiązań klasy Big Data uczestnicy rozwiną także praktyczne kompetencje z obszaru kierowania działem, projektem lub przedsiębiorstwem w organizacjach korzystających z rozwiązań Big Data oraz osiągnięć Data Science.
Dla kogo przeznaczone są studia?
Studia podyplomowe Data Science i Big Data w zarządzaniu przeznaczone są dla osób ze szczebla średniej i wyższej kadry managerskiej pełniącej swoje funkcje m.in. (ale nie wyłącznie) w obszarach marketingu, finansów, IT, zarządzania łańcuchem produkcji, HR, zarządzanie strategiczne.
Program studiów przygotowany został też z myślą o potrzebach kierowników projektów, którzy chcą pogłębić wiedzę dziedzinową związaną z Big Data i Data Science i dzięki temu zyskać szerszą perspektywę oraz lepiej rozumieć kontekst prowadzonych projektów. Zdobyta wiedza i umiejętności pozwolą lepiej rozumieć, z jakimi problemami mierzą się członkowie zespołu projektowego oraz być lepiej przygotowanym do rozmów z osobami technicznymi.
Program studiów
1. Wprowadzenie do Big Data i Data Science
- Wprowadzenia do tematyki wdrażania i realizacji projektów Big Data / Data Science w organizacji.
- Wprowadzenie do tematyki analizy danych (data science) i uczenia maszynowego (machine learning) w przedsiębiorstwie.
- Wprowadzenie do technologii analizy dużych danych (big data) w przedsiębiorstwie.
2. Statystyka
- Metody opisu struktury zbiorowości jednowymiarowych.
- Metody losowego i nielosowego doboru próby.
- Zmienna losowa.
- Teoria estymacji.
- Testowanie hipotez statystycznych.
- Metody analizy współzależności zjawisk.
- Funkcja regresji liniowej.
- Funkcja regresji logistycznej.
3. Podejmowanie decyzji w oparciu o dane: metody
- Sztuczna inteligencja (AI) vs Machine learning.
- Praca z danymi - przygotowanie.
- Modele nadzorowane - wprowadzenie do różnych klas modeli, porównanie ich użyteczności do różnych zagadnień, wady, zalety, przykłady użycia.
- Tuning i interpretowalność modeli.
- Ewaluacja modeli - wyjaśnienie czym i po co są zbiory treningowy, walidacyjny, testowy, do czego służy walidacja krzyżowa (cross-validation) oraz jak oceniać modele.
- Modele nienadzorowane - wprowadzenie do różnych klas modeli, porównanie ich użyteczności do różnych zagadnień, wady, zalety, przykłady użycia.
- Metody redukcji wymiarów i reprezentacji danych.
- Text mining.
- Wprowadzenie do Deep Learning.
- Deep learning w NLP.
- Wizja komputerowa (Computer Vision) z wykorzystaniem Deep learningu - case study, jak zbudować prostą wyszukiwarkę/rekomender podobnych obrazów.
4. Podejmowanie decyzji w oparciu o dane: narzędzia wizualizacji i Business Intelligence
- Podstawy hurtowni danych
- Wizualizacja danych
- Charakterystyka narzędzi BI
- Cechy wyróżniające wybrane narzędzia BI
- Warsztat Power BI
5. Big Data - strategia, wdrożenie, transformacja przedsiębiorstwa
- Podstawowe pojęcia i definicje w obszarze.
- Rola danych, jako strategicznego zasobu organizacji.
- Rola i wyzwania dla CDO.
- Metodyka strategicznego podejścia do zarządzania danymi.
- Definiowanie i wdrażanie Strategii Danych.
- Wielowymiarowa perspektywa Data Management / Data Governance w organizacji.
- Modele oceny zaawansowania analitycznego organizacji.
- Modele oceny dojrzałości Data Management / Data Governance.
- Wprowadzenie do DAMA oraz innych frameworków Data Management / Data Governance.
- Architektury danych oraz Modelowanie danych.
- Metodyka zarządzania i realizacji projektów i programów w obszarze danych.
- Charakterystyka rozwiązań Hurtowni Danych/BI, Data Lake, Big Data i Data Science.
- Struktura organizacyjna oraz kluczowe role w obszarze Data Management.
- Zarządzanie zmianą kulturową w obszarze danych w organizacji.
6. Infrastruktura Big Data i zarządzanie danymi
- Budowa systemów do przetwarzania dużych zbiorów danych
- Planowanie infrastruktury
- Architektura lambda i kappa
- Skalowalność systemów
- Przechowywanie danych
- SQL i NoSQL w świecie Big Data
- Modelowanie danych
- Sposoby przetwarzania danych
- Zastosowania czasu rzeczywistego
- Przetwarzanie strumieniowe danych
- Integracja systemów
- Przetwarzanie i składowanie danych w chmurze publicznej
- Strategia Multicloud
- Integracja środowiska on premise z środowiskiem chmury publicznej
- Rozwiązania chmurowe niezależne od dostawcy infrastruktury
7. Python w analizie danych
- Środowisko pracy i wprowadzenie do programowania.
- Podstawy programowania w języku Python (w tym: typy danych, instrukcję sterujące funkcje).
- Przetwarzanie danych tabelarycznych w bibliotece pandas (selekcja danych względem zadanych kryteriów, transformacje danych, agregowanie).
- Wczytywanie i zapis danych w formatach typowych dla programu Excel.
- Podstawowe instrukcje do wizualizacji danych.
- Połączenie z bazą danych SQL z poziomu Python.
- Wykorzystanie uczenia maszynowego w języku Python (uczenie i ewaluacja modelu predykcyjnego).
- Zapisywanie, wczytywanie i zastosowanie zbudowanych modeli.
8. Zagadnienia bezpieczeństwa danych
- Podstawowe usługi ochrony informacji
- Wybrane techniki ochrony informacji
- Podstawy prawne ochrony informacji
- Modele bezpieczeństwa systemów
- Polityka bezpieczeństwa
- Metody oceny bezpieczeństwa systemów
- Ochrona informacji w bazach danych
- Przetwarzanie danych osobowych i wrażliwych
- Blockchain jako rozproszona baza danych Podstawowe usługi ochrony informacji