Inżynieria i analiza Big Data I-wykład WSE-BD-IABD-I-w
W trakcie realizacji przedmiotu studenci zapoznają się z kompleksowym podejściem do inżynierii oraz analizy danych Big Data. Przedmiot obejmuje zarówno teoretyczne podstawy przetwarzania dużych wolumenów danych, jak i praktyczne zastosowania nowoczesnych technologii oraz narzędzi analitycznych wykorzystywanych w gospodarce cyfrowej. Uzupełnieniem będzie prezentacja aktualnych trendów rynkowych w tym zakresie.
Studenci poznają podstawowe pojęcia, modele oraz architektury systemów Big Data, w tym rozproszone systemy przetwarzania danych (np. Hadoop, Spark), bazy danych NoSQL, strumieniowe przetwarzanie danych oraz koncepcje Data Lake i Data Warehouse. Omówione zostaną również aktualne trendy w obszarze przetwarzania danych, takie jak przetwarzanie w chmurze (cloud computing), analiza danych w czasie rzeczywistym (real-time analytics), zastosowanie sztucznej inteligencji w analizie danych (AI-driven analytics) czy automatyzacja procesów analitycznych.
Szczególny nacisk zostanie położony na cykl życia danych – od ich pozyskiwania, poprzez czyszczenie i przygotowanie, modelowanie i analizę, aż po wizualizację oraz interpretację wyników. Podczas zajęć studenci będą rozwijać umiejętności m.in. w zakresie projektowania i implementacji procesów przetwarzania danych, interpretowania wyników analiz oraz budowania wizualizacji wspierających procesy decyzyjne. Istotnym elementem zajęć będzie także doskonalenie kompetencji prezentacyjnych – studenci będą uczyć się przedstawiania wyników swoich analiz w sposób zrozumiały, logiczny i przekonujący, z wykorzystaniem argumentacji opartej na danych oraz teoriach naukowych.
Zakres:
1. Wprowadzenie do Inżynierii Danych
Definicja inżynierii danych i jej znaczenie
Podstawowe pojęcia odnoszące się do zarządzania danymi
Rola dużych zbiorów danych i wykorzystanie big data w organizacji
Rola eksperta ds. inżynierii i analizy danych w organizacji
Studium przypadku (np. sektor medialny)
2. Pozyskiwanie, gromadzenie i przetwarzanie danych
Big Data a źródła danych
Bazy danych i magazyny danych
Przechowywaniem i analityka dużych zbiorów danych
Identyfikowanie zależności między danymi
Bezpieczeństwo danych
Sztuczna inteligencja, uczenie maszynowe a uczenie głębokie
Studium przypadku (np. sektor bankowy)
3. Uczenie maszynowe i sztuczna inteligencja w inżynierii danych
Wprowadzenie do uczenia maszynowego
Algorytmy uczenia maszynowego
Wykorzystanie maszynowego uczenia do rozwiązywania problemów inżynierii danych
Korzyści z zastosowania uczenia pogłębionego
Sztuczna inteligencja w inżynierii danych
Dopasowanie technologii i środowiska programistyczne dla inżynierii danych
Studium przypadku (np. sektor telekomunikacyjny)
4. Analiza danych i ich wizualizacja
Analiza dużych zbiorów danych
Przegląd narzędzi do analizy danych
Wizualizacja danych: znaczenie i zastosowania
Narzędzia do wizualizacji danych
Studium przypadku (np. sektor społeczny)
Dyscyplina naukowa, do której odnoszą się efekty uczenia się
Grupa przedmiotów ogólnouczenianych
Opis nakładu pracy studenta w ECTS
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza:
. W01. Ma uporządkowaną i pogłębioną wiedzę na temat inżynierii big data
W02. Posiada wiedzę z zakresu pozyskiwania, rafinacji oraz przechowywania big data
W03. Posiada wiedzę na temat metod przeprowadzania analiz opartych na big data
Umiejętności:
U01. Potrafi wybrać i zastosować właściwy sposób postępowania w celu budowy dużych zbiorów danych
U02. Identyfikować i pozyskiwać big data dotyczące zjawisk społecznych z rożnych obszarów
Kompetencje:
K01. Przygotowania projektów społecznych w zakresie analizy danych
K02. Współpracy międzydziedzinowej w ramach wykonywanych zadań
Kryteria oceniania
50% – aktywność podczas zajęć,
20% – realizacja projektów,
20% – uzasadnienie (w dyskusji) przyjętych założeń i rozwiązań,
10% – odpowiedzi na pytania indywidualne.
Literatura
Firley-Buzon A., Big data w humanistyce i naukach społecznych, Warszawa 2020
Holmes D., Big data, Wydawnictwo Uniwersytetu Łódzkiego, Łódź 2021
Szeliga M., Praktyczne uczenie maszynowe, Wydawnictwo Naukowe PWN, Warszawa 2019
Szeliga M., Data science i uczenie maszynowe, Wydawnictwo Naukowe PWN, Warszawa 2017
Kapczyński A., Introduction to big data, Theoretical and pracitical aspects, Lublin 2021
Kisielnicki J., Zarządzanie i informatyka, Placet, Warszawa 2014
Jemielniak D, Przegalińska A, Społeczeństwo współpracy, Wydawnictwo Naukowe-Scholar, Warszawa 2020
Przegalińska A. Jemielniak D. Strategizing AI in Business and Education, Cambridge University Press, Cambridge 2023
Śledziewska K., Włoch R., Gospodarka Cyfrowa, Jak nowe technologie zmieniają świat, Wydawnictwo Uniwersytetu Warszawskiego,
Warszawa 2020
Stephenson D., Big data, nauka o danych i AI bez tajemnic, Wydawnictwo Helion, Gliwice 2020
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: