Eksploracja danych WP-BGC-N-2-ED
Wprowadzenie
Przebieg procesu eksploracji danych. Reprezentacje danych wejściowych. Atrybuty, instancje.
Reprezentacja informacji wyjściowych (tabele, modele liniowe, drzewa, reguły, reprezentacje w postaci zbiorów instancji). Uczenie nadzorowane i nienadzorowane.
Przykłady zadań eksploracji danych (opisowych, estymacja, predykcja, klasyfikacja, klasteryzacja i odkrywanie skojarzeń)
Wstępne przetwarzanie danych
Oczyszczanie danych, brakujące dane, skalowanie, wykrywanie danych odstających, metody graficzne, dyskretyzacja, ekstrakcja i selekcja cech, redukcja wymiarowości.
Przegląd algorytmów eksploracji danych
• metody Bayesowskie (naiwny model Bayesowski i sieci Bayesowskie)
• drzewa decyzyjne (C4.5, random forrest)
• odkrywanie reguł
• reguły skojarzeniowe
• regresja liniowa i logistyczna
• metody oparte na instancjach (kNN)
• Support Vector Machines
• metody klasteryzacji (k-means, mean shift, DBSCAN, Ward)
Ocena rezultatów
Ocena wydajności, walidacja krzyżowa, porównanie schematów eksploracji danych, ocena prawdopodobieństw predykcji, zasada minimalizacji długości opisu.
Przykłady zastosowań
• systemy rekomendacji. Metody oparte na sąsiedztwie oraz faktoryzacji macierzy. Konkurs Netflix.
• analiza danych w sieci Internet
E-Learning
Grupa przedmiotów ogólnouczenianych
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
absolwent zna i rozumie:
podstawy informatyki
podstawy konstrukcji oprogramowania
podstawy matematyki
absolwent potrafi:
posługiwać się narzędziami informatycznymi
posługiwać się narzędziami informatycznymi w przeprowadzaniu badań
absolwent jest gotów do:
uczenia się przez całe życie. Potrafi w tym celu wykorzystać narzędzia
informatyczne. Rozumie potrzebę ustawicznego pogłębiania wiedzy i
umiejętności oraz potrafi samodzielnie wykorzystywać w tym celu
dostępne mu źródła. Potrafi czytać ze zrozumieniem teksty ogólne i
specjalistyczne
współdziałania i pracy w grupie, przyjmując w niej różne role
Nakład pracy studenta (bilans punktów ECTS)
Udział w zajęciach 15 godz
Dodatkowe godziny kontaktowe z nauczycielem 4 godz
Samodzielne studiowanie tematyki zajęć 25 godz
Udział w ćwiczeniach laboratoryjnych 15 godz
Sumaryczne obciążenie pracą studenta 59 godz
Punkty ECTS za moduł 2 ECTS
Kryteria oceniania
Dla wszystkich efektów przyjmuje się następujące kryteria oceny we wszystkich formach weryfikacji:
ocena 5: osiągnięty w pełni (bez uchwytnych niedociągnięć)
ocena 4,5: osiągnięty niemal w pełni i nie są spełnione kryteria przyznania wyższej oceny
ocena 4: osiągnięty w znacznym stopniu i nie są spełnione kryteria przyznania wyższej oceny
ocena 3,5: osiągnięty w znacznym stopniu – z wyraźną przewagą pozytywów – i nie są spełnione kryteria przyznania wyższej oceny
ocena 3: osiągnięty dla większości przypadków objętych weryfikacją i nie są spełnione kryteria przyznania wyższej oceny
ocena 2: nie został osiągnięty dla większości przypadków objętych weryfikacją
Ocena końcowa x jest wyznaczana na podstawie wartości
st(w)= 5, jeśli 4,5 < w;
st(w)= 4,5, jeśli 4,25 < w <= 4,5;
st(w)= 4, jeśli 3,75 < w <= 4,25;
st(w)= 3,5, jeśli 3,25 < w <= 3,75;
st(w)= 3, jeśli 2,75 < w <= 3,25;
st(w)= 2, jeśli w <= 2,75
oraz na bazie podanej niżej reguły:
x wyznacza się ze wzoru x=st(z), gdzie z jest średnią ważoną ocen z przeprowadzonych weryfikacji,w których wagi ocen z egzaminów wynoszą 2, a wagi ocen z innych form weryfikacji są równe 1
Literatura
a) podstawowa:
1. Dzeroski S., Lavrac N. (red.): Relational Data Mining. Springer, Berlin, 2001.
2. Knobbe A.: Multi-Relational Data Mining, IOS Press, 2006.
3. Dzeroski S.: Multi-relational data mining: An introduction. SIGKDD Explorations Newsletter 5(1), s. 1 - 16, 2003.
b) uzupełniająca:
1. Hand D., Mannila H., Smyth P.: Eksploracja danych, Wydawnictwa Naukowo-Techniczne, 2005.
2. Lavrac N., Dzeroski S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, New York, 1994.
3. Cichosz P.: Systemy uczące się. WNT, Warszawa, 2000.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: