Eksploracja danych WP-CWC-N-1-ED
W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja i algorytmy klasyfikacyjne (k-nn, drzewa decyzyjne i lasy losowe, sieci neuronowe), regresja i algorytmy szacowania (k-nn, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich, hierarchiczną, dwustopniową analizą skupień, sieciami Kohonena), analiza koszykowa oraz metody redukcji wymiaru.
Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem środowiska R oraz języka programowania Python.
Dyscyplina naukowa, do której odnoszą się efekty uczenia się
E-Learning
W cyklu 2021/22_Z: E-Learning (pełny kurs) z podziałem na grupy | W cyklu 2024/25_Z: E-Learning (pełny kurs) z podziałem na grupy | W cyklu 2023/24_Z: E-Learning (pełny kurs) z podziałem na grupy | W cyklu 2025/26_Z: E-Learning (pełny kurs) z podziałem na grupy | W cyklu 2022/23_Z: E-Learning |
Grupa przedmiotów ogólnouczenianych
Opis nakładu pracy studenta w ECTS
W cyklu 2022/23_Z: 1. Godziny realizowane z udziałem nauczycieli:
a. konserwatorium – 15 godzin,
c. bieżące przygotowanie do zajęć, w tym rozwiązywanie zadań zleconych przez prowadzących, zapoznanie się z informacją zwrotną dotyczącą rozwiązanych zadań oraz konsultacje z prowadzącymi zajęcia – 20 godzin.
2. Czas poświęcony na pracę indywidualną studenta/słuchacza/uczestnika kursu potrzebny do pomyślnego zaliczenia przedmiotu:
a. studiowanie literatury – 20 godzin,
b. zapoznanie się z materiałami dodatkowymi, m.in. dokumentacją bibliotek i pakietów – 20 godzin,
3. Czas wymagany do przygotowania się do uczestnictwa w procesie oceniania (np. w sprawdzianach):
a. przygotowanie się do sprawdzianu– 20 godzin.
RAZEM: 95 godzin (6 punktów ECTS)
| W cyklu 2025/26_Z: Szacunkowy nakład pracy studenta:
- uczestnictwo w zajęciach 15 h,
- konsultacje z prowadzącym 15 h,
- prace domowe 40 h,
- przygotowanie do weryfikacji 40 h,
razem 110 h, co odpowiada 4 ECTS. |
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Efekty kształcenia
K1 - Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków (K_K02, K_K04).
K2 - Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych (K_K02).
Kryteria oceniania
Dla wszystkich efektów przyjmuje się następujące kryteria oceny we wszystkich formach weryfikacji:
ocena 5: osiągnięty w pełni (bez uchwytnych niedociągnięć),
ocena 4,5: osiągnięty niemal w pełni i nie są spełnione kryteria przyznania wyższej oceny,
ocena 4: osiągnięty w znacznym stopniu i nie są spełnione kryteria przyznania wyższej oceny,
ocena 3,5: osiągnięty w znacznym stopniu – z wyraźną przewagą pozytywów – i nie są spełnione kryteria przyznania wyższej oceny,
ocena 3: osiągnięty dla większości przypadków objętych weryfikacją i nie są spełnione kryteria przyznania wyższej oceny,
ocena 2: nie został osiągnięty dla większości przypadków objętych weryfikacją.
Literatura
Literatura podstawowa:
1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.
2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.
3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019.
4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach.
Literatura uzupełniająca:
5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.
6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).
7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).
8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: