Algorytmy specjalnego zastosowania w Big Data (I)- wykład WSE-BD-ASZwBD(I)-w
Moduł 1: Analiza skupień i profilowanie użytkowników
1️ Analiza skupień – metody K-Means – Podstawowe techniki grupowania obiektów w Big Data.
2️ Zaawansowane techniki analizy skupień –Segmentacja danych w bardziej złożonych zbiorach.
3️ Profilowanie użytkowników i dopasowanie krzywych modelowych – Identyfikacja wzorców w danych
Moduł 2: Analiza gradacyjna i analiza korespondencji
4️ Gradacyjna analiza korespondencji – wprowadzenie – Metoda eksploracji danych jakościowych.
5️ Zaawansowane modele gradacyjnej analizy korespondencji
6️ Zastosowanie gradacyjnej analizy korespondencji w Big Data – Analiza zachowań konsumenckich i eksploracja relacji między zmiennymi jakościowymi.
Moduł 3: Analiza sieci społecznych (Social Network Analysis, SNA)
7️ Podstawy analizy sieci społecznych (SNA) – Struktura sieci, stopień centralności, analiza powiązań.
8️ Zastosowania SNA w badaniach – Analiza wpływu, detekcja kluczowych węzłów w sieci.
9️ Modelowanie interakcji i rozprzestrzeniania informacji w sieciach – Jak Big Data pomaga w analizie dynamiki sieci.
Moduł 4: Analiza koszykowa i algorytmy asocjacyjne
10 Analiza koszykowa – wprowadzenie do algorytmu Apriori – Jak odkrywać zależności między produktami na podstawie danych transakcyjnych.
11 Zaawansowane algorytmy analizy koszykowej
12 Wykorzystanie analizy koszykowej w marketingu i e-commerce – Personalizacja rekomendacji i przewidywanie trendów zakupowych.
Moduł 5: Random Forest i metody zespołowe
13 Random Forest – zasady działania i struktura algorytmu – Wprowadzenie do metody, podział na klasyfikację i regresję.
14 Zastosowanie Random Forest w Big Data – Wykorzystanie w analizie predykcyjnej i eksploracyjnej.
Grupa przedmiotów ogólnouczenianych
Opis nakładu pracy studenta w ECTS
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Przedmiotowe efekty uczenia się
Wiedza:
Zna podstawowe i zaawansowane metody analizy danych wykorzystywane w Big Data, takie jak analiza skupień, analiza korespondencji, SNA i algorytmy asocjacyjne.
Rozumie zasady działania kluczowych algorytmów, w tym K-Means, Apriori, Random Forest oraz metod stosowanych w segmentacji użytkowników.
Zna zastosowania tych technik w profilowaniu użytkowników, analizie zachowań konsumenckich oraz badaniu struktur sieci społecznych.
Umiejętności:
Potrafi przeprowadzić analizę skupień, segmentację danych oraz podstawowe profilowanie użytkowników.
Umie zastosować gradacyjną analizę korespondencji oraz algorytmy asocjacyjne do odkrywania ukrytych wzorców w dużych zbiorach danych.
Potrafi wykonać podstawową analizę sieci społecznych (SNA) oraz zastosować Random Forest do zadań predykcyjnych w Big Data.
Kompetencje społeczne:
Rozumie znaczenie odpowiedzialnego wykorzystania algorytmów analizy danych w kontekście prywatności i etyki.
Potrafi krytycznie ocenić wyniki analiz i poprawnie interpretować zależności odkrywane w danych jakościowych i ilościowych.
Jest przygotowany do samodzielnego poszerzania wiedzy w zakresie nowoczesnych metod eksploracji danych i ich praktycznych zastosowań.
Kryteria oceniania
Podstawą zaliczenia kursu jest test z wiedzy nabytej podczas wykładu. Aby zaliczyć test, student musi udzielić 60% poprawnych odpowiedzi.
Literatura
Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Non-structured Text Data Application. Oxford: Elsevier.
Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier).
Szymańska, A. (2017a). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116.
Szymańska, A. (2017b). Wykorzystanie Analizy Skupień Metodą Data Mining Do Wykreślania Profili Osób Badanych. Studia Psychologiczne, 55, 26–42. https://doi.org/10.2478/V1067-010-0160-1
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: