Seminarium tematyczne: Algorytmy text mining i web crawling WF-R-PS-STAS
1. Wprowadzenie do algorytmów Text Mining, informacje podstawowe na temat metody.
2. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część pierwsza
3. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część druga
4. Prezentacja wyników przy pomocy Analizy Składowych Głównych.
5. Raportowanie wyników Analizy Składowych Głównych.
6. Przekształcanie bazy danych słownych w dane liczbowe.
7. Rekodowanie danych liczbowych w nowe zmienne liczbowe.
8. Web Crawling – podstawowe informacje
9. Raportowanie wyników dotyczących Web Crawling
10. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: drzewami decyzyjnymi.
11. Raportowanie wyników dotyczących łączenia TM z drzewami decyzyjnymi
12. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: analizą skupień Generalised k-means Cluster Analysis.
13. Raportowanie wyników dotyczących łączenia TM z analizą skupień
14. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: sieci neuronowe.
15. Raportowanie wyników dotyczących łączenia TM z sieciami neuronowymi
E-Learning
Grupa przedmiotów ogólnouczenianych
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
WIEDZA:
- doktoranci poprawnie posługują się terminologią metody Text mining oraz Web Crawling.
UMIEJĘTNOŚCI:
- przeprowadzają analizę z wykorzystaniem algorytmów Text mining oraz analizy składowych głównych a także poszukują danych przy pomocy Web Crawling
KOMPETENCJE:
- poprawnie interpretują wyniki przeprowadzonych analiz
Opis punktów ECTS
Udział w zajęciach: 30 godzin
Przygotowanie do zajęć oraz przygotowanie raportów, czytanie literatury: 30 godzin
Kryteria oceniania
Podstawą zaliczenia kursu jest oddanie dwóch raportów końcowych prezentujących wyniki opracowane z wykorzystaniem metody Web Crawling i Text Mining.
Literatura
Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application. Oxford: Elsevier.
Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier).
Szymańska, A. (2017). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: