Algorytmy sztucznej inteligencji w Big Data-wykład WSE-BD-ASIwBD(I)-w
1. Wprowadzenie do Big Data – historia i rozwój Big Data, definicja i kluczowe wyzwania, zastosowania w różnych branżach.
2. Pozyskiwanie danych w Big Data – algorytmy webcrawlingu, zbieranie danych z internetu, mechanizmy ekstrakcji informacji.
3. Webscraping – metody pobierania danych ze stron internetowych, biblioteki do scrapowania, kwestie etyczne i prawne.
4. Architektura transformerów – omówienie budowy i działania modeli opartych na mechanizmie uwagi.
5. Generative Pretrained Transformer (GPT) – analiza modelu językowego, jego zastosowania i rozwój.
6. BERT i jego rola w przetwarzaniu danych tekstowych – zastosowania w NLP, struktura i działanie modelu.
7. Algorytmy rozpoznawania tekstu (Text Mining) – ekstrakcja informacji z dokumentów, analiza sentymentu, kategoryzacja tekstu.
8. Algorytmy indukcyjne: drzewa klasyfikacyjne – podstawy teorii drzew decyzyjnych, przykłady zastosowań.
9. Drzewa regresyjne – algorytmy regresyjne i analiza predykcyjna na podstawie danych.
10. Sztuczne sieci neuronowe – podstawy działania, struktura perceptronów i głębokiego uczenia.
11. Sieci Kohonena – samoorganizujące się mapy cech i ich zastosowania.
12. Maszyny wektorów nośnych (SVM) – klasyfikacja i regresja przy użyciu SVM, zastosowania w Big Data.
13. SVM – klasyfikacja – szczegółowe omówienie metod klasyfikacji.
14. SVM – regresja – zastosowanie maszyn wektorów nośnych w analizie predykcyjnej.
15. Podsumowanie – kluczowe wnioski, omówienie zastosowań poznanych metod w praktyce.
|
W cyklu 2025/26_Z:
1. Wprowadzenie do Big Data – historia i rozwój Big Data, definicja i kluczowe wyzwania, zastosowania w różnych branżach. |
Grupa przedmiotów ogólnouczenianych
Opis nakładu pracy studenta w ECTS
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza:
Zna podstawowe i zaawansowane pojęcia związane z Big Data oraz technikami pozyskiwania danych (webcrawling, webscraping).
Rozumie architekturę modeli transformerowych, w tym GPT i BERT, oraz ich zastosowania w analizie tekstu.
Zna główne algorytmy uczenia maszynowego stosowane w Big Data, takie jak drzewa decyzyjne, SVM i sieci neuronowe.
Umiejętności:
Potrafi pozyskiwać i wstępnie przetwarzać dane z Internetu z użyciem podstawowych technik ekstrakcji informacji.
Umie zastosować metody Text Mining oraz podstawowe narzędzia NLP do analizy tekstu.
Potrafi zbudować i ocenić proste modele klasyfikacyjne lub regresyjne na podstawie dostępnych danych.
Kompetencje społeczne:
Rozumie znaczenie etycznego i odpowiedzialnego pozyskiwania oraz przetwarzania danych.
Potrafi krytycznie oceniać wyniki analiz uzyskane za pomocą algorytmów AI.
Jest gotów do dalszego rozwijania wiedzy i umiejętności w obszarze Big Data i sztucznej inteligencji.
Kryteria oceniania
Podstawą zaliczenia kursu jest test z wiedzy nabytej podczas wykładu. Aby zaliczyć test, student musi udzielić 60% poprawnych odpowiedzi.
Literatura
Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Non-structured Text Data Application. Oxford: Elsevier.
Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier).
Szymańska, A. (2017a). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116.
Szymańska, A. (2017b). Wykorzystanie Analizy Skupień Metodą Data Mining Do Wykreślania Profili Osób Badanych. Studia Psychologiczne, 55, 26–42. https://doi.org/10.2478/V1067-010-0160-1
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: