Conducted in
terms:
2023/24_L, 2024/25_L, 2025/26_L
ECTS credits:
unknown
Language:
Polish
Organized by:
Faculty of Law and Administration
Related to study programmes:
Statistical Analysis with IBM support SPSS WP-CWC-N-1-ASzw
This course has not yet been described...
|
Term 2025/26_L:
None |
(in Polish) E-Learning
Term 2022/23_L: (in Polish) E-Learning (pełny kurs) z podziałem na grupy | Term 2025/26_L: (in Polish) E-Learning (pełny kurs) z podziałem na grupy | Term 2024/25_L: (in Polish) E-Learning (pełny kurs) z podziałem na grupy | Term 2021/22_L: (in Polish) E-Learning (pełny kurs) z podziałem na grupy | Term 2023/24_L: (in Polish) E-Learning (pełny kurs) z podziałem na grupy | Term 2019/20_L: (in Polish) E-Learning z podziałem na grupy |
(in Polish) Grupa przedmiotów ogólnouczenianych
(in Polish) nie dotyczy
(in Polish) Opis nakładu pracy studenta w ECTS
(in Polish) Student zna zasady i metodologię przeprowadzania analiz.
Student potrafi posługiwać się narzędziami informatycznymi.
Student potrafi wykorzystywać określone metody i narzędzia do dokonywania analiz/badań socjologicznych/innych badań.
Student umie administrować bazami danych.
Punkty ECTS: 1
Udział w ćwiczeniach 15 godz.
1. Oprogramowanie do analiz z graficznym interfejsem użytkownika umożliwiającym wgląd w poszczególne etapy procesu przetwarzania i analizy danych
2. Oprogramowanie ma możliwość układania w ciągi przetwarzania poszczególnych etapów składających się na proces analizy danych (przy pomocy tzw. węzłów) poczynając od wstępnego przetworzenia danych wejściowych, poprzez odpowiednie przekształcenia i transformacje prowadzące do uzyskania właściwej postaci danych analitycznych, odpowiednich dla technik data mining, aż do utworzenia wyjściowych danych możliwych do zapisania w zewnętrznych systemach bazodanowych z zastrzeżeniem, że interfejs nie powinien wprowadzać ograniczeń, w którym miejscu nowego procesu analitycznego mogą być dodawane węzły związane z dodawaniem, wczytywaniem czy przekształcaniem danych
3. Oprogramowanie analityczne umożliwia dokumentowanie i śledzenie pełnego procesu analitycznego od pobrania danych ze źródeł do zapisu scoringu do bazy danych poprzez dodawanie własnych opisów i komentarzy do poszczególnych poleceń reprezentowanych w interfejsie graficznym poprzez węzły
4. Oprogramowanie zapewnia gromadzenie, przechowywanie oraz udostępnianie treści analitycznej oraz procedur
5. Oprogramowanie umożliwia zarządzanie procesem automatycznego wykonywania zadań analitycznych
6. Możliwość importu i eksportu danych z plików tekstowych (.txt, .csv), plików MS Excel, plików danych IBM SPSS Statistics, SAS. Dostęp do danych przechowywanych w systemach bazodanowych Oracle, DB2, MS SQL Server, Teradata w celu pobierania i zapisywania informacji bezpośrednio do bazy danych
7. Możliwość dostępu do wielu formatów danych jednocześnie, w ramach jednego procesu analitycznego
8. Zapewniony bezpośredni dostęp do systemów bazodanowych bez konieczności tworzenia etapu pośredniego w postaci ekstraktu danych lub zapisu danych w własnym formacie narzędzia analitycznego
9. Współpraca z repozytoriami Big Data
10. Możliwość oceny jakości danych m.in. pod względem występujących braków danych, wypełnienia zmiennych ważnymi wartościami, analizy przypadków odstających
11. Możliwość zastępowania braków danych różnymi metodami (losowo, stałą, ze względu na zadane kryterium warunkowe, przy pomocy technik analitycznych)
12. Możliwość wykonywania operacji na danych numerycznych i tekstowych
13. Możliwość losowania rekordów, w tym losowania warstwowego, zespolonego
14. Wyliczanie nowych zmiennych na podstawie funkcji arytmetycznych, matematycznych, warunkowych, daty i czasu oraz przy użyciu funkcji odpowiednich dla zmiennych tekstowych
15. Możliwość przekształcania zmiennych o wielu kategoriach do postaci binarnej, transpozycja zmiennych (zamiana wierszy na kolumny)
16. Agregacja zmiennych
17. Rekodowanie kategorii zmiennych
18. Kategoryzacja zmiennych ilościowych, w tym możliwość kategoryzacji z wykorzystaniem zmiennej przewidywanej w celu optymalizacji sposobu kategoryzacji zmiennej ilościowej
19. Możliwość łączenia zbiorów danych tak pod względem dodawania nowych zmiennych, jak i dodawania nowych rekordów
20. Dostępność algorytmów automatycznie przekształcających dane do celów analitycznych pozwalających na przyspieszenie pracy na etapie przygotowania danych. Dzięki temu mamy możliwość zrealizowania takich celów jak: budowę odpowiedniego zbioru danych, uporządkowania danych pod kątem wymagań stawianych przez konkretne algorytmy lub narzędzia czy zwiększenie skuteczności predykcji dokonywanej przez algorytmy.
21. Możliwość wykonywania przekształceń sekwencyjnych (wynik jednego przekształcenia może być wsadem do kolejnych przekształceń) na każdym etapie wykonywania analizy
22. Możliwość swobodnego kopiowania sekwencji przekształceń i wykorzystywania w innych miejscach danej analizy lub w innych analizach.
a. Techniki wyszukiwania wielowymiarowych obserwacji odstających.
b. Techniki redukcji opisu (analiza czynnikowa, składowych głównych).
c. Technika symulacji Monte Carlo
23. Dostępność dla drzew decyzyjnych metod zwiększający dokładność i stabilność modeli (przynajmniej boosting, bagging).
24. Możliwość eksploracji danych poprzez generowanie statystyk opisowych, korelacji pomiędzy zmiennych oraz wizualizacji danych przy pomocy wykresów i tabel.
25. Możliwość wizualizacji proporcjonalnej ważności predyktorów na wartość zmiennej przewidywanej.
Subject level
elementary
Learning outcome code/codes
CwC1_W07
CwC1_U03
CwC1_U07
CwC1_U09
Type of subject
obligatory
Course coordinators
Bibliography
|
Term 2025/26_L:
None |
Additional information
Information on level of this course, year of study and semester when the course unit is delivered, types and amount of class hours - can be found in course structure diagrams of apropriate study programmes. This course is related to the following study programmes:
Additional information (registration calendar, class conductors, localization and schedules of classes), might be available in the USOSweb system: