Analityka danych w badaniach społecznych (I)-ćwiczenia WSE-BD-ADBS-(I)-ćw
Celem zajęć jest prezentacja podstawowych informacji dotyczących analizy danych w badaniach ilościowych w naukach społecznych: tak z perspektywy twórcy analiz, jak i z perspektywy odbiorcy. W ramach zajęć studenci poznają kolejne etapy analizy danych i związane z nimi problemy decyzyjne oraz trudności praktyczne: poznają logikę i język badań empirycznych, podstawowe koncepcje wnioskowania naukowego i komunikacji naukowej oraz ograniczenia związane z różnymi wyborami metodologicznymi, w tym najczęstsze nieprawidłowości w procesie analitycznym. W czasie zajęć przedstawione zostaną przykłady zastosowania metod ilościowych w badaniach eksploracyjno-przyczynowych w oparciu o dane dotyczące zjawisk społecznych.
Tematy:
1. Dane – czym są, jak je oceniać: reprezentatywność, wiarygodność, jakość. Źródła danych.
2. Zbieranie danych i tworzenie zbioru danych. Właściwy opis danych, format, struktura. Problem braków danych.
3. Pytania badawcze. Jak prawidłowo postawić problem badawczy – zagadnienia operacjonalizacji, doboru hipotezy zerowej, problem rzeczowników abstrakcyjnych.
4. Dobór metod. Korelacja a przyczynowość, kwestia grupy odniesienia. Problemy agregacji: utrata informacji, błąd ekologiczny, paradoks Simpsona.
5. Opracowywanie i czyszczenie danych: zagadnienie automatyzacji, problem replikowalności i reprodukowalności badań, kody walidacyjne, dobre praktyki. Problem braków danych i obserwacji odstających. Wyrażenia regularne.
6. Programy do analizy: porównanie, wady i zalety.
7. Wizualizacja danych: wykresy naukowe a infografiki, zasady dobrych wykresów. Rola wykresów w analizie danych.
8. Dobór wykresów, i ich odczytywanie.
9. Niepewność i jej źródła: losowość próby, błąd pomiaru, błąd próby. Idee statystyki bayesowskiej.
10. Modele i symulacje komputerowe: rola w analizie danych.
11. Dopasowywanie modeli do danych. Krytyka modeli i interpretowanie danych.
12. Analiza eksploracyjna i konfirmacyjna. Testowanie hipotez, wnioskowanie statystyczne. Problem wielokrotnych porównań, p-hacking i krytyka testów statystycznych.
13. Interpretacja wyników.
14. Raportowanie: zasady i dobre praktyki. Krytyka raportów analitycznych.
Dyscyplina naukowa, do której odnoszą się efekty uczenia się
Grupa przedmiotów ogólnouczenianych
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza
- Student zna rodzaje zbiorów danych, wie z jakimi ograniczeniami w zakresie możliwości ich analizy i interpretacji się wiążą.
- Student zna podstawowe metody eksploracji danych i wie z jakimi ograniczeniami się wiążą.
- Student wie, jakie są kryteria uczciwej i przekonującej analizy w badaniach ilościowych.
Umiejętności
- Student posiada umiejętność znalezienia lub stworzenia zbioru danych dostosowanych do jego problemu badawczego
- Student posiada umiejętność dostosowania problemu badawczego i metodologii do analizy konkretnego zbioru danych
- Student potrafi wskazać ograniczenia studiowanych analiz i odnieść się do nich krytycznie
- Student potrafi zaprezentować wyniki własnych analiz w postaci raportu
Postawy/kompetencje społeczne
- Student nabywa samodzielność w poszukiwaniu źródeł danych badawczych
- Student ma świadomość konieczności dostosowywania technik i metod do problemu
- Student jest otwarty na rozwój własnych kompetencji analitycznych
- Student krytycznie podchodzi do raportów z badań ilościowych
Kryteria oceniania
EW_01 – praca pisemna
EU_01-03 – wykonanie zadania praktycznego
50% praca pisemna wg kryteriów
50% prace domowe
Literatura
Aguinis, H., Hill, N. S., Bailey, J. R., (2021). Best Practices in Data Collection and Preparation: Recommendations for Reviewers, Editors, and Authors, Organizational Research Methods 24(4), 678-693, DOI: 10.1177/109442811983648
Gelman, A. (2004). Exploratory Data Analysis for Complex Models. Journal of Computational and Graphical Statistics, 13(4), 755-779. DOI: 10.1198/106186004X11435
Gelman, A. (2015). The Connection Between Varying Treatment Effects and the Crisis of Unreplicable Research: A Bayesian Perspective. Journal of Management 41(2), 632-643. DOI: 10.1177/0149206314525208
Gelman, A., Hill, J., Vehtari, A., (2021). Regression and Other Stories. Cambridge University Press.
Gelman, A., Loken, E., (2013). The garden of forking paths : Why multiple comparisons can be a problem , even when there is no “ fishing expedition ” or “ p-hacking ” and the research hypothesis was posited ahead of time. https://sites.stat.columbia.edu/gelman/research/unpublished/p_hacking.pdf
Gelman, A., Unwin, A., (2013). Infovis and Statistical Graphics: Different Goals, Different Looks. Journal of Computational and Graphical Statistics 22(1), 2-28. DOI: 10.1080/10618600.2012.761137
McElreath, R., (2020). Statistical Rethinking. A Bayesian Course with Examples in R and Stan. CRC Press.
Panek, T., (red) (2020). Statystyka społeczna. Procesy społeczne, źródła danych i metody analizy. Polskie Wydawnictwo Ekonomiczne.
Tong, Ch., (2019). Statistical Inference Enables Bad Science; Statistical Thinking Enables Good Science, The American Statistician, 73:sup1, 246-261, DOI: 10.1080/00031305.2018.1518264
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: