Analityka danych w badaniach społecznych (I)-wykład WSE-BD-ADBS-(I)-w
[Zakres/przedmiot wykładu, typu interaktywnego:] Analityka Danych w Badaniach Społecznych / Analityka Danych Społecznych (ADS) /Social Data Analytics :: to intensywnie rozwijający się, wg nowej perspektywńy metodologicznej, rodzaj badań w stosowanych naukach społecznych – Socjologia Cyfrowa/Digital Sociology /Computational Sociology, Ekonomia Cyfrowa/Digital Economics, inne cyfrowe nauki społeczne (politologia, nauki behawioralne, geografia społeczna) – bazujący na wykorzystaniu informacji cyfrowej za pomocą odpowiednich technik informatycznych, algorytmów i metod obliczeniowych, pozwalający na lepsze rozumienie, objaśnianie i przewidywanie zjawisk i procesów społecznych.
Konsekwencją integracji nowych pojęć oraz narzędzi badawczych statystyki, informatyki i dyscyplin naukowych (społecznych) w ramach powstałego w ten sposób podejścia badawczego – nazywanego też Data Science – jest wspomaganie procesów poznawczych i praktycznych.
W tym podejmowania decyzji (data-/evidence-/information-based decision), w różnych obszarach zastosowań nauk społecznych (systemach, instytucjach, itp.).
STRUKTURA TEMATYCZNA PRZEDMIOTU / WYKŁADU
I. Preliminaria pojęciowo-metodologiczne: „analityka” vs. „analiza” danych społecznych – taksonomia pytań, problemów badawczych i badań , w tym wielo-dyscyplinarnych – paradygmatyczne wersje ’analityki społecznej’ / analityki danych społecznych (ADS). ,
II. Źródła i rodzaje danych / informacji cyfrowej: Big Data , Data Science , internet data , , GeoSpatial (Big) Data , Text Data (Dane Jęz. Naturalnego/DJN) , dane administracyjne., , – kryteria kategoryzacji danych (wg form i źródeł, np. text, video, tweets, space, networks, streaming, etc.) - zasady konstruowania analitycznych wieloźródłowych baz danych, , , w tym modele integracji danych , oraz zabezpieczenia systemów danych (łaczonych) - dane jakosciowe w analityce społecznej - strategie badań ’mieszanych’ (ilościowych i jakościowych) , w ramach ADS .
III. Wybrane metody i podejścia analityki społecznej – merytoryczne i formalne (teorio-pomiarowe i in.) przesłanki zastosowań konkretnych procedur badawczych – (social) Big Data w:
- socjologii , ; socjologii analitycznej; socjologii cyfrowej
- analizach socjoekonomicznych - badaniach nierówności , ;
- politologii - zachowania wyborcze
- psychologii (społecznej)
- ekonomii , polityce publicznej
- biznesie (e-commerce) zarządzaniu
- planowanie przestrzenne/urban science
IV. Modele analityczne i moduły obliczeniowe - wstępna specyfikacja ’zapotrzebowania informatycznego’ – metodologiczne przesłanki/wyznaczniki wyboru algorytmów i programów analitycznych – przykładowe ujęcia:
• pozyskiwanie danych (cyfrowych): APPS, Sensors, Wearables
• Analiza Sieciowa/Network Analysis - identyfikacja cyber-społeczności ; analiza zależności przyczynowych - społeczności internetowe (OSN/Online Social Network) a produktywność nauokwa
• procesowaniu ‘danych’ języka naturalnego/Natural Language Processing (NLP): Analiza Treści /Content Analysis – Machine Learning & Artificial Inteligence/AI
V. Zastosowań analityki społecznej /ADS w multi-dyscyplinarnych badaniach społecznych - przykłady wybranych badań w socjologii, ekonomii, politologii, analizach socjo-ekonomicznych i innych (dyscyplinach pokrewnych):
• badania Trzeciego Sektora/Nonprofit sector
• nierówności cyfrowe / gender gaps ,
• nierówności przestrzenne rozwoju i dobrobytu lokalnego
• determinanty dobrostanu subiektywnego
• nierówności w zakresie zdrowia .
VI. Przegląd ’dobrych praktyk’ w realizacji procesów analityki społecznej / ADS – przesłanki wyboru i rekomendacji.
VII. Kwestie jakości badań w ramach analityki społecznej / ADS – ewaluacja badania, w tym oszacowanie efektów poznawczych i decyzyjnych – zabezpiecznie prywatności .
Dyscyplina naukowa, do której odnoszą się efekty uczenia się
E-Learning
W cyklu 2023/24_Z: E-Learning | W cyklu 2024/25_Z: E-Learning (pełny kurs) |
Grupa przedmiotów ogólnouczenianych
Poziom przedmiotu
Symbol/Symbole kierunkowe efektów uczenia się
Typ przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Efekty kształcenia
Umiejętności nabyte przez uczestnika wykładów pozwolą na formułowanie i operacjonalizację problemów w terminach nowej metodologii (’analityki społecznej’) odwołującej się do rozmaitych źródeł wielkich zbiorów danych (typu Big Data, dane wielko-skalowe/large-scale data, ‘dane masowe’, dane internetowe, dane tekstowe i obrazowe, i inne) w postaci informacji cyfrowych generowanych dla różnych (najczęściej poza-badawczych i poza-statystycznych) celów związanych z funkcjonowaniem rozmaitych systemów - instytucjonalnych, biznesowych/komercyjnych, społecznościowych, komunikacyjnych, itp. Wprawdzie orientacyjno-przeglądowy charakter wykładu koncentrującego się na najważniejszych elementach analityki społecznej stanowi, w założeniu, jedynie ‘drogowskaz’ dla nastawionych na rozwijanie umiejętności technicznych innych zajęć, typu warsztatowego, tym niemniej ma dostarczyć konkretnych umiejętności metodologiczno-praktycznych (methodology at work), niezbędnych dla samodzielnego projektowania i racjonalnego wyboru strategii postępowania w ramach ADS / analityki społecznej.
Kryteria oceniania
Zaliczenie przedmiotu - egzamin pisemny
• Ocena na podstawie pracy pisemnej / eseju nt. zagadnienia wybranego przez słuchacza spośród omawianych na wykładzie ………………….…………. 80 %
• Prezentacja draftu ‘eseju’ (10-15min., na wykładzie) ……………………… 20 %
Literatura
LITERATURA [pozycje wybrane]
* Hill, C.A., Biemer, P. P., Buskirk, T.D.,Japec, L., Kirchner, A., Kolenikov, S., Lyberg, L. E., (red.), (2020) Big Data Meets Survey Science: A Collection of Innovative Methods. Wiley.
* Bertoni i in. (red.) Handbook of Computational Social Science for Policy, Volume 1, Theory, Case Studies and Ethics Routledge
Breiman, L., (2001) Statistical Modeling: The Two Cultures, Statistical Science, Vol. 16, No. 3, 199–231
Creswell, W., Creswell. J. D., (2021). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches. Sixth Edition. SAGE.
* Engel, U., Quan-Haase, A., Liu, S., Lyberg, L., (red.) Handbook of Computational Social Science, Theory, Case Studies and Ethics. Taylor and Francis.
Eurostat. 2018. Digital Economy and Society: ICT Usage in Households and by Individuals. http://ec.europa.eu/eurostat/web/digital-economy-and-society/data/database
Fu X., Luo J-D., Boos, M., (red) Social Network Analysis. Interdisciplinary Approaches and Case Studies. Taylor & Francis.
* Gërxhani, K., de Graaf, N. D., Raub W., (red.) (2022) Handbook of Sociological Science Contributions to Rigorous Sociology. Edward Elgar.
Kalton, G., (2023). Probability vs. Nonprobability Sampling. Statistics in Transition new series, Vol. 24 (3) sit@stat.gov.pl
Khanna, A., i in., (red) Applications of Big Data in Healthcare. Theory and Practice. Elsevier Inc.
McLevey, J., Scott, J., Carrington, P. J., (red), (2023) The SAGE Handbook of Social Network Analysis. SAGE Publications.
NAS/ National Academy of Science (2014) Training Students to Extract Value from Big Data: Summary of a Workshop. Home | National Academies
Okrasa, W., (2020). Sociological Aspects of the Statistical Research Process: Towards a Sociology of Public Statistics. Polish Sociological Review: 1231 – 1413.
*Skopek, J., (red.), (2023) Research Handbook on Digital Sociology. Edward Elgar Publishing,
World Social Science Report 2016: Challenging Inequalities; Pathways to a Just World . https://www.google.com/books/edition/World_social_science_report_2016/CWkgDQAAQBAJ?hl=en&gbpv=1&dq=The+use+of+Big+Data+World+social+science+report+20
Literatura do szczegółowych tematów I problemów włączonych do wykładu -- przyporządkowanie wybranych pozycji do danego tematu bedzie podane w trakcie wykłądu, w trybie przypisów koncowych. :
NAS/ National Academy of Science (2014) Training Students to Extract Value from Big Data: Summary of a Workshop. Home | National Academies. * Xuming He I in., 2019. Statistics At A Crossroads: Who Is For The Challenge? Raport for The National Science Fundation. * Breiman, L., (2001) Statistical Modeling: The Two Cultures, Statistical Science, Vol. 16, (3): 199–231
G. Kalton, (2023). Probability vs. Nonprobability Sampling. Statistics in Transition new series, Vol. 24 (3) sit@stat.gov.pl
W. Okrasa, (2020). Sociological Aspects of the Statistical Research Process: Towards a Sociology of Public Statistics. Polish Sociological Review: 1231 – 1413.
R. K. Merton, J. S. Coleman, P. H. Rossi (red.), (1979). Qualitative and Quantitative Social Research: Papers in Honor of Paul F. Lazarsfeld. The Free Press. N. Y.
D. Karamshuk, M. Pupavac, F. Shaw, J. Brownlie, V. Pupavac, N. Sastry (2017) Towards Transdisciplinary Collaboration between Computer and Social Scientists: Initial Experiences and Reflections [w:] X. Fu, J-D. Luo, M. Boos (red) Social Network Analysis. Interdisciplinary Approaches and Case Studies. Taylor & Francis.
B. F. Jarvis, M. Keuschnigg, P. Hedström. (2021). Analytical Sociology Amidst a Computational Social Science Revolution, [w:] U. Engel, A. Quan-Haase, S.Liu, L. E Lyberg (red.) Handbook of Computational Social Science, Volume 1. Theory, Case Studies and Ethics. Taylor and Francis. https://doi.org/10.4324/9781003024583
J. Skopek (red.), (2023) Research Handbook on Digital Sociology. Edward Elgar Publishing, https://books.google.pl/books?id=MD60EAAAQBAJ&pg=PR5&dq=editions:ISBN178990675X&source=gbs_selected_pages&cad=2#v=onepage&q&f=false
D. Lazer, J. Radford (2017) Data ex Machina: Introduction to Big Data, Annual Review of Sociology. Vol. 43:19-39 https://www.annualreviews.org/doi/10.1146/annurev-soc-060116-053457
D. Kim (2021) D. Kim (2021) Transitioning from Social Science to Data Science. What You Know and What You Should Know. Towards Data Science. https://towardsdatascience.com/transitioning-from-social-science-to-data-science-7e22501b5a3b
J. Jünger (2021) A Brief History of APIS Limitations and Opportunities for Online Research [w:] U. Engel, A. Quan-Haase, S. Xun Liu, L. Lyberg (red). Handbook of Computational Social Science, Volume 2. Data Science, Statistical Modelling, and Machine Learning Methods. https://www.taylorfrancis.com/chapters/edit/10.4324/9781003025245-24/
O. Frank (2023) Survey Sampling in Network. [w:] J. McLevey, J. Scott, P. J. Carrington (red), The SAGE Handbook of Social Network Analysis. SAGE Publications.
A. Leszczyński, J. Crampton (2016). Spatial Big Data and Everyday Life. Big Data & Society: 1–6
G. Wiedemann, C. Fedtke (2021) From Frequency Counts to Contextualized Word Embeddings. The Saussurean turn in Automatic Content Analysis, [w:] U. Engel, A. Quan-Haase, S. Xun Liu, L. Lyberg (red). Handbook of Computational Social Science, Volume 2. Data Science, Statistical Modelling, and Machine Learning Methods. https://www.taylorfrancis.com/chapters/edit/10.4324/9781003025245-24/
M. Favaretto I in., (2020) What is your definition of Big Data? Researchers’ understanding of the phenomenon of the decade. Institute for Biomedical Ethics, University of Basel, Basel, Switzerland
R. Burrows, M. Savage (2014) After the crisis? Big Data and the methodological challenges of empirical sociology. Big Data & Society April–June: 1–6 ! DOI: 10.1177/205395171454028
P. K. Dutta Praman (2021) Big Data Classification: Techniques and Tools [w:] A. Khanna i in., (red) Applications of Big Data in Healthcare. Theory and Practice. Elsevier Inc. https://www.sciencedirect.com/book/9780128202036/applications-of-big-data-in-healthcare
M. D’Orazio (2015) Integration and Imputation of Survey Data in the StatMatch Package. 3rd International Conference New Challenges for Statistical Software - The Use of R in Official Statistics Bucharest (23-24 April 2015). https://r-project.ro/conference2015/papers/c2015_4.pdf
G. Herschel, R. Ramakrishnan i in., (2023). Top Trends in Data and Analytics, 2013. https://www.gartner.com/doc/reprints?id=1-2D5XJT8I&ct=230407&st=sb.
P. Lahiri. (2020) Statistical Data Integration. Statistics in Transition new series, Special Issue. (August 2020). sit@stat.gov.pl
S. D. Karanam, I in., (2021) Big Data Integration Solutions in Organizations: A Domain-Specific Analysis https://www.researchgate.net/publication/349169978_Big_Data_Integration_Solutions_in_Organizations_A_Domain-Specific_Analysis
B. Hollstein (2023) Qualitative Approaches [w:] . McLevey, J. Scott, P. J. Carrington (red), The SAGE Handbook of Social Network Analysis. SAGE Publications, Limited
J. W. Creswell, J. D. Creswell. (2021). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches. Sixth Edition. SAGE.
Eurostat. 2018. Digital Economy and Society: ICT Usage in Households and by Individuals. http://ec.europa.eu/eurostat/web/digital-economy-and-society/data/database
H. Robertson, J. Travaglia (2017) Big Data Sociology: Preparing for the Brave New World. The Sociological Review. https://www.researchgate.net/publication/320704372_Big_Data_Sociology_Preparing_for_the_Brave_New_World_Blog
W. Przepiorka (2023) Testing sociological theories with digital trace data from online markets.[w:] J. Skopek (red.) Research Handbook on Digital Sociology, op cit.
A. Flache, M. Mäs, M. A. Keijzer (2022) Computational Approaches in Rigorous Sociology: Agent-Based Computational Modeling and Computational Social Science [w:] K. Gërxhani, N. D. de Graaf, W. Raub (red.) Handbook of Sociological Science Contributions to Rigorous Sociology. Edward Elgar. https://creativecommons.org/licenses/by-nc-nd/4.0/
Z. Sun, Z. Wu (2022) A Strategic Perspective on Big Data Driven Socioeconomic Development. ACM Digital Library. https://dl.acm.org/doi/abs/10.1145/3505745.3505751
ISCC/International Social Science Council i in., (2016) The Use of Big Data in the Analysis of Inequality: World social science report 2016: Challenging inequalities; pathways to a just world . https://www.google.com/books/edition/World_social_science_report_2016/CWkgDQAAQBAJ?hl=en&gbpv=1&dq=The+use+of+Big+Data+World+social+science+report+2016:+Challenging+inequalities%3B+pathways+to+a+just+world&pg=PA286&printsec=frontcover
Rising Economic and Gender Inequakity.: intersecting sphere of injustice. The Use of Big Data in the Analysis of Inequality: World social science report 2016 – op cit.
A. Tucke (2021) Computational Social Science for Policy and Quality of Democracy: Public Opinion, Hate Speech, Misinformation, and Foreign Influence Campaigns [w:] Bertoni i in. (red.) Handbook of Computational Social Science for Policy, Volume 1, Theory, Case Studies and Ethics Routledge https://www.routledgehandbooks.com/doi/10.4324/9781003024583-
Jungherr (2923) Digital campaigning: How digital media change the work of parties and campaign organizations and impact elections [w:] J Skopek (red.) op cit.
M. W.-L. Cheung, S. Jak (2016) Analyzing Big Data in Psychology: A Split/Analyze/Meta-Analyze Approach. Front. Psychol., Sec. Quantitative Psychology and Measurement Volume 7. https://doi.org/10.3389/fpsyg.2016.00738
E. Rettore, U. Trivellat (2019) The Use of Administrative Data to Evaluate the Impact of Active Labor Market Policies: The Case of the ItalianListe di Mobilità [w:] N. Crato , P. Paruolo (red) Data-Driven Policy Impact Evaluation How Access to Microdata is Transforming Policy Design. Springer.
P. S. Martins (2019) Public Policy, Big Data, and Counterfactual Evaluation: An Illustration from an Employment Activation Programme [w:] N. Crato , P. Paruolo (red) Data-Driven Policy Impact Evaluation How Access to Microdata is Transforming Policy Design. Springer.
S. F. Wamba, S. Akter (red), (2023) Handbook of Big Data Research Methods. Edward Elgar
MIT Sloan Office of Media Relations (2023) How companies and organizations can gain an analytics edge in 2023 and beyond https://mitsloan.mit.edu/press/media-highlights
A. Kharrazi I in (2016) Urban Big Data and Sustainable Development Goals: Challenges and Opportunities. Sustainability 2016: 8 (1293); doi:10.3390/su8121293 www.mdpi.com/journal/sustainabil
F. Kreuter, F. Keusch(2020) Data Collection with Apps, Sensors, and Wearables. AAPOR Webinar (November 14, 2019)
J. McLevey, J. Scott, P. J. Carrington (red), (2023) The SAGE Handbook of Social Network Analysis. SAGE Publications, Limited
A. Gruzd, C. Haythornthwaite (2023) Networking Online: Cybercommunities [w:] J. McLevey I in., (red) – op cit.
P. Doreian (2001) Causality in Social Network Analysis Sociological Methods & Research 30(1):81-114
E. M. Sánchez-Teba & in., (2021) Social Networks and Open Innovation: Business Academic Productivity. Journal of Open Innovation: Technology, Market, and Complexity: 7 (158) https://doi.org/10.3390/joitmc7020158
G. Wiedemann, C. Fedtke (2021) From Frequency Counts to Contextualized Word Embeddings. The Saussurean turn in Automatic Content Analysis, [w:] U. Engel, A. Quan-Haase, S. Xun-Liu, L. Lyberg (red). Handbook of Computational Social Science, Volume 2. Data Science, Statistical Modelling, and Machine Learning Methods. https://www.taylorfrancis.com/chapters/edit/10.4324/9781003025245-24/
IBM Newsletter (2023) What is natural language processing? https://www.ibm.com/topics/natural-language-processing
J. Ma (2023) Computational Social Science for Nonprofit Studies: Developing a Toolbox and Knowledge Base for the Field. ISTR Voluntas. Research Papers. Voluntas https://doi.org/10.1007/s11266-021-00414-x
G. Passaretta, Carlos J. Gil-Hernández (2023)The early roots of the digital divide: socioeconomic inequality in childrens ICT literacy from primary to secondary schooling. DOI:10.4337/9781789906769.00026
UNICEF i in., (2020 Using big data for insights into the gender digital divide for girls: A Discussion Paper UNICEF: Gender and Innovation. Evidence briefs - Insights into the gender digital divide for girls. https://www.sociology.ox.ac.uk/article/using-big-data-to-measure-digital-inequalities
W. Okrasa (2016) Przestrzenne aspekty nierówności społecznych: sprawiedliwość przestrzenna a zróżnicowanie dobrostanu lokalnego – ewaluacja wpływu środków rozwojowych Uniwersytecie Czasopismo Socjologiczne, 15(2).
J. Klingelhoefer, A. Meier (2023) Social media and well-being at work, at home, and in-between: A review [in:] J. Skopek (red.), op cit.
C. Delpierre, M. Kelly-Irving (2018) Big Data and the Study of Social Inequalities in Health: Expectations and Issues Front. Public Health, (October 2018):Vol.6. https://doi.org/10.3389/fpubh.2018.00312
NAS/ National Academy of Science (2014) Training Students to Extract Value from Big Data- op. cit. [1]
M. F. Goodchild (2013) The quality of big (geo) data. Dialogues in Human Geography 3: 280–284.
H. Tao, M. Zakirul, A.Bhuiyan (2019) Economic perspective analysis of protecting big data security and privacy. https://www.semanticscholar.org/paper/Economic-perspective-analysis-of-protecting-big-and-Tao-Bhuiyan/9de4028b8e63a9ab7b7dd13ec4114c04a282a7f5
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: