Ein umfassendes Datenwissenschaftsprojekt unter Verwendung sozioökonomischer Daten (Bildung, Einkommen, Arbeitslosigkeit, Kriminalitätsrate) aus der gesamten Türkei.
Projektablauf und Techniken:
Datenmanipulation: Bereinigung und Aufbereitung der Rohdaten für die Analyse mit den Bibliotheken Pandas und NumPy.
"Korrelationsanalyse: Visualisierung der Beziehungen zwischen Variablen (z. B. Zusammenhang zwischen Bildungsniveau und Einkommen) mithilfe einer Heatmap (Wärmekarte).
Regression und Prognose: Vorhersage der Durchschnittswerte und Trends für die kommenden Jahre (Forecasting) anhand von Machine-Learning-Algorithmen (Regression) auf der Grundlage historischer Daten.
Mit dieser Arbeit wurden verborgene Muster in den Daten aufgedeckt und auf statistische Signifikanz getestet.