Was bietet mir der Workshop?
Dieser Workshop zeigt, wie Daten mit Datenanalyse, Visualisierung und Data Science systematisch ausgewertet werden.
Teilnehmer lernen, aus Rohdaten belastbare Erkenntnisse abzuleiten und Ergebnisse verständlich aufzubereiten.
Im Mittelpunkt stehen praxisnahe Methoden für explorative Datenanalyse, Data Mining, Clustering, Feature Engineering und Predictive Analytics.
Der Kurs eignet sich für alle, die Daten in Projekten, Produkten, Prozessen oder Geschäftsentscheidungen besser nutzen möchten.
Was lernen die Teilnehmer?
Nach dem Workshop können Teilnehmer Daten strukturiert untersuchen, visualisieren und für datenbasierte Entscheidungen nutzbar machen.
Sie lernen zentrale Methoden aus Datenanalyse, Visualisierung und Data Science kennen.
- Daten mit explorativer Datenanalyse untersuchen
- Muster, Trends und Zusammenhänge in Datensätzen erkennen
- Diagramme und Dashboards für Analyseergebnisse erstellen
- Clustering-Verfahren einordnen und anwenden
- Ausreißer und Anomalien in Daten identifizieren
- Merkmale mit Feature Engineering für Analysen vorbereiten
- Grundlagen von Klassifikation und Regression verstehen
- Modelle mit geeigneten Metriken bewerten
- CRISP-DM als Vorgehen für Data-Mining-Projekte einordnen
- Analyseergebnisse in Handlungsempfehlungen übersetzen
Für wen ist der Kurs geeignet?
Der Workshop richtet sich an Fachkräfte, die mit Daten arbeiten oder datenbasierte Entscheidungen vorbereiten.
Geeignet ist der Kurs unter anderem für Teilnehmer aus Controlling, Finanzen, Sales, Marketing, Business Development, IT und HR.
Der Kurs passt auch für Personen, die in Richtung Data Analyst, Datenanalyse oder Data Science weiterdenken.
Für die praktischen Übungen wird ein kostenfreier Kaggle-Account benötigt.
Erste Erfahrung in einem datengetriebenen Arbeitsumfeld und im Umgang mit Python ist empfehlenswert, aber nicht zwingend notwendig.
Was erhalten Teilnehmer?
- Teilnahmebescheinigung der TÜV NORD Akademie
- Deutschsprachige Schulung
- Deutschsprachige Seminarunterlagen
- Praxisnahe Übungen mit browserbasierten Tools
- Keine Installation im Vorfeld erforderlich
Warum dieser Workshop?
Datenanalyse und Visualisierung gehören zu den zentralen Kompetenzen für datengetriebene Arbeit.
Dieser Workshop vermittelt dafür einen strukturierten Einstieg mit Methoden aus Data Science, Data Mining und Predictive Analytics.
Teilnehmer lernen nicht nur einzelne Verfahren kennen, sondern auch den praktischen Ablauf von Analyseprojekten.
Mit CRISP-DM erhalten sie ein Vorgehensmodell, das bei der Planung und Umsetzung eigener Data-Mining-Projekte unterstützt.
Der Workshop schafft eine Grundlage für die Zusammenarbeit mit Data-Science-Teams und für den Einstieg in datenorientierte Rollen.
Agenda
- Explorative Datenanalyse (EDA): Visualisierungstechniken zur ersten Datenexploration und Mustererkennung
- Data Mining und Data Patterns: Einführung in Data-Mining-Konzepte und die Identifizierung relevanter Muster
- Unüberwachtes maschinelles Lernen:
- Clustering-Verfahren: Konzepte und Anwendung verschiedener Clustering-Techniken
- RFM-Analyse (optional, je nach Zielgruppe): detaillierte Betrachtung der RFM-Methode zur Kundensegmentierung
- Feature Engineering: Methoden zur Erstellung und Auswahl relevanter Merkmale für die Analyse
- Ausreißerbetrachtung/Anomalieerkennung: Identifikation und Umgang mit ungewöhnlichen Datenpunkten
- Predictive Analytics: Überblick über verschiedene Arten von Aufgaben (Klassifikation und Regression) und Konzept von Training und Testdaten
- Klassifikationsverfahren:
- Logistische Regression: Grundlagen und Anwendung zur binären und zur Multiklassen-Klassifikation
- Support Vector Machines (SVM): Prinzipien und Einsatzmöglichkeiten
- Entscheidungsbäume und Random Forests: Funktionsweise und Vorteile von Ensemble-Methoden
- Regressionsverfahren:
- Lineare Regression: Grundlagen und Interpretation der Ergebnisse
- Polynomiale Regression: Modellierung nicht-linearer Beziehungen
- Regression mit Regularisierung (Lasso, Ridge): Umgang mit Overfitting
- Modellauswertung:
- Metriken für Klassifikation: Genauigkeit, Präzision, Recall, F1-Score, ROC-Kurve
- Metriken für Regression: mittlerer quadratischer Fehler (MSE), R-Quadrat
- Kreuzvalidierung: robuste Schätzung der Modellperformance
- Datenvisualisierung: Erstellung aussagekräftiger Diagramme und Dashboards
- CRISP-DM (CRoss-Industry Standard Process for Data Mining): Überblick über den standardisierten Prozess für Data-Mining-Projekte
Hinweis: Der optionale Bezug zur RFM-Analyse kann je nach spezifischer Zielgruppe und Fokus des Webinars stärker oder schwächer betont werden.
