Weiterbildung Weiterbildung Weiterbildung

Kurs-ID: DIGI1002

Einführung in Data Science mit Schwerpunkt Machine Learning

Im Rahmen dieses Zwei-Tages-Workshops lernen die Teilnehmer grundlegende Techniken zur Datenanalyse mithilfe maschinellen Lernens. Ausgehend vom CRISP-DM-Modell lernen sie Werkzeuge kennen, um sich einen Überblick über eine große Menge an Daten zu verschaffen und Abhängigkeiten und Strukturen in den Daten zu erkennen.

Dabei werden Techniken zur Datenvorverarbeitung und zum Umgang mit Datenfehlern vermittelt.

Zentraler Bestandteil des Kurses ist es, ein Modell der Daten zu erstellen. Nach diesem Workshop verstehen die Teilnehmer verschiedene Techniken des Maschinellen Lernens und können diese anwenden, um zum Beispiel Klassifikationen, Vorhersagen oder Regressionen durchzuführen.

Die Teilnehmer können die Güte der erstellten Modelle validieren und können sie nutzen, um beispielsweise Anomalien oder Outlier oder Zusammenhänge und Ursachen zu erkennen.

Der Kurs setzt auf eine intensive Mischung aus Theorie und Praxis. Als Werkzeuge werden ScikitLearn und zahlreiche Code-Beispiele zum Einsatz kommen. Die Teilnehmerzahl ist auf sechs begrenzt.

Seminar-Kategorie:

Digitalisierung

Schulungsdauer:

16 Stunden in 2  Tagen

Teilnahmegebühr:

1.695,00 € zzgl. 19% MwSt.
2.017,05 € inkl. 19% MwSt.

Weiterbildung

Seminarinhalt

Einstieg in Data-Mining

  • CRISP-DM
Data Understanding und Data Preparation
  • Erster Überblick über die Daten
  • Datengruppierung und Clustering (z.B. k-Means)
  • Abhängigkeiten erkennen (z.B. Korrelationsanalyse)
  • Komplexitätsreduktion und Dimensionsreduktion (z.B. PCA)
Modelling und Machine Learning
  • Klassifikation und Regression
  • Umgang mit Fehlerbehafteten Daten (z.B. Bootstrapping, RANSAC)
  • Überwachte Lernverfahren des maschinellen Lernens (z.B. Nearest Neighbor, Bayes Learning, Gauss-Modelle, Kernel-SVM, Entscheidungsbäume, Random Forests)
Grundlagen der Neuronalen Netze
  • Assoziationsanalyse (z.B. Warenkorbanalyse)
  • Evaluation und Ergebnisvisualisierung
  • Validierungsstrategien, Gridsearch, Kreuzvalidierung
  • Outliererkennung (statistisch, ν-SVM)
  • Signifikanzanalysen (z.B. Stundent t-Test)
  • Datenvisualisierung

Zielgruppe

  • Entwickler, Programmierer

Voraussetzungen

  • Grundsätzliches Programmierverständnis, Python-Kenntnisse sind hilfreich aber nicht notwendig, Machine-Learning-Kenntnisse werden nicht benötigt

Termine

Was können wir für Sie tun?

Wir freuen uns auf Ihre Nachricht.

Seminar-Korb