Alle Seminare

Kurs-ID: EKI_20086

Kurs Data Scientist Fortbildung - Bootcamp in Python

Intensive Weiterbildung in Data Science mit Python und Machine Learning mit pandas & scikit-learn

Dieses einwöchige Data Science Bootcamp fängt bei den notwendigen Grundlagen von Python für die Datenanalyse (data analytics) an und es werden alle Voraussetzungen unterrichtet, um am Ende Machine Learning Algorithmen mit scikit-learn zu programmieren. In diesem Intensivseminar lernen Sie die Grundlagen eines Data Scientist.

Bei den Algorithmen wird das notwendige theoretische Verständnis geschult. Das Ziel liegt auf der praktischen Umsetzung der Datenanalyse und Algorithmen in Python. Am Ende des data scientist Seminars können Sie selbstständig erste Datenanalysen umsetzen, Machine Learning Algorithmen einsetzen und deren Ergebnisse interpretieren.

Das Paket pandas ist ein Schwerpunkt, da dieses Paket Anwendung findet im Data Science, Data Engineering und Data Mining. Die wichtigsten Schritte für die Datenaufbereitung werden eingeübt. Zur Erstellung von Plots und Grafiken wird das Paket seaborn verwendet mit einer kurzen Einführung in matplotlib. Matplotlib überzeugt durch die Fülle an Möglichkeiten einen Plot anzupassen, seaborn durch die Einfachheit auch komplexere Plots mit wenig Code zu erstellen. Es werden die Grundlagen in numpy gelehrt, um dieses wichtige Paket im Data Mining einsetzen zu können.

Nach den Grundlagen für Python (Datenstrukturen, eigene Funktionen schreiben) und der Erläuterung von pandas für die Auswertung von Daten, erfolgt der nächste Schritt zum Data Scientist in der Weiterbildung: Machine Learning Algorithmen werden erläutert und wir coden diese selbst in Python mit dem Paket scikit-learn. Hierbei wird eine Auwahl der bekanntesten Algorithmen erklärt (Lineare und logistische Regression, Entscheidungsbaum, Random Forest, SVM, Ensemble Learning, AdaBoost, K-Means, DBSCAN Clustering).

Ein wichtiger Bestandteil des data scientist Kurs ist das eigenständige Arbeiten und Lösen von Übungsaufgaben, so dass Sie mit Hilfe des Trainers das Besprochene direkt in der Praxis umsetzen und in Python programmieren können.

Die Schulung ist auch geeignet um im Bildungsurlaub Python zu erlernen.

Was lernen Sie in der Fortbildung Data Science?

Sie erhalten einen Überblick über die im Data Science, Data Mining, Machine Learning und Deep Learning populäre Programmiersprache Python. Wir verwenden die Anaconda Distribution (nach eigenen Angaben “The World’s most popular data science platform“) und als Entwicklungsumgebung/IDE wird spyder verwendet.

Nach dieser einwöchigen Weiterbildung zum data scientist, welche die Grundlagen von Data Engineering und Data Mining beinhaltet, können Sie Daten aus verschiedenen Formaten und von Datenbanken (mit den Paketen SQLAlchemy und pandas) einlesen, Daten mit seaborn / matplotlib plotten bzw. Daten mit pandas bereinigen (fehlende Werte ersetzen, Zeilen und Spalten anpassen, neue Spalten erzeugen) und Berechnungen mit numpy durchführen.Sie kennen die wichtigsten Datentypen in Python, können eigene einfache Funktionen schreiben und kennen die Umsetzung von Control Flows (For-Schleife, If-Else). Nach Absolvierung des Data Scientist Kurs verstehen Sie das Grundkonzept eines pandas DataFrames und können damit Data Wrangling und Data Cleaning durchführen. Die Vorverarbeitung von Daten (data preprocessing) für die Umsetzung von Algorithmen mit scikit-learn wird angesprochen.

Die Einteilung von Machine Learning in supervised-unsupervised (überwachtes-unüberwachtes Lernen) und Reinforcement Learning ist Ihnen bekannt und Sie können mit scikit-learn eigenständig Algorithmen in Python trainieren, validieren, einen Train-Test Datensplit durchführen und Gütekriterien zur Beurteilung eines Algorithmus berechnen und interpretieren.Sie wissen, was Overfitting (Überanpassung) bedeutet, wie dies nach dem Training eines Algorithmus identifiziert werden kann und welche Anpassungen es bei einzelnen Algorithmen gibt, um Overfitting zu verringern.

Ein großer Schwerpunkt im Kurs liegt auf der Weiterbildung im Machine Learning, wofür scikit-learn benutzt wird.  Die Umsetzung und das intuitive Verständnis der bekannten Algorithmen des Maschinellen Lernens ist im Fokus. Die Fortbildung umfasst Algorithmen für die Regression (Lineare Regression, Random Forest, Neural Network, Decision Tree), für die Klassifikation (Logistische Regression, Enscheidungsbaum, Random Forest, AdaBoost, K-Nearest Neighbor) und dem Clustering (K-Means, DBSCAN). Desweiteren wird das Erstellen eines Ensembles erläutert und die Konzepte von Grid-Search zur automatischen Optimierung von Hyperparametern und die Umsetzung einer Kreuzvalidierung (Cross-Validation) an Stelle eines klassischen Train-Test-Datensplits.

Am Ende der fünftägigen Data Science Weiterbildung ist die Einstiegshürde für die Benutzung von Python für Machine Learning, Data Science, Data Mining, Business Intelligence bzw. Data Analytics genommen und erweiterte Grundlagen in scikit-learn gelernt, so dass Sie eigenständig Ihr Wissen nach dem Seminar Stück für Stück erweitern können. Der Schwerpunkt während des Seminars liegt auf der selbstständigen Umsetzung auf Ihrem Laptop mit aktiver Unterstützung des Dozenten, so dass sie viel Praxiswissen als angehender Data Scientist lernen können.

Termin buchen

Seminarinhalte

  • Wichtige Datenstrukturen
  • pandas Data.Frame
  • Statistiken berechnen
  • Eine eigene Funktion schreiben
  • Grafiken mit seaborn erstellen
  • Daten einlesen und schreiben (csv, xls, pickle)
  • Machine Learning, Train-Test-Split, Kreuzvalidierung
  • Entscheidungsbaum, K-Means, DBSCAN, AdaBoost
  • Random Forest, SVM, Neuronales Netz, Ensembles

Kursthemen

Das Training Data Scientist Fortbildung - Bootcamp in Python ist folgendem Thema zugeordnet:

 

Zielgruppe

Die fünftägige Weiterbildung zum data scientist ist für Personen, die Python programmieren lernen möchten, um Datenanalysen durchführen zu können. Neben der Einführung in Python beinhaltet dieser Kurs Machine Learning Algorithmen. Der Kurs ist eine kompakte Schulung, welche die Inhalte des dreitägigen Data Science Kurses und der zweitägigen Vertiefung in Machine Learning abdeckt.

Voraussetzungen

Unser Data Science Bootcamp benötigt keine Vorkenntnisse in Python. Es ist jedoch notwendig, dass Teilnehmer in einer anderen Programmiersprache Grundkenntnisse besitzen und wissen, was im Programmieren eine Variable ist, was bedeutet, einen Wert einer Variablen zuzuweisen oder was eine Funktion bzw. eine for-Schleife ist.

Basiswissen in Statistik sind für die Data Mining Weiterbildung notwendig, d.h. es sollte bekannt sein, was ein Mittelwert, Median, Normalverteilung oder Standardabweichung ist. Da gelegentlich mathematische Formeln verwendet werden, sollten Symbole der Mathematik, wie das Integral, das Summenzeichen oder Konzepte wie eine Funktion, eine Ableitung oder die Exponentialfunktion bekannt sein. Wir verwenden auch logische Operatoren, so dass Kenntnis der booleschen Algebra mit den Operatoren Nicht-Und-Oder sehr hilfreich sind.

Teilnehmer haben typischerweise bereits mit Daten in einer BI-Software oder in Excel gearbeitet und kennen daher einfache Berechnungen, welche auf Daten ausgeführt werden können (z.B. Spaltensumme ermitteln).

Schulungssprache ist Deutsch. Da die Dokumentation von Python und die Fachbegriffe im Machine Learning meist auf Englisch sind, werden die Folien im Seminar auf Englisch gehalten. Grundlegende Englischkenntnisse beim Lesen von Texten sind daher sehr hilfreich.

Dauer und Zeiten

5 Kurstage

Verwandte Seminare

Termine

  • 09.09.24 - 13.09.24OnlineAnmelden

Anfrage stellen

Kurspreis für offene Schulungen

2250,00 € zzgl. 19% MwSt. (2677,50 € inkl. 19% MwSt.)

Hinweis

  • Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
  • Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
  • Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
  • Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
  • Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Noch Fragen?

Unsere FAQ klären auf.

Lassen Sie sich von uns beraten!

Jetzt anrufen