Apache Spark mit Databricks - Crashkurs
สิ่งที่คุณจะได้เรียนรู้
- Verstehe die Architektur von Apache Spark und lerne die Grundlagen zur Apache Spark Programmierung.
- Lerne, was Databricks ist und wie du damit Data Science/Engineering Aufgaben schnell und einfach lösen kannst.
- Lerne die Spark DataFrames API praktisch anzuwenden.
ข้อกำหนด
- Grundkenntnisse in Python und SQL
คำอธิบาย
Databricks wurde von den Apache Spark Schöpfern gegründet. Databricks stellt eine webbasierte Plattform für Datenanalysen mit Apache Spark bereit, die Data Scientists, Data Engineers, Machine-Learning Engineers und Data Analysts zusammenbringt und ist mit der AWS oder Azure Cloud integrierbar.
Durch die zusätzlichen Features, die Databricks mitbringt sind produktive und skalierbare Data Science und Data Engineering möglich. Die Features sind eine optimierte Performance auf Apache Spark, zuverlässige und leistungsstarke Data Lakes mit Delta Lake, Interaktive Data Science und Zusammenarbeit zwischen den unterschiedlichen Beteiligten wie Data Scientists, Data Engineers, Machine-Learning Engineers usw..
Mit Databricks sind Jobs und Workflows in Produktivumgebung möglich, für die Anforderungen hinsichtlich Unternemenssicherheit ist durch End-to-End Datenschutz und Compliance gesorgt, bekannte und geläufige Tools sind ohne Probleme integrierbar und es wird ein Experten-Support durch die Apache Spark Schöpfer gegeben.
Nach erfolgreichem Abschluss des Kurses wirst du in der Lage sein mit Databricks interaktive Data Science und Data Engineering zu betreiben. Du bekommst eine Einführung in die Grundlagen von Apache Spark und Databricks. Du lernst mit Spark DataFrames umzugehen sowie Aufgaben mit der kostenlosen Community Edition schnell und einfach zu lösen.
Was erwartet dich in dem Kurs?
Du bekommst über 20 theoretische und praktische Lektionen sowie Übungsaufgaben – was mehr als 3 Stunden Videomaterial umfasst.
Dich erwartet ein Abschlussprojekt mit echten Daten und Databricks-Notebooks sowohl mit Vorlage als auch Lösung, die du herunterladen kannst.
Du erhältst Zugang zum Online Q&A Forum, wo entweder andere Kursteilnehmer oder ich deine Fragen beantworten werden.
Und schließlich erhältst du auch ein Zertifikat bei erfolgreichem Kursabschluss, das sich gut in deinem Lebenslauf macht.
Achtung!
Dieser Kurs überschneidet sich mit meinem Kurs "Spark mit Databricks in AWS für Data Science/Engineering", der die Inhalte diesen Kurses und noch umfangreiche weitere Lektionen für Databricks in der AWS Cloud enthält.
30 Tage Geld-zurück-Garantie!
Wenn du mit dem Kurs schließlich nicht zufrieden bist, kannst du ihn gerne ohne Probleme innerhalb von 30 Tagen zurückgeben und du bekommst dein Geld wieder.
Für wen ist dieser Kurs eher nicht geeignet?
Alle, die PySpark, Databricks oder AWS von A-Z lernen möchten – also alle Aspekte von hinten bis vorne wissen möchten – werden in diesem Kurs höchstwahrscheinlich nicht auf ihre Kosten kommen.
Der Ansatz, der hier genommen wird ist, dass wir notwendige Spark, Databricks und AWS Features lernen werden, um schnell und mit praktischem Fokus Mehrwert durch Projekte im Data Engineering und Data Science Bereich zu generieren.
หลักสูตรนี้เหมาะกับ
- Jeder, der Apache Spark mit Databricks lernen möchte
- Data Engineers, Data Scientists, Machine-Learning Engineers mit und ohne Vorkenntnisses in Apache Spark
- Informatiker, Python-Entwickler, DWH-Entwickler mit geringen Vorkenntnisses in Apache Spark und Interesse an Data Engineering/Data Science
วิทยากร
Es gibt so viele coole Tools da draußen - vor allem im Bereich Small/Large/Big Data. Ein Leben reicht garnicht aus, alle Tools zu kennen und gut darin zu sein. Aber bereits mit einem übersichtlichen und guten Toolset kann man tolle Projekte mit echtem Mehrwert umsetzen.
Ich habe 2012 die Universität als Diplomingenieur für Mechatronik abgeschlossen, wobei Programmierung vor allem im Embedded Umfeld eine wichtige Rolle spielte. Im Laufe meiner ersten Berufsjahre als Ingenieur entdeckte ich mehr und mehr meine Leidenschaft für Python vor allem mit Small/Large/Big Data.
Nach einigen Hobby-Projekten wagte ich 2016 schließlich den Schritt auch beruflich in diesem Umfeld zu arbeiten. Nun arbeite ich seit mehreren Jahren erfolgreich als Data-Engineer und hatte die Möglichkeit in tollen Projekten mitzuwirken.
Dieses Wissen möchte ich gern durch Kurse im Bereich Data-Engineering und Data-Science mit einem hohen Fokus auf die Praxis weitergeben.
----------------------------------------
English Version
There are so many cool tools out there - especially in the small / large / big data area. One life is not enough to know all tools and be proficient with them. But even with a quite small and good toolset, you can implement great projects with real value.
In 2012 I graduated as engineer for mechatronics. Programming especially in the embedded area was an important part of my education. During my first years as an engineer, I discovered more and more my passion for Python, especially with small / large / big data.
After a few hobby projects, I took the step to work professionally in this area in 2016. I've been working now for years as a data engineer being involved in great projects.
I like to pass this knowledge on through courses in data engineering and data science with a high focus on practice.