data-world.jpg

Data Science (zu Deutsch „Datenwissenschaft“) ist eine angewandte, interdisziplinäre Wissenschaft, deren Ziel es ist, Informationen mithilfe von Instrumenten aus der IT und Mathematik aus Datenmengen zu gewinnen. Im Interview mit Thomas Mayer, Teamlead Data Intelligence bei HolidayCheck, sprechen wir über das Berufsbild, wichtige Soft sowie Hard Skills, Trends und Möglichkeiten für Quereinsteiger.

Bitte stellen Sie sich kurz vor, Herr Mayer.

Mein Name ist Thomas Mayer. Ich arbeite seit gut sechs Jahren als Data Scientist für die Burda-Tochter HolidayCheck. Mein Schwerpunkt liegt im Bereich Natural Language Processing (NLP) und dabei vor allem in der Umwandlung von unstrukturierten in strukturierte Daten.

Data Science befasst sich eingehend mit der Generierung von Wissen aus Daten. Dazu gehört neben der Identifikation von Datenquellen ebenso die Prüfung der Datenqualität, die Datenanalyse und letztlich die Strukturierung und Ableitung von Informationen aus diesen Datenmengen. Welche sind aus Ihrer Sicht die wichtigsten Aufgaben eines Data Scientists?

Es beginnt für mich mit einem klaren Verständnis des Geschäftsmodells bzw. der Aufgabenstellung, die man bekommt. Schließlich ist es fatal, wenn man die Ausarbeitung perfekt gestaltet, aber die eigentliche Problemstellung nicht richtig erfasst hat. Das hat natürlich viel mit guter Kommunikation und der Zusammenarbeit mit Domain-Experten zu tun. Diese Fähigkeit wird gegen Ende der Arbeit auch wieder benötigt, wenn es darum geht, die Ergebnisse den Stakeholdern zu präsentieren und ggf. weitere Schritte zu definieren. 

Eine weitere wichtige Aufgabe sehe ich darin, aus den vorhandenen bzw. erschließbaren Datenquellen eine Operationalisierung zu erzielen, die hauptsächlich zwei Dinge erreicht: 1) das eigentliche Problem zu lösen und 2) Metriken zu definieren, die eine schnelle Messbarkeit des Fortschritts ermöglichen. Das Ziel ist es natürlich, in möglichst kleinen Iterationen zu arbeiten.

Was sind Ihrer Meinung nach die top fünf Hard und Soft Skills für den Beruf als Data Scientist?

 

Top 5 Hard Skills

  1. (Python-)Programmierfähigkeiten: Das ist meiner Meinung nach unerlässlich, weil es immer mehr Bibliotheken und Tools gibt, mithilfe derer man sehr rasch Ergebnisse erzielen und auf der Arbeit anderer Data Scientists aufbauen kann.
  2. Kenntnisse von gängigen Datenbanksystemen sowie Datenbankquellen und die Beherrschung von SQL als Lingua Franca zur Beschaffung von Daten
  3. Kenntnisse in den gängigen Statistik- und Machine Learning (ML)-Methoden
  4. Erfahrung im Umgang mit großen Datenmengen (Big Data)
  5. Erfahrung mit Cloud-Infrastrukturen: Aus unterschiedlichen Gründen sind Kenntnisse mit gängigen Cloud-Anbietern unerlässlich für einen effizienten Arbeitsalltag, bei dem man sich um möglichst wenig Operations-Aufgaben kümmern muss (Aufsetzen von Ressourcen wie VMs, Datenbanken oder Installation von Tools etc.)

Top 5 Soft Skills

  1. Kommunikationsfähigkeiten (vor allem auch auf Englisch), um mit Stakeholdern die Aufgabenstellung klar zu definieren als auch die Ergebnisse eindeutig vermitteln zu können

  2. Kreativität, einerseits bei der Erarbeitung von Lösungswegen und andererseits bei der Kommunikation der Ergebnisse

  3. Teamfähigkeit, da heutzutage selten Projekte von einer Person allein vorangetrieben werden, sondern vor allem bei komplexeren Themen mehrere Experten zusammenarbeiten
  4. Neugier und Lernbereitschaft: In der Datenwissenschaft gibt es ständig neue Erkenntnisse und Tools, mit denen man sich befassen sollte, um am Puls der Zeit zu bleiben
  5. Analytische Denkweise gepaart mit einem guten Riecher für geschäftsrelevante Fragen

In welchen Branchen bzw. Bereichen kommen Data Scientists primär zum Einsatz? 

Data ScientistsData Science hat seine Ursprünge in datenintensiven Branchen, findet aber mittlerweile immer mehr global auch in anderen Firmen Anwendung - u.a. auch deshalb, weil mehr und mehr Sektoren die Vorzüge von datenbasierten Optimierungen entdeckt haben und daher immer mehr Datenteams aufbauen, die zum einen die benötigte Infrastruktur aufbauen und zum anderen für die Auswertung zuständig sind.

Data Science hat sich zu einem eigenständigen Themengebiet aus der Informatik heraus entwickelt. In der Zwischenzeit gibt es sogar die Möglichkeit, ein reines Data Science Studium zu absolvieren. Doch welche Optionen sehen Sie für Quereinsteiger? Welche Vorkenntnisse bzw. Skills müssen sie mitbringen? 

Programmierkenntnisse sind aus meiner Sicht das A und O. Wie bereits erwähnt, ist es meiner Meinung nach heutzutage sehr viel einfacher für eine Person mit soliden Programmierkenntnissen sich in das Fach einzuarbeiten, weil sich dann viele Lösungswege eröffnen. Natürlich muss diese Person auch über weitere Fähigkeiten verfügen, aber ein Einstieg ist dann bereits sehr viel einfacher - vor allem, wenn man ein Domänenexperte ist, der sich in Data Science weiterbildet. Zum Beispiel kann sich eine medizinisch vorgebildete Person mit Data-Science-Fähigkeiten im Bereich Health-Data sehr gut einarbeiten. Meiner Meinung nach sind Vorkenntnisse in der Informatik oder Mathematik bzw. insgesamt sehr fundierte theoretische Kenntnisse natürlich vorteilhaft, aber sicherlich keine Grundvoraussetzung.

______________________________________________________________________________________________________

Sind Sie bereits auf der Suche nach einem Job oder Ihrem nächsten Projekt im Bereich Data Science?

Dann besuchen Sie jetzt unseren Stellenmarkt und bewerben Sie sich direkt auf unsere Vakanzen. Sie möchten sich zusätzliche Optionen offen halten? Dann laden Sie hier Ihren Lebenslauf hoch und lassen Sie sich zu aktuellen Jobs und Projekten informieren. 

Zum Stellenmarkt

______________________________________________________________________________________________________

Welche Trends sehen Sie in der Data Science derzeit und in den nächsten fünf Jahren?

Es gibt momentan sehr viele Trends, ich möchte aber nur mal drei herausgreifen: Es ist nach den großen Fortschritten in der ML-Forschung der letzten Jahre ein Trend zu sehen, die darin gewonnenen neuen Erkenntnisse auch in Production-Umgebungen einzusetzen. Dabei einsteht eine Spezialisierung im Bereich Data Science, die noch mehr Software-Engineering- und auch Operations-Wissen mit sich bringt und sich darum kümmert, dass bestehende ML-Modelle vom Kunden direkt benutzt werden können. Dabei kommen weitere Aspekte mit rein, die für eine solche Anwendung besonders relevant sind, wie z.B. die Geschwindigkeit der Inferenz gegenüber der Genauigkeit des Modells, kontinuierliches Neutrainieren der Modelle, Data Privacy für den Anwender etc.

Darüber hinaus gibt es insgesamt den Trend, bestehende Kenntnisse und Erfahrungswerte in automatisierte Lösungen zu integrieren. Die Idee besteht darin, dass auch Anwender mit weniger Grundkenntnissen in den Bereichen Statistik und/oder ML nicht in gewisse Stolperfallen hineinlaufen und vermeidbare Fehler damit automatisch umgehen. Dies beinhaltet die Aufbereitung von Daten sowie die geeignete Wahl von ML-Ansätzen bis hin zur optimalen Wahl von Hyperparametern. Diese Bestrebungen kulminieren in sogenannten Auto-ML-Ansätzen, bei denen ein Anwender einfach Datensätze laden kann und dann von den Predictions über die Erklärbarkeit alles bereitgestellt wird.

Außerdem gibt es noch die Bestrebung, ML-Modelle bzw. allgemein Vorhersagen im Bereich Data Science besser erklären zu können. Ein Anwender oder eine gerichtliche Instanz möchte im Zweifelsfall wissen, warum eine bestimmte Vorhersage bzw. Entscheidung so getroffen wurde. 

Vielen Dank für das Interview, Herr Mayer.

Sie möchten erfahren, welche IT-Jobs im Jahr 2021 außerdem besonders gefragt sind? Dann informieren Sie sich in unserem Artikel Gefragte IT-Jobs im Jahr 2021".

Computer Futures vermittelt seit 35 Jahren Fach- und Führungskräfte in der IT- und Technologiebranche. Unsere Personalberater sind auf bestimmte Fachgebiete innerhalb der IT fokussiert. Damit verstehen wir nicht nur die lokalen Arbeitsmarkt-Trends ganz genau, sondern sind Ihr Partner auf Augenhöhe. Sehen Sie sich jetzt in unserem Stellenmarkt um und bewerben Sie sich direkt auf Ihren Traumjob oder Ihr interessantes Folgeprojekt. Laden Sie außerdem Ihren Lebenslauf hoch und lassen Sie sich zu Vakanzen direkt informieren.