Ist Data Science ein Sterbefeld?

Startseite » Ist Data Science ein Sterbefeld?
Ist Data Science ein Sterbefeld?

Angesichts der Tatsache, dass Data Science von LinkedIn als „die vielversprechendste“ Karriere und von Glassdoor als „Greatest Job in America“ bezeichnet wurde, fällt es vielen in der Branche schwer zu verstehen, wie etwas so lukrativ klingendes wie Data Science jemals als tot angesehen werden kann. Per Definition ist „Data Science das Studienfach, das verbindet SachverstandProgrammierkenntnisse sowie Kenntnisse in Mathematik und Statistik zu extrahieren aussagekräftige Erkenntnisse aus Daten.“

Solange wir also keinen Weg finden, Daten selbst nicht zu verwenden, wird die Datenwissenschaft als Bereich in absehbarer Zeit nicht obsolet sein. Viele glauben jedoch, dass die täglichen Aufgaben eines Datenwissenschaftlers quantitativer oder statistischer Natur sind und daher automatisiert werden können, sodass in Zukunft kein Datenwissenschaftler mehr benötigt wird.

Domänenexpertise zählt

Die Idee entstand aus der Tatsache, dass einige Aufgaben von Datenwissenschaftlern wie Datenbereinigung, Datenvisualisierung und Modellerstellung teilweise durch autoML-Modelle automatisiert werden können. Obwohl die Tools die Aufgabe möglicherweise effizient erledigen können, konzentrieren sich viele nicht auf den Teil der „Domänenexpertise“ in der Definition von Data Scientist.

Domänenexpertise bezieht sich auf das umfassende Wissen in einem bestimmten Bereich, das Datenwissenschaftler auf ihre datenwissenschaftlichen Fähigkeiten anwenden. Selbst wenn also ein großer Teil der Datenpipeline und des Workflows automatisiert wird, benötigen Sie immer noch einen Data Scientist, um das zu lösende Geschäftsproblem in das richtige Format zu übersetzen.

Darüber hinaus ist es nicht einfach, basierend auf der Branche zu identifizieren, welches Data-Science-Modell anzuwenden ist. Vor allem, wenn die Branchen so unterschiedlich sind; ein Empfehlungsalgorithmus für die Gesundheitsbranche wäre für eine Video-Streaming-Plattform nicht hilfreich.

Tina, eine ehemalige Datenwissenschaftlerin bei Meta, glaubt, dass der sehr unbeachtete Teil der Arbeit eines Datenwissenschaftlers darin besteht, den richtigen Kontext auf ein Modell anzuwenden. Über ihre Erfahrung bei Meta, wo sie an der Integrität von Instagram arbeitete, sagte sie: „Es gab ein maschinelles Lernmodul, das die Integrität von Inhalten überprüfte und sie anschließend demonstrierte, wenn sie gegen die Regeln verstießen. Abgesehen davon, dass ich die Daten aus dem Modell holte, bestand meine Aufgabe darin, festzustellen, was überhaupt als Verstoß gegen die Regel angesehen wird.“

Laut Tina „ist das Problem, dass ML-Modelle ‚unbekannte Unbekannte‘ nicht erkennen können, und wenn Sie etwas nicht einmal messen können, wie können Sie dann feststellen, ob es überhaupt gegen die Regel verstößt? Es gibt immer ein Gleichgewicht zwischen Meinungsfreiheit und Integrität.“

Wie Dr. Vaibhav Kumar, Senior Director for Data Science bei der Association of Data Scientists (ADaSci), zu Recht wiederholt: „Data Science ist ein Bereich, in dem nur 50 % des Potenzials ausgeschöpft wurden.“

„Das Feld braucht meiner Meinung nach noch viel Arbeit und ist noch lange nicht am Ende. Maschinelles Lernen kann in verschiedenen Aufgaben des Workflows eingesetzt werden, aber Data Scientists müssen immer noch bestimmen, was als nächstes zu tun ist. Was bedeuten diese Ergebnisse des Modells? Wie stellt man fest, ob das Model überhaupt einen guten Job macht? Was ist die Metrik?“, fragte er Ziel.

„Es wird immer einen Bedarf an menschlicher Unterstützung im Bereich der Datenwissenschaft geben, den maschinelles Lernen allein nicht leisten kann“, sagte Dr. Vaibhav.

Also stirbt es?

Die Befürchtung war vor einigen Jahren in der Buchhaltungsbranche aufgetaucht, als behauptet wurde, dass KI die Jobs von Buchhaltern und Wirtschaftsprüfern ersetzen könnte. Doch auch wenn ein KI-Programm so ziemlich alles kann, was ein Buchhalter kann, braucht man dennoch die Expertise des Buchhalters für Steuerbefreiungen, Gutschriften etc.

In ähnlicher Weise kann sich ein Datenwissenschaftler auf die autoML-Modelle verlassen, um Daten zu sammeln, zu visualisieren und zu bereinigen, damit er sich mehr auf die geschäftlichen Anforderungen konzentrieren kann. Darüber hinaus wird die Nachfrage nach Data Scientists in Zukunft weiter steigen, da Data Science in vielen konventionellen Bereichen wie Finanzen, Gesundheitswesen, Verteidigung und Governance noch in den Kinderschuhen steckt.

Der lustige Teil ist, dass für die AutoML-Datenexploration überhaupt erst Daten benötigt werden, die von einem Datenwissenschaftler selbst gesammelt werden.