Der Begriff „Citizen Data Scientist“ tauchte erstmalig im Gartner Hype Cycle [1] im Jahr 2015 im Bereich der Innovation/Technology Trigger auf der Hype Cycle Kurve („Early Adopters investigate“) auf. 2016 wurde das Konzept des Citizen Data Sciences von Gartner theorisiert. Die Prognose der Dauer bis zum Plateau der Produktivität lag damals bei 2-5 Jahren. Nennenswert dabei ist, dass 2013 an der Stelle noch Data Science und 2012 Big Data zu finden war!
Wer ist Citizen Data Scientist?
Gartner definiert Citizen Data Scientist als “a person who creates or generates models that use advanced diagnostic analytics or predictive and prescriptive capabilities, but whose primary job function is outside the field of statistics and analytics” (Idoine 2018).
Vereinfacht gesagt ist Citizen Data Scientist (CDS):
- Data Science Arbeiter oder “Power User” im Bereich Data Analytics
- ohne formelle Ausbildung in fortgeschrittener Mathematik und Statistik,
- eine Person, die Tools zur Gewinnung von hochwertigen Erkenntnissen aus Daten verwendet, um sich von den schwierigen Aufgaben der Data Scientist Experten zu abstrahieren und die Arbeit mit Daten zu automatisieren, also CITIZEN DATA SCIENTIST ist kein DATA SCIENTIST.
Status quo
Der Aufstieg von Big Data und der Trend zur Digitalisierung stellte viele Unternehmen vor ein neues Dilemma: Wie kann man eine immer größer werdende Datenmenge aus verschiedensten Datenquellen bestmöglich nutzen, um nachhaltig wirtschaftliche Gewinne zu erzielen? Der Data Scientist lieferte die Antwort auf diese Frage, indem er statistische Modelle und innovative Machine/Deep Learning-Algorithmen entwickelte.
Herausforderung
Data Science Experten waren und sind sehr rar und teuer; darüber hinaus fehlt es vielen Data Scientists an wirtschaftlichem und unternehmensspezifischem Know-how. 2012 schrieb Harvard Business Review: “Data Scientist – the Sexiest Job of the 21st Century”. (Davenport & Patil 2012)
Lösung:
Die rasante Entwicklung von diversen Business Tools zeigt, dass heutzutage beinahe jedes Unternehmen per Mausklick auf vereinfachte Verfahren zur Datenanalyse zurückgreifen kann. Der Schlüssel liegt in der Demokratisierung der Automatisierung von Prozessen: sie ermöglicht es, auch weniger spezialisierten Personen, Daten zu verarbeiten, um wertvolle Erkenntnisse zu gewinnen.
Umsetzung:
- CDS füllt die Lücke zwischen den Data Science Experten und dem “herkömmlichen” Data Analyst. Z. B. besitzt ein Citizen Data Scientist zwar Expertise im Bereich künstlicher Intelligenz, aber muss generell nicht im Stande sein, KI selbst zu programmieren.
- CDS kann die gewinnbringende Verarbeitung der unternehmenseigenen Daten bewerkstelligen, ohne die Qualifikation der Data Scientist Experten zu besitzen => Business-Know-how + Reduced Data Science Know-how = Citizen Data Scientist.
CDS ist kein Ersatz für den Data Scientist Experten! Beide Funktionen können nebeneinander in Koexistenz bestehen und Synergieeffekte entwickeln, um die Wettbewerbsfähigkeit des Unternehmens zu verbessern.
Mehr noch…
Der Einsatz der CDS erlaubt den Unternehmen eine gewisse Freiheit und Autonomie bei der Verarbeitung der für sie relevanten Datensätze. Einzelne Geschäftsbereiche werden zunehmend unabhängiger, während die IT weiterhin für die Integrität der Daten und Informationssysteme verantwortlich ist. (vgl. Khalid, 2020)
Ein praktisches Beispiel
Die Vorhersage des Passagieraufkommens in einem bestimmten Flughafenbereich: Bei einer solchen Prognose sind sowohl technische als auch betriebswirtschaftliche Fähigkeiten gefragt, sowie die des Citizen Data Scientists. Lennart Prins, Head of Business Information, und sein Team haben ein Modell für den Flughafen in Dubai entwickelt, das – basierend auf der Anzahl der Passagiere vor Ort, der Größe des Terminals und der Ankunftszeit der Flüge – die Anzahl der zu öffnenden Check-in-Schalter vorhersagen kann. Dies ermöglicht, dass der Personalbedarf bereits im Voraus auf die zu erwartende Auslastung angepasst werden kann. Um zu überprüfen, ob die Vorhersage auch mit der tatsächlichen Situation vor Ort übereinstimmt, wurde das Personenaufkommen auf dem Flughafen mithilfe von Bewegungssensoren (IoT) ermittelt. Die Prognosen waren sehr genau! (vgl. Khalid, 2020)
Lob & Kritik
Nicht alle Technologien im Gartner Hype Cycle haben eine Zukunft. Im Jahr 2019 vermutete International Data Group (IDG) Connect, dass CDS “overhyped” sein könnte. If ever a sector was at the peak of inflated expectations, it is surely citizen data science, an overhyped, over here example of the sort of thing that happens when the marketers‘ fantasies run ahead of the engineers‘ realities (Veitch, 2019). Aber im Jahr darauf, 2020, tauchten schon die optimistische Zukunftswartungen für CDS in den Medien: Mittlerweile befindet sich die Idee der Citizen Data Science auf dem Vormarsch (Khalid, 2020).
Mittlerweile lässt es zu erwarten, dass der Bedarf nach Experten in Data Science Sektor nicht nur weiter ansteigen wird, sondern mit einer Differenzierung der Data-Science-Rollen verbunden ist. Wir erwarten eine fortgesetzte Differenzierung der Verantwortlichkeiten und Rollen, die früher alle unter die Kategorie Datenwissenschaftler fielen (vgl. Patil, 2012). Kosten für und Mangel an der DS-Fachkräfte, unternehmensspezifischen individuellen Aufgabenstellungen, Anstieg der Datenvolumen und Digitalisierungstrends – das sind die Gründe, warum Citizen Data Scientists zukünftig vermehrt nachgefragt wird, obwohl vielleicht anderes betitelt.
Mit dem Know-how aus Forschung und Praxis vermittelt die Fraunhofer-Allianz Big Data und Künstliche Intelligenz in ihren Data Scientist Fortbildungen herstellerneutral, praxisnah und gleichzeitig theoretisch fundiert die wesentlichen Grundlagen, Vorgehensweisen und Best Practices für den Umgang mit Big Data und die Entwicklung von Big-Data-Lösungen mit hohen Standards an Datenschutz und Datensicherheit.
Die Data-Scientist-Schulungen der Fraunhofer-Allianz Big Data und Künstliche Intelligenz werden für Anfänger*innen ebenso wie für Fortgeschrittene angeboten. Damit ermöglichen wir eine strukturierte, aufeinander aufbauende Weiterbildung. Wenn Sie möchten, schließen Sie unsere Data-Scientist-Schulungen mit einem Zertifikat ab.
Entdecken Sie unser umfassendes Angebot in der Schulungssuche:
Data Quality and Data Preprocessing (fraunhofer.de)
Quellenverzeichnis:
Bieletzke, S. (2022): Studienbriefe „Medientechnologien“, Fachhochschule des Mittelstands (FHM), Bielefeld
Gartner, Inc. (2015): URL: https Gartner’s 2015 Hype Cycle for Emerging Technologies Identifies the Computing Innovations That Organizations Should Monitor. (Abruf 17.11.2022).
Idoine, C. (2018): URL: https://blogs.gartner.com/carlie-idoine/2018/05/13/citizen-data-scientists-and-why-they-matter/. (Abruf 17.11.2022).
Davenport, T., Patil. D. (2012): Harvard Business Review. URL: https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century. (Abruf 17.11.2022).
Khalid, L. (2020): Positive Thinking Company. URL: Was macht ein Citizen Data Scientist? – Positive Thinking Company. (Abruf 17.11.2022).
Veitch, M. (2019): International Data Group (IDG) Connect. URL: Citizen data science suffers from inflated expectations | IDG Connect. (Abruf 17.11.2022).
Unsere Expertin
Tatjana Weingart
Fraunhofer Academy