Was ist ein Data Science Prototyp?

Ein Data Science Prototyp ist vor allem eins: Nicht perfekt! Mindestanforderungen d├╝rfen zwar ambitioniert, aber keinesfalls unrealistisch sein. Zudem enth├Ąlt ein Data Science Prototyp meist keine Live-Anbindung an Datenquellen, sondern wird auf Datenextrakten erstellt. Um zu fr├╝h viel Budget in Eigenentwicklung zu stecken, greift man in der Regel auf vorhandene Tools und Open-Source Libraries zur├╝ck.

Idee des Prototyps

Einer der weltweit bekanntesten Erfinder ist die Comicfigur Daniel D├╝sentrieb. Daniel D├╝sentrieb gilt als zerstreut, etwas verr├╝ckt, aber mit unendlich vielen Ideen f├╝r neue Erfindungen. Und so kommt es, dass Daniel D├╝sentrieb in der Geschichte jeden Tag mit einer neuen Erfindung um die Ecke kommt, welche sein eigenes und das Leben seiner Liebsten verbessern soll. Dabei sind seine Kreationen keinesfalls reif f├╝r die Massenproduktion, sondern entsprechen immer dem Stand eines Prototyps.

Als Prototyp versteht man eine stark vereinfachte und experimentelle Version eines neuen Produkts oder Services. Das Ziel eines Prototyps besteht darin, eine Idee zu einem fr├╝hen Zeitpunkt zu testen und Feedback zu sammeln. Nur so kann sichergestellt werden, dass ein Produkt den gew├╝nschten Nutzen bringt und lohnt weiterzuentwickeln. Dar├╝ber hinaus verbessert ein Prototyp das gemeinsame Verst├Ąndnis aller Beteiligten im Entwicklungsprozess und sch├Ąrft das Vorstellungsverm├Âgen vom sp├Ąteren Endergebnis. Letzteres ist vor allem bei Dienstleistungen oder digitalen Produkten herausfordernd, da diese nicht mit den H├Ąnden greifbar sind.

Bei der Entwicklung von Apps und Webseiten geh├Âren Prototypen zum Alltag. Oft kommen Click-Dummies zum Einsatz, wodurch Klickpfade durch die geplante Applikation auch ohne eine Zeile Code realistisch dargestellt werden k├Ânnen.

Data Science Prototyp

Ein Prototyp im Bereich Data Science ist eine vereinfachte Umsetzung einer Produktidee oder eines Services, bei denen Daten ein elementarer Bestandteil sind. Aus diesem Grund m├╝ssen Daten bereits bei der Entwicklung eines Prototyps integriert werden. Somit ist ein Prototyp in Data Science meist mehr als "nur" ein Click-Dummy!

Drei unterschiedliche Beispiele f├╝r einen Data Science Prototyp:

  • Die Entwicklung eines Machine Learning Modells, das eine Mindestanforderung erf├╝llt. Durch die Definition einer Mindestanforderung nennt man diese Art von Prototyp Proof of Concept (PoC). Eine Idee wird anhand von spezifizierten Kriterien getestet.

    Ein konkretes Beispiel w├Ąre die Erstellung eines Modells zur Vorhersage der Bestellmengen eines Onlineshops. Eine m├Âgliche Vorgabe w├Ąre, dass das Modell die Bestellmengen des n├Ąchsten Monats mit einer maximalen Abweichung von 17% vorhersagen kann, damit sich der anschlie├čende Entwicklungsaufwand f├╝r den produktiven Einsatz lohnt. Der PoC gilt als erfolgreich, wenn die Anforderung auf unabh├Ąngigen Testdaten erf├╝llt wird.
  • Die Entwicklung eines BI Dashboards mit Beispieldaten. Bei einem Prototyp f├╝r ein Business Intelligence System besch├Ąftigt man sich einerseits mit der Definition geeigneter Metriken. Andererseits werden passende Visualisierungen gesucht und Beispieldaten in einem echten Dashboard platziert. Der Prototyp kann normalerweise ohne Eigenentwicklung in vielen Analysetools schnell erstellt werden. Anders als im ersten Beispiel, wird in diesen Use Cases schnell etwas visuell sichtbar. Der Prototyp enth├Ąlt weder eine direkte Anbindung an produktive Datenquellen, noch wird das Dashboard automatisch mit neuen Daten gef├╝ttert.
  • Die Entwicklung einer Pipeline zur Datenverarbeitung. Ein Prototyp ist sinnvoll, wenn Daten aus verschiedenen Systemen extrahiert, kombiniert, transformiert und am Ende in ein weiteres System ├╝bertragen werden sollen. Die Aufgabe ist es, eine einfache Pipeline aus den einzelnen Verarbeitungsschritten abzubilden, die deterministisch abl├Ąuft. Der Prototyp bringt Erkenntnisse zu notwendigen Verarbeitungsschritten, vorhandenen Datenstrukturen oder Anforderungen an das Zielsystem. Deshalb nennt man diese Art auch den funktionalen Prototyp. Das Ziel ist dann erreicht, wenn kleine Datenmengen die Pipeline durchlaufen und im Zielsystem ankommen.

Das oberste Ziel eines Data Science Prototyps ist Schnelligkeit. In kurzer Zeit soll mit ├╝berschaubarem Budget eine m├Âglichst realistische Einsch├Ątzung zum geplanten, digitalen Produkt oder Dienstleistung erzielt werden. Dabei spielen technische Umsetzbarkeit sowie wirtschaftliche Beurteilung gleicherma├čen eine wichtige Rolle. Denn eine aufwendige Eigenentwicklung macht nur Sinn, wenn die ben├Âtigten Daten sowie die IT-Infrastruktur vorhanden sind und das Unternehmen letztendlich einen wirtschaftlichen Mehrwert erzielen kann.

Geeignete Tools f├╝r einen Data Science Prototyp

Eine umfangreiche Eigenentwicklung sollte in der Prototypphase vermieden werden. Stattdessen kann man viele Tools nutzen, die im Unternehmen bereits verwendet werden.

Folgende Programme und Frameworks sind zur Erstellung eines Data Science Prototyp geeignet:

Obwohl Daniel D├╝sentrieb immer sagt "Dem Ingenieur ist nichts zu schw├Âr!" lohnt es sich, neue "Erfindungen" mit einem Prototyp zu beginnen. So ist es auch bei kosteneffizienten Data Science Projekten.

Wir helfen euch gerne bei der Entwicklung neuer Ideen und der Erstellung eines Data Science Prototyps. Starten wir doch mit einem unverbindlichen Kennenlernen!

Dieser Artikel wurde verfasst von:
Author image

Sarah Stemmler

Mit meiner Leidenschaft f├╝r Menschen, Daten & Tools, helfe ich Unternehmen Data Science Kompetenz inhouse aufzubauen.
Abonnement hinzugef├╝gt synsugar
Super! Schlie├če den Checkout ab um vollen Zugriff zu erhalten synsugar
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.