Was ist Data Science?

Quelle (https://datasolut.com/was-ist-data-science/)

Was ist Data Science?

Data Science (Datenwissenschaft) ist eine interdisziplinäre Wissenschaft, die sich mit der Gewinnung von Wissen aus Daten befasst. Die Datenwissenschaft generiert Informationen aus großen Datenmengen, um daraus Handlungsempfehlungen für das Unternehmensmanagement abzuleiten. Ziel dieser Handlungsempfehlungen ist die Verbesserung der Qualität unternehmerischer Entscheidungen und der Effizienz von Arbeitsabläufen.

Data Science Definition

Erstmals wurde der Begriff „Data Science“ im Jahr 1960 durch den dänischen Informatik-Pionier Peter Naur als Synonym für „Informatik“ verwendet. 2001 begründete der US-amerikanische Computerwissenschaftler William S. Cleveland die Datenwissenschaft als eigenständige Fachdisziplin. Cleveland benannte als Fachgebiete von Data-Science: Daten-Modelle und Daten-Methodik, Rechenoperationen mit Daten, die Bewertung von Werkzeugen, Pädagogik, Theorie und multidisziplinäre Untersuchungen.

Heute wird die Data Science Definition deutlich weiter gefasst als noch vor fünfzig Jahren: die Datenwissenschaft befindet sich im Schnittpunkt zwischen den Wissenschaftsbereichen Mathematik (insbesondere Stochastik) und Informatik sowie dem branchenspezifischen Fachwissen.

 

Data Science ist die Schnittmenge zwischen den Wissenschaftsbereichen Mathematik, Informatik sowie dem branchenspezifischen Fachwissen.
Data Science ist die Schnittmenge zwischen den Wissenschaftsbereichen Mathematik, Informatik sowie dem branchenspezifischen Fachwissen.

 

Im Arbeitsbereich Datenwissenschaft arbeitende Personen werden als Datenwissenschaftler oder Data Scientist bezeichnet.

Data Scientist Tätigkeiten

Das nationale Forschungsgemeinschaft der US-Regierung wies 2005 auf die entscheidende Bedeutung der Data Scientists für das Management digitaler Daten hin. Zu den Datenwissenschaftlern zählten diese insbesondere Informatiker, Programmierer, Datenbank-Experten, Domän-Spezialisten, Archivare und Bibliothekare und sogar Fachleute der Softwareentwicklung.

Fachkenntnisse von Datenwissenschaftlern

Ein Data Scientist muss über ein breites Spektrum von Fachkenntnissen verfügen, um seine analytischen, beratenden und koordinierenden Aufgaben an der Schnittstelle zwischen Datenbanken, Mitarbeitern und Management eines Unternehmens erfüllen zu können:

  • Mathematische und stochastische Modelle und Methoden bilden die Grundlage für die Analyse und Interpretation von Daten. Von großer Bedeutung sind insbesondere eine hohe Datenqualität und die sorgfältige Auswahl der Merkmale von Daten-Stichproben. Zum Einsatz kommen insbesondere auch Verfahren des maschinellen Lernens.
  • Im Zeitalter großer Datenmengen („Big Data“) ist Datenwissenschaft ohne fundierte Kenntnisse über Datenverarbeitung und ihre Instrumente kaum vorstellbar. Die Computer-Wissenschaft (Informatik) unterstützt die Big-Data-Analyse durch Algorithmen, die für eine effiziente Bearbeitung der jeweiligen Datentypen geeignet sind. Analyse-Tools selektieren aus strukturierten oder unstrukturierten Datenmengen die benötigten wertvollen Informationen.
  • Spezifische Branchen-Kenntnisse sind unerlässlich, um Daten und Geschäftsprozesse eines bestimmten Unternehmens einordnen und analysieren sowie sinnvolle Handlungsempfehlungen entwickeln zu können. Betriebswirtschaftliches Wissen ist von grundlegender Bedeutung, wenn Datenanalysen zwecks Geschäftsoptimierung durchgeführt werden sollen.

Persönliche Qualifikationen als Data Scientist

Die Ausübung von Data Scientist Tätigkeiten setzt zudem einige besonders ausgeprägte persönliche Qualifikationen voraus:

  • sprachliche und kommunikative Fähigkeiten, um einerseits Branchenexperten verstehen und andererseits Mitarbeitern aller Unternehmensbereiche und Unternehmensebenen die aus der Datenanalyse abgeleiteten Handlungsempfehlungen überzeugend vermitteln zu können,
  • Kreativität bei der flexiblen Anpassung analytischer Methoden an neue Herausforderungen und Kontexte,
  • Aufgeschlossenheit bei der Erforschung und Nutzung neuer Analyse-Instrumente und Data-Science-Verfahren sowie
  • Koordinationsvermögen sowohl hinsichtlich der Delegation von Aufgaben zur Datenbeschaffung als auch bei der Steuerung und Kontrolle von Data-Science-Projekten.

 

 

Studiengänge Data Science

Entsprechend der im Digitalzeitalter erheblichen Bedeutung von Daten bieten in Deutschland etliche Fachhochschulen und Universitäten Data-Science-Studiengänge an. Als Studienabschlüsse kommen Bachelor of Science (B. Sc.) oder Bachelor of Engineering (B. Eng.) sowie Master of Science (M. Sc.) oder Master of Engineering (M. Eng.) in Betracht.

Da sich das Berufsbild des Data Scientists entsprechend den sich fortlaufend verändernden Anforderungen der Wirtschaft entwickelt hat, zeichnen sich die Data-Science-Studiengänge durch ihren hohen Praxisbezug aus.

  • Für ein Bachelor-Studium in Datenwissenschaften ist gewöhnlich eine Regelstudiendauer von sechs Semestern vorgesehen. Zu den Studienmodulen gehören zumeist theoretische Informatik, Statistik, Stochastik, Informationssicherheit, Algorithmen und Datenstrukturen sowie Softwareentwicklung und Programmierung.
  • Ein sich gegebenenfalls anschließendes Master-Studium kann üblicherweise in einer Regelstudienzeit von vier Semestern absolviert werden. Ein Master-Studienabschluss qualifiziert für eine mögliche Promotion in den Fachbereichen Informatik, Mathematik oder Naturwissenschaften.

Branchen-Beispiele für den Einsatz von Datenwissenschaften

Große Datenmengen werden heute mit den Instrumenten und Methoden der Data-Science für Unternehmen aller Branchen ausgewertet.

  • Retail- und Handelsunternehmen profitieren von Data-Science durch Analysen des Kaufverhaltens von Kunden. Die Untersuchung möglicher Ursachen für Retouren hilft bei der Verringerung von Warenrücksendungen.
  • In der Gesundheitsbranche (Medizin und Pharmazie) ermöglicht Data Science die Erstellung von Ähnlichkeitsanalysen als Grundlage für eine individualisierte Behandlung von Patienten und die Optimierung der Medikation.
  • Logistikunternehmen verbessern mithilfe von Data Science ihre Arbeitsprozesse und die Qualität ihrer Transport-Dienstleistungen.
  • Industriebetriebe steuern und optimieren Fertigungsabläufe unter Einsatz von Data Science.
  • Versicherungen und Banken schöpfen mithilfe von Data-Science das Potenzial der ihnen zur Verfügung stehenden externen und internen Daten aus, um ihre Produkte zu verbessern und die Vertriebserfolge zu steigern.