Direkt übersetzt bedeutet Data Science „Datenwissenschaften“. Das trifft es tatsächlich auch ganz gut, weil in dieser Disziplin aus Daten Wissen geschaffen wird. Kurz gesagt, geht es um die Sammlung, Strukturierung und Verarbeitung von Daten mit Algorithmen, so dass aus den vorhandenen Daten neue Erkenntnisse generiert werden. Immer wenn es um die Digitalisierung von Prozessen geht, werden auch Methoden benötigt, die Daten verarbeiten können. Dieser Umstand führt dazu, dass die digitale Transformation mit der Verbreitung von Data Science in allen betroffenen Bereichen einhergeht.
"How to Data Science" – Ein kurzer Leitfaden
Ein erster Schritt ist also die Sammlung von relevanten Daten. Und hier wartet auch schon die erste Herausforderung. Im Bereich der Wohlfahrt handelt es sich oft um sehr sensible Daten, bei deren Übertragung und Speicherung mit besonderer Vorsicht agiert werden muss. Möchten wir zum Beispiel Wearables (Gegenstände zum Aufzeichnen von Daten, die am Körper getragen werden können. Zum Beispiel eine Uhr oder ein Armband) einsetzen, um die Vitalfunktionen von älteren alleinlebenden Menschen zu überprüfen, müssen Gesundheitsdaten erhoben und übertragen werden. Ein weiterer Anwendungsfall ist die Onlineberatung, in der ein Chatbot eingesetzt wird. Dabei chattet die ratsuchende Person über eine Texteingabe, die Antworten werden jedoch nicht von einem Menschen gegeben, sondern automatisiert, anhand bestimmter Schlüsselwörter, generiert. Oft werden Chatbots für die erste Kontaktaufnahme genutzt, um die richtige Ansprechperson zu ermitteln. Hier kann es um Themen wie Sucht, Missbrauch oder Depression gehen. Die Übertragung und Verarbeitung der Daten sind jedoch essenziell, um der ratsuchenden Person helfen zu können. Data Science funktioniert also nicht ohne weitreichende Datenschutzkonzepte.
Anschließend müssen die gesammelten Daten strukturiert und damit nutzbar gemacht werden. Typischerweise sind die Daten unvollständig, nicht einheitlich aufgebaut und es kann Ausreißer geben, die herausgefiltert werden müssen, um die Ergebnisse nicht zu verzerren. Darüber hinaus sind die zu verarbeitenden Daten oft dynamisch. Wenn sich die Datengrundlage ständig verändern kann, bzw. stetig neue Daten hinzukommen, ist eine manuelle Bearbeitung der Daten nicht mehr praktikabel. Die Verarbeitung muss also automatisiert durch Algorithmen erfolgen.
Der eigentliche Mehrwert beginnt mit dem Herstellen von Zusammenhängen und den daraus generierten neuen Erkenntnissen aus den Daten. Zum Beispiel durch Clustern (Gruppieren anhand bestimmter Merkmale) der Daten oder durch das Erstellen von Szenarien, die zukünftige Entwicklungen abbilden. Die Entscheidungen, die so getroffen werden, basieren nicht rein auf Vergangenheitswerten, sondern beziehen mögliche zukünftige Entwicklungen direkt mit ein. So verändert sich die Organisation weg von einer reaktiv hin zu einer proaktiv agierenden Organisation. Die Geschwindigkeit, mit der neue Entwicklungen in Entscheidungsprozesse involviert werden können, steigt. Da Entscheidungen in einer Organisation in der Regel nicht vom Data Science-Team selbst getroffen werden, gehört zu deren Aufgaben auch noch die verständliche Aufbereitung des generierten Wissens zur Entscheidungsunterstützung.
Data Science in der Wohlfahrt
Eine typische Fragestellung für datengetriebene Entscheidungsunterstützung in der Wohlfahrtspflege ist die Zuordnung von Einsatzkräften mit unterschiedlichen Fähigkeiten zu verschiedenen Einsatzorten. In der Planungsphase ist oft noch gar nicht klar, welche genauen Bedarfe es zum Einsatzzeitpunkt gibt. Diese werden dann anhand von erhobenen Daten und Zusammenhängen in diesen Daten prognostiziert. Aber auch die Ressourcenverteilung für Sachmittel ist ein Entscheidungsproblem, bei dem Data Science-Methoden zum Einsatz kommen. So gab es zum Beispiel in der Corona-Pandemie zeitweise einen Engpass an Atemschutzmasken für den medizinischen Gebrauch. Bei jeder größeren Nachlieferung musste entschieden werden, wo diese Masken am sinnvollsten gelagert bzw. eingesetzt werden. Dabei war sowohl die aktuelle Nachfrage ein entscheidender Faktor als auch die prognostizierten Bedarfe für die nächsten Wochen. Einflussfaktoren für zukünftige Bedarfe sind unter anderem die demographische Struktur in einer Region, die aktuellen Fallzahlen vor Ort sowie die Entwicklungen der Pandemie in den letzten Wochen. Das Erkennen von Mustern und das Ziehen von Schussfolgerungen aus diesen Mustern ist eines der typischen Einsatzgebiete von Data Science. Diese Muster können zum Beispiel auch dabei helfen zu erkennen, ob Ehrenamtliche in Kürze die Organisation verlassen werden oder ob es sich bei einem Unterstützungsantrag um einen Betrugsfall handelt. Weitere Anwendungsbeispiele für Data Science-Methoden in gemeinnützigen Organisationen finden Sie hier.
Wie gemeinnützige Organisationen aus ihren Daten lernen können
Nun ist die Anzahl der Data Scientists, also der Menschen, die sich mit dem Generieren von Wissen aus Daten beschäftigen, in den meisten gemeinnützigen Organisationen begrenzt oder gleich Null. Darüber hinaus fehlt oftmals auch die Zeit, um sich mit den eigenen Daten auseinanderzusetzen. Verschiedene Initiativen haben sich zum Ziel gemacht hier zu vermitteln, indem sie gemeinnützige Organisationen und Data Scientists zusammenbringen, um datengetriebene Problemstellungen zu lösen. Dies geschieht zum Beispiel in Form von sogenannten „Data Dives“, bei denen sich freiwillige Entwicklerinnen und Entwickler mit einer Passion für Daten mit den Verantwortlichen aus der Organisation treffen und zusammen an den mitgebrachten Problemstellungen arbeiten. Auch die Umsetzung und Evaluation im Nachgang wird durch die Expertinnen und Experten begleitet.
Ein Beispiel ist das Netzwerk DataKind. Auf deren Webseite ist eine Auswahl der umgesetzten Projekte zu finden. So zum Beispiel verschiedene Projekte zur Untersuchung von Bildungschancen oder zur Untersuchung der Wirksamkeit von Programmen für Wohnungslose. Einen ähnlichen Ansatz verfolgt auch die Organisation Bayes Impact. Beispielprojekte sind die Unterstützung von Arbeitslosen bei der Jobsuche sowie die Betrugserkennung bei der Gewährung von Mikrokrediten. Auch in Deutschland gibt es inzwischen Initiativen, die sich mit der Nutzung von Data Science-Methoden zur Steigerung des Gemeinwohls beschäftigen. Zum Beispiel Data Science for Social Good Berlin. Darüber hinaus gibt es viele Startups, die sich vor allem im Bereich Gesundheit und Pflege ausgegründet haben und zum Beispiel eine Ressourceneinsatzsoftware oder eine Sturzprognose für ältere Menschen entwickelt haben.
Wenn Menschen, die eine Passion für Daten haben, auf gemeinnützige Organisationen treffen, kann daraus ein Schritt zu einer gerechteren und nachhaltigeren Gesellschaft werden. Legen wir also unsere Berührungsängste ab und beginnen mit der Ideensammlung.