„Das Problem heißt nicht Big Data, sondern Data“
© TMF e.V.
Große Datenmengen können große Begehrlichkeiten wecken, denn aus ihnen lassen sich wertvolle Erkenntnisse ableiten. Auch in der medizinischen Forschung besteht die Hoffnung, mit Hilfe von Big Data-Anwendungen umfangreiche und komplexe Datenmengen effizient zu analysieren, um so die Diagnose und Therapie von Erkrankungen zu verbessern. In einer Diskussionsrunde im Rahmen der conhIT am 21. April 2016 in Berlin warnten Wissenschaftler und IT-Experten jedoch davor, den Weg von erhobenen Daten zu validen wissenschaftlichen Ergebnissen abzukürzen, und betonten die Notwendigkeit, das Phänomen „Big Data“ mit kritischer Distanz zu betrachten.
„Wenn man von außen auf die Wissenschaft blickt, kann man sich nicht vorstellen, wie groß die Herausforderung heute wirklich ist, Daten und insbesondere Big Data wissenschaftlich korrekt zu handeln“, sagte Prof. Dr. Michael Krawczak (Institut für Medizinische Informatik und Statistik, Universitätsklinikum Schleswig-Holstein, Campus Kiel), in der Diskussion. Er berichtete aus seinen Erfahrungen, die er in den letzten Jahren u. a. in der Genomforschung gesammelt hat.
Die Teilnehmer und Teilnehmerinnnen der Diskussionsrunde am 21. April (v. l. n. r.): Moderatoren Nino Mangiapane (Bundesministerium für Gesundheit) und Sebastian C. Semler (TMF), Sebastian Zebbities (atacama Software GmbH), Annika Kaltenhauser (Ergosign GmbH), Prof. Dr. Michael Krawczak (Universitätsklinikum Schleswig-Holstein, Campus Kiel). Nicht abgebildet: Dr. Marc Kämmerer (VISUS Technology Transfer GmbH), Dr. Bernd Schütze (Telekom Healthcare Solutions). © TMF e.V.
Eine weitere Podiumsdiskussion unter Beteiligung der TMF während der conhIT 2016 widmete sich dem Thema Smart Data. Die Referenten des Panels (v. l. n. r.) waren: Dr. Johannes Drepper (TMF), Dr. Michael Meyer (Siemens Healthcare GmbH), Hagen Hupperts (Charité – Universitätsmedizin Berlin), Dr. Matthieu Schapranow (Hasso-Plattner-Institut für Softwaresystemtechnik GmbH), Holger Cordes (Cerner Deutschland), Prof. Dr. Otto Rienhoff (Universitätsmedizin Göttingen). © TMF e.V.
An wissenschaftstheoretischen Prinzipien sollte festgehalten werden
Dabei warnte Krawczak davor, den Weg von den Daten zu wissenschaftlichen Erkenntnissen durch statistische Methoden wie das Data Mining abzukürzen. Dies sei für kommerziell arbeitende Unternehmen wie Google, Apple, Amazon & Co. möglich und rentabel. Diese zögen mithilfe von Mustererkennung und Korrelationen Rückschlüsse auf das Kauf- und Nutzerverhalten ihrer Kunden. Für die medizinische Forschung aber, die auf Evidenz und Kausalität beruhe und das Bestmögliche für den Patienten anstrebe, sei diese Art der Analyse allenfalls ein Mittel für die Datenschau und damit lediglich der Ausgangspunkt für wissenschaftliche Hypothesen, aber keinesfalls deren Beantwortung.
Statt auf die möglichst schnelle Auswertung großer Datenmengen zu setzen, plädierte Krawczak für naheliegende und konsequente Schritte: „Small Science, Konsolidierung und Vernetzung sind die Herausforderungen, vor denen die Forschung steht. Für ein sinnvoll geplantes Projekt ist dabei nicht wichtig, ob es sich um Big Data oder Data handelt. Die wissenschaftstheoretischen Prinzipien bestehen weiterhin und Methodik ist heute so wichtig wie eh und je.“
Medizininformatik-Initiative als geeigneter Weg
Die Medizininformatik-Initiative des BMBF will den standortübergreifenden Austausch und die Nutzung von Daten aus Versorgung und Forschung durch IT-Lösungen in den nächsten Jahren verbessern. Schon ihre Auslobung im Herbst letzten Jahres habe viele Prozesse in Deutschland in Gang gesetzt, so Krawczak. Die Initiative biete eine gute Perspektive, um in kleinen und sorgfältigen Schritten lokale und nationale Datenintegrationskonzepte und Standards für die medizinische Forschung zu definieren.
Big Data-Anwendungen werden mit Vorsicht genossen
Alle an der Diskussionsrunde beteiligten Referenten erkannten zwar das Potential in Big Data-Anwendungen für medizinisch relevante Fragestellungen, einige von ihnen betonten aber ebenso wie Krawczak, dass sich sinnvolle Datenanalysen nicht allein aus großen Datenmengen ergeben. So demonstrierten Dr. Marc Kämmerer (Visus Technology Transfer GmbH) und Dr. Bernd Schütze (Telekom Healthcare Solutions) anhand von Open Data-Auswertungen, wie fehlgeleitet man in der Auswertung dieser Daten sein kann, insbesondere wenn den Analysen weder eine konkrete Fragestellung noch eine kritische Betrachtung zu Grunde liegen. „Die Ergebnisse einer maschinellen Auswertung müssen stets sorgfältig und mit gesundem Menschenverstand geprüft werden. Dabei sollten auch Validierungsmechanismen eingebaut werden“, so Kämmerer.