Quellen von Big Data in der Medizin

by Kevin Hwang, MD, MPH; Bewertet von Richard N. Fogoros, MD

Eine einfache Definition von Big Data in der Medizin ist "die Gesamtheit der Daten in Bezug auf die Gesundheitsversorgung und das Wohlbefinden der Patienten" (Raghupathi 2014). Aber was genau sind diese Arten von Daten und woher kommen sie?

Im Folgenden wird ein breiter Überblick über die Arten und Quellen von Big Data gegeben, die für Anbieter von Gesundheitsdienstleistungen, Forscher, Kostenträger, politische Entscheidungsträger und die Industrie von Interesse sind.

Diese Kategorien schließen sich nicht gegenseitig aus, da die gleichen Daten aus einer Vielzahl von Quellen stammen können.

Diese Liste ist auch nicht erschöpfend, weil die praktische Anwendung von Big-Data-Analysen sicherlich weiter zunehmen wird.

Klinische Informationssysteme

Dies sind traditionelle Quellen für klinische Daten, die die Anbieter von Gesundheitsdienstleistungen normalerweise sehen.

Elektronische Gesundheitsakten (EHRs) sammeln, speichern und zeigen Informationen wie Demographie, frühere medizinische Vorgeschichte, aktive medizinische Probleme, Impfungen, Allergien, Medikamente, Vitalparameter, Ergebnisse von Labor- und Radiologietests, Pathologieberichte, Fortschrittsberichte aus dem Gesundheitswesen Anbieter und administrative und finanzielle Dokumente
Elektronische Patientenakten (EMRs) sind nicht identisch mit EHRs und beziehen sich normalerweise auf Daten, die bei einem bestimmten Arzt gespeichert sind.
Der Austausch von Gesundheitsinformationen dient als Knotenpunkt zwischen unterschiedlichen klinischen Informationssystemen

Patientenregister, die von Gesundheitsorganisationen an ihren eigenen Patienten gepflegt werden, sind oft mit dem EPA verbunden. Andere Register verfolgen Impfungen, Krebs, Trauma und andere Probleme der öffentlichen Gesundheit auf einer breiteren geographischen Skala.

Patientenportale ermöglichen es Patienten, auf persönliche Gesundheitsinformationen zuzugreifen, die in der EHR einer Gesundheitseinrichtung gespeichert sind. Einige Patientenportale ermöglichen es Benutzern auch, Nachfüllungen zu beantragen und sichere elektronische Nachrichten mit dem Gesundheitsteam auszutauschen.

Klinische Data Warehouses aggregieren Daten auf Patientenebene von mehreren klinischen Informationssystemen wie EHRs und anderen oben aufgeführten Quellen

Anspruchsdaten von Zahlungspflichtigen

Öffentliche Kostenträger (z. B. Medicare) und private Kostenträger verfügen über große Datenspeicher mit Schadensdaten über ihre Begünstigten. Einige Krankenversicherer bieten jetzt auch Anreize für die Weitergabe Ihrer Gesundheitsdaten.

Studien

Forschungsdatenbanken enthalten Informationen über Studienteilnehmer, experimentelle Behandlungen und klinische Ergebnisse. Große Studien werden in der Regel von Pharmaunternehmen oder Regierungsbehörden gesponsert. Eine Anwendung der personalisierten Medizin besteht darin, einzelne Patienten mit wirksamen Behandlungen zu vergleichen, basierend auf Mustern in klinischen Studien.

Dieser Ansatz geht über die Anwendung evidenzbasierter Medizinprinzipien hinaus, bei denen ein Gesundheitsdienstleister feststellt, ob ein Patient allgemeine Merkmale (z. B. Alter, Geschlecht, Rasse, klinischer Status) mit Studienteilnehmern teilt. Mit Big-Data-Analysen ist es möglich, eine Behandlung auf der Grundlage von viel detaillierteren Informationen auszuwählen, z. B. dem genetischen Profil des Krebses eines Patienten (siehe unten).

Klinische Entscheidungsunterstützungssysteme (CDSS) haben sich ebenfalls schnell entwickelt und stellen heute einen großen Teil der künstlichen Intelligenz (KI) in der Medizin dar.

Sie verwenden Patientendaten, um Kliniker bei ihrer Entscheidungsfindung zu unterstützen, und werden oft mit EHRs kombiniert.

Genetische Datenbanken

Das Repository der menschlichen genetischen Information sammelt sich weiterhin in hohem Tempo an. Seit der Durchführung des Humangenomprojekts im Jahr 2003 konnten die Kosten für die menschliche DNA-Sequenzierung um das Millionenfache gesenkt werden. Das Personal Genome Project (PGP), das 2005 von der Harvard Medical School ins Leben gerufen wurde, versucht, das komplette Genom von 100.000 Freiwilligen aus der ganzen Welt zu sequenzieren und bekannt zu machen. Das PGP selbst ist ein Paradebeispiel für Big-Data-Projekte aufgrund der schieren Menge und Vielfalt der Daten.

Ein persönliches Genom enthält etwa 100 Gigabyte Daten. Zusätzlich zum Sequenzieren von Genomen sammelt das PGP auch Daten von EHRs, Umfragen und Mikrobiom-Profilen.

Eine Reihe von Unternehmen bietet direkte genetische Gensequenzierung für die Gesundheit, persönliche Eigenschaften und Pharmakogenetik auf einer kommerziellen Grundlage.

Diese persönlichen Informationen könnten der Big-Data-Analyse unterworfen werden. Zum Beispiel hat 23andMe seit dem 22. November 2013 keine neuen Berichte über gesundheitsbezogene genetische Berichte an neue Kunden herausgegeben, um der US-amerikanischen Food and Drug Administration zu entsprechen. Im Jahr 2015 hat das Unternehmen jedoch begonnen, bestimmte Gesundheitskomponenten ihres genetischen Speicheltests erneut anzubieten, diesmal mit Genehmigung der FDA.

Öffentliche Aufzeichnungen

Die Regierung führt detaillierte Aufzeichnungen über gesundheitsbezogene Ereignisse wie Einwanderung, Heirat, Geburt und Tod. Die US-Volkszählung hat seit 1790 alle 10 Jahre eine große Menge an Informationen gesammelt. Die Statistik-Website der Census hatte ab 2013 370 Milliarden Zellen, wobei jährlich etwa 11 Milliarden mehr hinzugefügt wurden.

Websuche

Informationen zur Websuche, die von Google und anderen Anbietern von Web-Suchanfragen gesammelt wurden, könnten in Echtzeit Einblicke in die Gesundheit einer Population geben. Der Wert von Big Data aus Websuchmustern könnte jedoch durch die Kombination mit traditionellen Gesundheitsdatenquellen verbessert werden.

Sozialen Medien

Facebook, Twitter und andere Social-Media-Plattformen generieren rund um die Uhr eine Vielzahl von Daten und geben so einen Überblick über die Standorte, das Gesundheitsverhalten, die Emotionen und die sozialen Interaktionen der Nutzer. Die Anwendung von Big Data aus sozialen Medien auf die öffentliche Gesundheit wurde als digitale Krankheitserkennung oder digitale Epidemiologie bezeichnet. Twitter zum Beispiel wurde verwendet, um Influenza-Epidemien in der Allgemeinbevölkerung zu analysieren.

Das World Well-Being Project, das an der University of Pennsylvania gestartet wurde, ist ein weiteres Beispiel für das Studium von sozialen Medien, um die Erfahrungen und die Gesundheit von Menschen besser zu verstehen. Das Projekt bringt Psychologen, Statistiker und Informatiker zusammen, die die Sprache analysieren, die bei der Online-Interaktion verwendet wird, zum Beispiel beim Schreiben von Status-Updates auf Facebook und Twitter. Wissenschaftler beobachten, wie sich die Sprache der Benutzer auf ihre Gesundheit und ihr Glück bezieht. Fortschritte in der Verarbeitung natürlicher Sprache und maschinelles Lernen helfen bei ihren Bemühungen. Eine kürzlich erschienene Publikation der University of Pennsylvania untersuchte Wege zur Vorhersage von psychischen Erkrankungen durch Analyse von sozialen Medien. Es scheint, dass Symptome von Depression und anderen psychischen Erkrankungen durch das Studium unserer Nutzung des Internets erkannt werden können. Wissenschaftler hoffen, dass diese Methoden in Zukunft in der Lage sein werden, gefährdete Personen besser zu identifizieren und zu unterstützen.

Das Internet der Dinge (IoT)

Massive Fundgruben für gesundheitsbezogene Informationen werden ebenfalls gesammelt und auf mobilen Geräten und zu Hause gespeichert.

Smartphones : Tausende von mHealth-Apps erfassen Informationen über die körperliche Aktivität, die Nahrungsaufnahme, Schlafmuster, Emotionen und andere Parameter des Benutzers. Native Handy-Apps (z. B. GPS, E-Mail, SMS) können auch Hinweise auf den Gesundheitszustand einer Person geben.
Tragbare Monitore und Geräte: Schrittzähler, Beschleunigungsmesser, Brillen, Uhren und Chips, die unter der Haut eingebettet sind, erfassen auch gesundheitsbezogene Informationen und können sie auch in die Cloud senden.
Telemedizin-Geräte ermöglichen es Gesundheitsdienstleistern, Patienten Parameter wie Blutdruck, Herzfrequenz, Atemfrequenz, Sauerstoffversorgung, Temperatur, EKG-Aufzeichnungen und Gewicht zu überwachen.

Finanztransaktionen

Die Kreditkartentransaktionen der Patienten sind in den prädiktiven Modellen von Carolinas HealthCare System enthalten, um Patienten zu identifizieren, bei denen ein hohes Risiko besteht, dass sie ins Krankenhaus eingeliefert werden. Der Gesundheitsdienstleister mit Sitz in Charlotte verwendet große Datenmengen, um Patienten in verschiedene Gruppen einzuteilen, beispielsweise basierend auf Krankheit und geographischer Lage.

Ethische und Datenschutz-Implikationen

Es muss betont werden, dass in einigen Fällen wichtige ethische und datenschutzrechtliche Implikationen bei der Erfassung und dem Zugriff auf Daten im Gesundheitswesen bestehen. Neue Big-Data-Quellen können unser Verständnis darüber verbessern, wie sich die Gesundheit von Personen und der Bevölkerung auswirkt. Verschiedene Risiken müssen jedoch sorgfältig abgewogen und überwacht werden. Es wurde nun auch erkannt, dass Daten, die zuvor als anonym betrachtet wurden, erneut identifiziert werden können. Zum Beispiel hat Professor Latanya Sweeney vom Harvard Data Privacy Lab 1.130 Freiwillige befragt, die am Personal Genome Project beteiligt waren. Sie und ihr Team konnten 42 Prozent der Teilnehmer anhand der Informationen, die sie teilten, richtig benennen (Postleitzahl, Geburtsdatum, Geschlecht). Dieses Wissen kann unser Bewusstsein für potenzielle Risiken erhöhen und uns helfen, bessere Entscheidungen zum Datenaustausch zu treffen.

> Quellen:

> Conway M, O'Connor D. Soziale Medien, Big Data und psychische Gesundheit: aktuelle Fortschritte und ethische Implikationen. Aktuelle Meinung in Psychologie 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Große Daten, größere Ergebnisse. Zeitschrift der American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Erkennen von Depressionen und psychischen Erkrankungen in sozialen Medien: ein integrativer Review . Aktuelle Meinung in Behavioral Sciences 2017; 18: 43-49.

> Lazer D, Kennedy R, König G, Vespignani A. Die Parabel von Google Flu: Traps in der Big Data-Analyse . Wissenschaft 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Big Data Analytics im Gesundheitswesen: Versprechen und Potenzial. Gesundheitsinformation Wissenschaft und Systeme 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifizierung der Teilnehmer am Personal Genome Project by Name . Harvard Universität. Datenschutz Labor Weißbuch 1021-1. 24. April 2013.