Healthcare Natural Language API

Die Healthcare Natural Language API ist Teil der Cloud Healthcare API, die Natural Language-Modelle verwendet, um medizinische Informationen aus medizinischem Text zu extrahieren.

In diesem konzeptionellen Leitfaden werden die Grundlagen der Verwendung der Healthcare Natural Language API erläutert. Dazu gehören:

  • Die Anfragentypen, die Sie an die Healthcare Natural Language API senden können
  • Wie Sie Anfragen an die Healthcare Natural Language API erstellen
  • Wie Sie Antworten der Healthcare Natural Language API verwenden

Übersicht

Die Healthcare Natural Language API extrahiert medizinische Informationen aus medizinischen Texten. Dazu gehören:

  • Medizinische Konzepte wie Medikamente, Verfahren und Erkrankungen
  • Funktionale Merkmale wie Zeitbeziehungen, Subjekte und Sicherheitsprüfungen
  • Zusammenhänge wie Nebenwirkungen und Dosierung von Medikamenten

Zwischen der Healthcare Natural Language API und AutoML Entity Extraction for Healthcare wählen

Die Healthcare Natural Language API bietet vortrainierte Natural Language-Modelle, um medizinische Konzepte und Zusammenhänge aus medizinischen Texten zu extrahieren. Die Healthcare Natural Language API ordnet Text verschiedenen vordefinierten medizinischen Wissenskategorien zu.

Mit AutoML Entity Extraction for Healthcare können Sie ein benutzerdefiniertes Modell zur Entitätsextraktion erstellen, das mit Ihren eigenen annotierten medizinischen Texten und Ihren eigenen Kategorien trainiert wurde. Weitere Informationen finden Sie in der AutoML Entity Extraction for Healthcare-Dokumentation.

Verfügbare Standorte

Die Healthcare Natural Language API ist in den folgenden Ländern verfügbar:

Standortname Standortbeschreibung
asia-south1 Mumbai, Indien
australia-southeast1 Sydney, Australien
europe-west2 London, Großbritannien
europe-west4 Niederlande
northamerica-northeast1 Montreal, Kanada
us-central1 Iowa, USA

Merkmale der Healthcare Natural Language API

Die Healthcare Natural Language API untersucht medizinische Texte auf medizinische Konzepte und Beziehungen. Sie führen eine Entitätsanalyse mit der Methode analyzeEntities durch.

Anfragen für die Entitätsanalyse

Die Healthcare Natural Language API ist eine REST API und besteht aus JSON-Anfragen und -Antworten. In den folgenden Abschnitten wird gezeigt, wie Sie verschiedene medizinische Erkenntnisse aus einem bestimmten medizinischen Text extrahieren:

Die Anfrage für die Entitätsanalyse enthält die folgenden Felder:

Antwortfelder der Entitätsanalyse

Die Entitätsanalyse gibt eine Reihe von erkannten Erwähnungen von medizinischem Wissen, medizinischen Konzepten und Zusammenhängen zwischen Erwähnungen von medizinischem Wissen zurück, darunter:

  • entityMentions: Vorkommen von medizinischen Wissensentitäten im medizinischen Quelltext. Jede Entitätserwähnung hat die folgenden Felder:

    • mentionId: eine eindeutige ID für eine Entität, die in der Antwort erwähnt wird.
    • type: die medizinische Wissenskategorie der Entitätserwähnung.
    • text: besteht aus dem Feld textContent, das den Auszug des medizinischen Textes beschreibt, der die Erwähnung der Entität enthält, und offset, dem Ort der Erwähnung der Entität im medizinischen Quelltext.
    • temporalAssessment gibt an, wie sich die verknüpfte Entität auf die Entitätserwähnung bezieht, entweder CURRENT, CLINICAL_HISTORY, FAMILY_HISTORY, UPCOMING oder OTHER.
    • certaintyAssessment: die Negation oder Qualifikation des medizinischen Konzepts, entweder LIKELY, SOMEWHAT_LIKELY, UNCERTAIN, SOMEWHAT_UNLIKELY, UNLIKELY oder CONDITIONAL.
    • subject: Gibt das Thema an, auf das sich das medizinische Konzept bezieht, entweder PATIENT, FAMILY_MEMBER oder OTHER.
    • linkedEntities: Eine Liste medizinischer Konzepte, die mit dieser Entitätserwähnung in Beziehung stehen könnten. Verknüpfte Entitäten geben die entityId an, die ein medizinisches Konzept mit einer Entität in entities verknüpft.
  • entities: Beschreibt die medizinischen Konzepte der verknüpften Entitätsfelder. Jede Entität wird mithilfe der folgenden Felder beschrieben:

    • entityId: eine eindeutige Kennung aus dem Feld linkedEntities.
    • preferredTerm: ein bevorzugter Begriff für das medizinische Konzept.
    • vocabularyCodes: die Darstellung des medizinischen Konzepts im unterstützten medizinischen Vokabular.
  • relationships: definiert gerichtete Beziehungen zwischen Entitätserwähnungen. Im Beispiel ist das Subjekt der Beziehung „Insulin regimen human“ und das Objekt der Beziehung ist „5 units“.

  • confidence: ein Hinweis auf die Zuverlässigkeit des Modells in der Beziehung als Zahl zwischen 0 und 1.

Neben den aufgeführten Feldern kann die Antwort auch das Feld additionalInfo enthalten, in dem eine zusätzliche Beschreibung des Typs der Erwähnung der Entität angegeben wird. Weitere Informationen

Unterstützte Sprachen

Die Healthcare Natural Language API unterstützt ausschließlich das Extrahieren von Gesundheitsdaten aus englischem Text.

Unterstütztes medizinisches Vokabular

Die Healthcare Natural Language API unterstützt das folgende medizinische Vokabular:

  • Foundational Model of Anatomy
  • Gene Ontology
  • HUGO Gene Nomenclature Committee
  • Human Phenotype Ontology
  • ICD-10 Procedure Coding System
  • ICD-10-CM
  • ICD-9-CM
  • LOINC
  • MeSH
  • MedlinePlus-Gesundheitsthemen
  • Metathesaurus Names
  • NCBI Taxonomy
  • NCI Thesaurus
  • National Drug File
  • Online Mendelian Inheritance in Man
  • RXNORM
  • SNOMED CT (nur für US-Nutzer verfügbar)

Unterstützte medizinische Wissenskategorien

Die Healthcare Natural Language API weist dem Feld entityMentions.type eine medizinische Wissenskategorie zu. Im Folgenden finden Sie eine Liste der unterstützten medizinischen Wissenskategorien. Die Typen von Erwähnungen von Einheiten, die zu den Gruppen „Onkologie“, „Soziale Determinanten der Gesundheit“ (Social Determinants of Health, SDOH) und „Geschützte Gesundheitsdaten“ (Protected Health Information, PHI) gehören, sind nur in der Vorschau verfügbar:

Gruppe Medizinische Wissenskategorie Beschreibung
Allgemein ANATOMICAL_STRUCTURE Ein komplexer Teil des menschlichen Körpers, z. B. Zellen, Organe und Systeme.
BODY_FUNCTION Eine vom menschlichen Körper ausgeführte Funktion.
BF_RESULT Das Ergebnis einer Körperfunktion.
BODY_MEASUREMENT Eine normale Messung des menschlichen Körpers, z. B. ein Lebenszeichen, die ohne komplexe Tests oder Verfahren mit einfachen Instrumenten wie einem Thermometer oder einem Stethoskop durchgeführt wird.
BM_RESULT Das Ergebnis einer Körpermessung.
BM_UNIT Die Einheit für eine Körpermessung.
BM_VALUE Der Wert einer Körpermessung.
LABORATORY_DATA Die Ergebnisse eines Tests einer Körperprobe.
LAB_RESULT Eine qualitative Beschreibung von Labordaten, z. B. „erhöht“, „niedrig“, „positiv“ oder „negativ“.
LAB_VALUE Der Wert einer Instanz der Labordaten.
LAB_UNIT Die Maßeinheit für den Laborwert.
MEDICAL_DEVICE Ein physisches oder virtuelles Instrument.
MEDICINE Ein Medikament oder eine andere Zubereitung zur Behandlung oder Prävention einer Krankheit.
MED_DOSE Eine Dosis eines Medikaments.
MED_DURATION Der Zeitraum, in dem ein Medikament verabreicht wird.
MED_FORM Die Darreichungsform eines bestimmten Medikaments.
MED_FREQUENCY Die Häufigkeit, mit der ein Medikament eingenommen wird.
MED_ROUTE Eine Stelle im Körper, an der ein Medikament verabreicht wird.
MED_STATUS Der Status eines bestehenden Medikaments, z. B. „Fortfahren“, „Start“, „Neustart“, „Beenden“, „Wechseln“, „Erhöhen“ oder „Reduzieren“.
MED_STRENGTH Die Menge des Wirkstoffs in einer Dosis eines Medikaments.
MED_UNIT Die Maßeinheit für den Wirkstoff in einem Medikament.
MED_TOTALDOSE Die Menge des Medikaments, die auf einmal eingenommen werden soll.
PROBLEM Eine medizinische Erkrankung, einschließlich Befunden und Krankheiten.
PROCEDURE Ein Diagnose- oder Behandlungsverfahren.
PROCEDURE_RESULT Die Ergebnisse eines Verfahrens.
PROC_METHOD Die Methode, mit der ein Verfahren durchgeführt wird.
SEVERITY Der Schweregrad der Erkrankung.
SUBSTANCE_ABUSE Eine Beschreibung des Missbrauchs einer psychoaktiven Substanz.
Onkologie (Vorabversion) CLINICAL_STATUS Der Status eines Krebsfalls, z. B. „aktiv“, „wiederkehrend“, „rückfällig“ und „abgeheilt“.
DATE Eine Datumsanmerkung, z. B. das Datum der Diagnose, des Eingriffs oder der Strahlentherapie. Es werden alle Elemente eines Datums extrahiert, das Jahr ist möglicherweise nicht enthalten.
DIMENSIONS Die Abmessungen eines Tumors, einer Masse oder eines abnormalen Wachstums.
GENE_STUDIED Die untersuchten Gene, die direkt oder indirekt zur Tumorbildung führen, z. B. BRCA1, p53 und ALK.
HISTOLOGICAL_GRADE Ein Klassifizierungssystem zur Einstufung des Erscheinungsbilds einer Krebszelle.
LAB_SPECIMEN Biologisches Material, das zum Testen oder für Proben aus dem Körper entnommen wird.
RADIATION_DOSAGE Die Menge an Strahlung, die einem Patienten verabreicht wird.
ONSET Eine Datumsanmerkung, die das Datum angibt, an dem ein Patient zum ersten Mal krebsbedingte Probleme beobachtet hat.
VARIATION_CODE Ein Code, der der spezifischen genomischen Variante zugewiesen wird, die unter einem wichtigen Codierungssystem wie ClinVar und HGVS erkannt wird.
Soziale Determinanten der Gesundheit (SDoH) (Vorabversion) AGE Eine Alterskennzeichnung. Dazu gehören Formulierungen, die das Alter beschreiben, z. B. „sieht jünger aus als angegeben“, „mittleren Alters“, „78 Jahre alt“ oder „Teenager“.

Hinweis: Gemäß HIPAA wird das Alter einer Person nur dann als PHI klassifiziert, wenn es über 90 Jahre liegt. Weitere Informationen finden Sie unter Zusammenfassung der HIPAA-Datenschutzregel.

FAMILY Formulierungen, die die Familienstruktur oder Verwandte des Patienten beschreiben, z. B. „verheiratet mit zwei Kindern“, „Bruder“, „Ehefrau“, „unterstützende Eltern“ oder „geschieden“.
LIVING_SITUATION Formulierungen, die die Wohnsituation des Patienten beschreiben, z. B. „mit Mitbewohnern“, „hat eine 24/7-Krankenschwester“ oder „ist vor Kurzem umgezogen“.
SOCIAL_IDENTITY Formulierungen, die die soziale Identität des Patienten oder der Familie beschreiben, einschließlich ethnischer Zugehörigkeit, sexueller Orientierung, Religion, Nationalität, gesprochener oder nicht gesprochener Sprachen oder Herkunftsland.
PHYSICAL_APPEARANCE Formulierungen, die das auffälligste oder offensichtlichste körperliche Merkmal des Patienten oder der Familie beschreiben, z. B. „Narbe auf der rechten Wange“, „Down-Syndrom“, „übergewichtig“ oder „linkes Bein amputiert“.
OCCUPATION Formulierungen, die den Beruf und den Beschäftigungsstatus des Patienten oder der Familie beschreiben, z. B. „Rentnerin“, „20 Jahre als Schweißer gearbeitet“ oder „letztes Jahr den Job verloren“.
Geschützte Gesundheitsdaten (Protected Health Information, PHI) (Vorabversion) PERSON_NAME Eine generische Namenskennung für eine Person. Enthält Titel wie „Dr.“ „Frau“ oder „Dr.“
ORGANIZATION_NAME Eine Kennung für eine medizinische Organisation, die vertrauliche Gesundheitsinformationen erhebt, z. B. eine Klinik, ein Pflegeheim oder ein Krankenhaus.
GENERIC_ID Eine allgemeine ID zur Identifizierung von Krankenakten, Patienten, Ärzten oder Krankenhäusern, z. B. die Sozialversicherungsnummer des Patienten oder die Nummer eines Gesundheitsdienstleisters.
LOCATION Ein geografischer Ort, der Namen und Nummern für Gebäude, Straßen, Städte, Bundesstaaten oder Postleitzahlen enthalten kann.
PHONE_NUMBER Eine Nummer, die eine Telefon-, Fax- oder Pager-Nummer angibt.
EMAIL_ADDRESS Eine E‑Mail-Adressenkennung.
URL Die Adresse einer Website.
ZIPCODE Eine Postleitzahl-ID.

Unterstützte funktionale Funktionskategorien

Die Healthcare Natural Language API kann funktionale Funktionen oder Attribute einer Entität aus Kontext ableiten. In der Anweisung "Kusumas Mutter hat Diabetes" hat die Bedingung "Diabetes" beispielsweise die funktionale Funktion subject FAMILY_MEMBER.

Temporäre Beziehungen

Temporäre Beziehungen, die im Feld temporalAssessment zurückgegeben werden, beschreiben, wie diese erwähnte Entität zum Subjekt temporär in Beziehung steht.

Die Healthcare Natural Language API unterstützt die folgenden temporären Beziehungen:

  • CURRENT
  • CLINICAL_HISTORY
  • FAMILY_HISTORY
  • UPCOMING
  • OTHER

Betreffzeilen

Betreffzeilen, die im Feld subject zurückgegeben werden, beschreiben die Person, auf die sich die Entität bezieht.

Die Healthcare Natural Language API unterstützt die folgenden Subjekte:

  • PATIENT
  • FAMILY_MEMBER
  • OTHER

Wahrscheinlichkeitsbewertungen

Wahrscheinlichkeitsbewertungen, die im Feld certaintyAssessment zurückgegeben werden, beschreiben die Vertrauenswürdigkeit des Erstellers der Originalnotiz. Wenn die Originalnotiz beispielsweise "Der Patienten hat Halsschmerzen" enthält, gibt die Bewertung einen LIKELY-Wert zurück, der angibt, dass der Notizenersteller es für wahrscheinlich hält, dass der Patient Halsschmerzen hatte. Wenn die Originalnotiz "Der Patienten hat keine Halsschmerzen" enthält, gibt die Bewertung einen UNLIKELY-Wert zurück, der angibt, dass der Notizenersteller es für unwahrscheinlich hält, dass der Patient Halsschmerzen hatte.

Wahrscheinlichkeitsbewertungen können folgende Werte sein:

  • LIKELY
  • SOMEWHAT_LIKELY
  • UNCERTAIN
  • SOMEWHAT_UNLIKELY
  • UNLIKELY
  • CONDITIONAL

Weitere Informationen

Das Feld additionalInfo enthält zusätzliche Details zu einer Erwähnung einer Rechtspersönlichkeit. Das Feld additionalInfo für eine DATE-Entitätserwähnung kann beispielsweise Details zum Typ des Datums enthalten, die in eine der folgenden Kategorien eingeteilt werden:

  • ADMISSION_DATE
  • CONSULTATION_DATE
  • DISCHARGE_DATE
  • SERVICE_DATE
  • VISIT_DATE
  • DIAGNOSIS_DATE
  • MED_STARTED_DATE
  • MED_ENDED_DATE
  • NOTE_DATE
  • PROCEDURE_DATE
  • RADIATION_STARTED_DATE
  • RADIATION_ENDED_DATE
  • STAGE_DATE

Unterstützte Beziehungen zwischen Entitätserwähnungen

Die Healthcare Natural Language API kann Beziehungen zwischen Entitätserwähnungen basierend auf dem umgebenden medizinischen Text ableiten. In der Antwort wird das Subjekt der Beziehung durch subjectId und das Objekt der Beziehung durch objectId angegeben.

Die Healthcare Natural Language API unterstützt die folgenden Beziehungen zwischen Entitätserwähnungen:

Betreff Objekt
ANATOMICAL_STRUCTURE MEDICAL_DEVICE
BODY_FUNCTION BF_RESULT
BODY_MEASUREMENT BM_RESULT
BODY_MEASUREMENT BM_UNIT
BODY_MEASUREMENT BM_VALUE
LABORATORY_DATA LAB_RESULT
LABORATORY_DATA LAB_UNIT
LABORATORY_DATA LAB_VALUE
MEDICINE MED_DOSE
MEDICINE MED_DURATION
MEDICINE MED_FORM
MEDICINE MED_FREQUENCY
MEDICINE MED_ROUTE
MEDICINE MED_STATUS
MEDICINE MED_STRENGTH
MEDICINE MED_TOTALDOSE
MEDICINE MED_UNIT
PROBLEM ANATOMICAL_STRUCTURE
PROBLEM MEDICINE
PROBLEM PROCEDURE
PROBLEM SEVERITY
PROCEDURE ANATOMICAL_STRUCTURE
PROCEDURE PROC_METHOD
PROCEDURE PROCEDURE_RESULT
SUBSTANCE_ABUSE SEVERITY

Ausgabe der Healthcare Natural Language API als FHIR-Bundle

Wenn Sie die Methode analyzeEntities mit dem Feld alternativeOutputFormat auf FHIR_BUNDLE festlegen, enthält die Antwort die folgenden JSON-Objekte:

  • Die Entitätserwähnungen, die Entitäten und die Beziehungen
  • Ein FHIR R4-Bundle, das als String dargestellt wird und alle Entitäten, Erwähnungen von Entitäten und Beziehungen im JSON-Format enthält.

Zum Erstellen des FHIR R4-Bundles werden die Entitätserwähnungen, Entitäten und Beziehungen von der Healthcare Natural Language API FHIR-Ressourcen und deren Elementen zugeordnet. In der folgenden Tabelle sind einige dieser Zuordnungen aufgeführt.

Entitätserwähnungen in der Healthcare Natural Language API Medizinische Wissenskategorie FHIR R4-Ressourcen und -Elemente
PROBLEM Condition
PROBLEM Condition.category
PROBLEM Condition.status
PROBLEM ANATOMICAL_STRUCTURE Condition.bodySite
PROBLEM ANATOMICAL_STRUCTURE Condition.evidence
PROBLEM SEVERITY Condition.severity
PROCEDURE Procedure
PROCEDURE Procedure.status
PROCEDURE Procedure.code
PROCEDURE ANATOMICAL_STRUCTURE Procedure.bodySite
PROCEDURE MEDICAL_DEVICE Procedure.usedCode
PROCEDURE PROBLEM Procedure.reasonReference
MEDICINE MedicationStatement
MEDICINE MedicationStatement.status
MEDICINE MedicationStatement.medication
MEDICINE PROBLEM MedicationStatement.reasonReference
MEDICINE MED_DOSE MedicationStatement.dosage.doseAndRate.doseQuantity
MEDICINE MED_FREQUENCY MedicationStatement.dosage.text
MEDICINE MED_ROUTE MedicationStatement.dosage.route
MEDICINE MED_STRENGTH MedicationStatement.dosage.doseAndRate.doseQuantity
MEDICINE MED_UNIT MedicationStatement.dosage.doseAndRate.doseQuantity

Informationen zum Extrahieren von Entitäten aus Text als FHIR R4-Bundle finden Sie unter Ausgabe als FHIR R4-Bundle extrahieren.