bzkf-rwdp-check/README.md

2.9 KiB

BZKF Real World Data Platform - Plausibilitätsprüfung

Anwendung zur Durchführung einer Plausibilitätsprüfung anhand der Daten für die BZKF Real World Data Platform.

Aufbau der ETL-Strecke an den Standorten

Die Daten werden aus der Onkostar-Datenbank ausgelesen und in Apache-Kafka eingespeist. Nach Durchlauf der ETL-Strecke wird das Ergebnis in einer CSV-Datei gespeichert. Diese wird dann (aktuell) manuell in OPAL importiert.

flowchart LR
    A[Database] --> B[Kafka-Connect]
    B --> C[ADT to FHIR]
    C --> D[fhir-pseudonymizer]
    D --> E[obds-fhir-to-opal]
    E -->|CSV-File| F[OPAL]

Ermittelte Kennzahlen

Die Anwendung gibt für die möglichen Quellen der Kennzahlen die Anzahl der Conditions, gruppiert nach ICD-10 Gruppen, aus.

Ausgabe

Kennzahlen aus der CSV-Datei

Vor Veröffentlichung der Daten der CSV-Datei in Opal kann die Anzahl der Conditions, gruppiert nach ICD-10 Gruppen, mit dem Befehl opal-file aus der CSV-Datei gewonnen werden.

bzkf-rwdp-check opal-file --file <Opal-CSV-Datei>.csv

Die Anwendung gibt nun eine Liste der ICD-10-Gruppen mit Anzahl der Conditions aus.

Kennzahlen aus der Onkostar-Datenbank

Die Anzahl der Conditions, gruppiert nach ICD-10-Gruppe, kann auch mit dem Befehl database aus der Onkostar-Datenbank abgerufen werden.

bzkf-rwdp-check database --user me --year 2024

Die Anwendung gibt auch hier eine Liste der ICD-10-Gruppen mit Anzahl der Conditions aus.

Dieser Befehl hat noch weitere Parameter:

Options:
  -D, --database <DATABASE>  Datenbank-Name [default: onkostar]
  -h, --host <HOST>          Datenbank-Host [default: localhost]
  -P, --port <PORT>          Datenbank-Host [default: 3306]
  -p, --password <PASSWORD>  Passwort. Wenn nicht angegeben, wird danach gefragt
  -u, --user <USER>          Benutzername
  -y, --year <YEAR>          Jahr der Diagnose

Export aus der Onkostar-Datenbank

Die Anwendung ist in der Lage, mit dem Befehl export die Spalten

  • pat_id: Patienten-ID (optional über Parameter --pat-id)
  • cond_id: Condition-ID
  • conditiondate: Datum der Diagnose
  • condcodingcode: Der ICD-10-Code der Diagnose

in eine CSV-Datei zum Abgleich mit der OPAL-CSV-Datei zu exportieren.

Hierbei gelten die gleichen Datenbank-Parameter wie unter Kennzahlen aus der Onkostar-Datenbank, zusätzlich gibt es noch die folgenden Parameter:

Options:
      --pat-id               Export mit Klartext-Patienten-ID
  -o, --output <OUTPUT>      Ausgabedatei

Vergleich CSV-Datei für OPAL und Onkostar-Datenbank

Die Anwendung kann auch die Conditions in der CSV-Datei mit der Onkostar-Datenbank direkt vergleichen.

Hierzu kann der Befehl compare genutzt werden. Dieser verwendet alle Optionen für die Datenbank und die Option --file für die CSV-Datei und gibt eine Übersicht auf der Konsole aus.