# BZKF Real World Data Platform - Plausibilitätsprüfung Anwendung zur Durchführung einer Plausibilitätsprüfung anhand der Daten für die BZKF Real World Data Platform. ## Aufbau der ETL-Strecke an den Standorten Die Daten werden aus der Onkostar-Datenbank ausgelesen und in Apache-Kafka eingespeist. Nach Durchlauf der ETL-Strecke wird das Ergebnis in einer CSV-Datei gespeichert. Diese wird dann (aktuell) manuell in OPAL importiert. ```mermaid flowchart LR A[Database] --> B[Kafka-Connect] B --> C[ADT to FHIR] C --> D[fhir-pseudonymizer] D --> E[obds-fhir-to-opal] E -->|CSV-File| F[OPAL] ``` ## Kennzahlen aus der CSV-Datei Vor Veröffentlichung der Daten der CSV-Datei in Opal kann die Anzahl der _Conditions_, gruppiert nach ICD-10 Gruppen, mit dem Befehl `opal-file` aus der CSV-Datei gewonnen werden. ``` bzkf-rwdp-check opal-file --file .csv ``` Die Anwendung gibt nun eine Liste der ICD-10-Gruppen mit Anzahl der _Conditions_ aus. ## Kennzahlen aus der Onkostar-Datenbank Die Anzahl der _Conditions_, gruppiert nach ICD-10-Gruppe, kann auch mit dem Befehl `database` aus der Onkostar-Datenbank abgerufen werden. ``` bzkf-rwdp-check database --user me --year 2024 ``` Die Anwendung gibt auch hier eine Liste der ICD-10-Gruppen mit Anzahl der _Conditions_ aus. Dieser Befehl hat noch weitere Parameter: ``` Options: -D, --database Datenbank-Name [default: onkostar] -h, --host Datenbank-Host [default: localhost] -P, --port Datenbank-Host [default: 3306] -p, --password Passwort. Wenn nicht angegeben, wird danach gefragt -u, --user Benutzername -y, --year Jahr der Diagnose ```