# BZKF Real World Data Platform - Plausibilitätsprüfung Anwendung zur Durchführung einer Plausibilitätsprüfung anhand der Daten für die BZKF Real World Data Platform. ## Aufbau der ETL-Strecke an den Standorten Die Daten werden aus der Onkostar-Datenbank ausgelesen und in Apache-Kafka eingespeist. Nach Durchlauf der ETL-Strecke wird das Ergebnis in einer CSV-Datei gespeichert. Diese wird dann (aktuell) manuell in OPAL importiert. ```mermaid flowchart LR A[Database] --> B[Kafka-Connect] B --> C[ADT to FHIR] C --> D[fhir-pseudonymizer] D --> E[obds-fhir-to-opal] E -->|CSV-File| F[OPAL] ``` ## Prüfung der Daten in der CSV-Datei Vor Veröffentlichung der Daten der CSV-Datei in Opal kann die Anzahl der _Conditions_, gruppiert nach ICD-10 Gruppen, mit dem Befehl `opal-file` aus der CSV-Datei gewonnen werden. ``` bzkf-rwdp-check opal-file --file .csv ``` Die Anwendung gibt nun eine Liste der ICD-10-Gruppen mit Anzahl der _Conditions_ aus.