Zielsetzung und Wirkung des Vertrags
Mit der Medizinischen Statistik, die seit 1998 gesamtschweizerisch erhoben wird, steht eine Datenquelle zur Verfügung, welche die von den Spitälern erbrachten stationären und teilstationären Leistungen auf systematische Art und Weise abbildet. Nach einer Konsolidierungsphase in den ersten Durchführungsjahren der Erhebung sind die Daten inzwischen von relativ guter Qualität. Trotzdem weiss man aus verschiedenen in- und ausländischen Untersuchungen, dass bei einer eingehenden Prüfung der Angaben durch Experten der medizinischen Codierung (je nach Quelle) regelmässig zwischen 5 und 20% der Fälle beanstandet werden.
Die bisherige Validierung der Daten erfolgt mittels Integritätsprüfung und der Gegenüberstellung der Angaben einzelner Felder. Die Prüfung erfolgt also regelgestützt aufgrund eines Plausibilitätskonzeptes und einer Prüfsoftware (MedPlaus). Es wird nun aber, infolge der permutierenden Abhängigkeiten der Variablen, zunehmend schwierig, diese regelgestützten Vorschriften weiterzuentwickeln und zu warten. Angesichts der grossen Datenmengen ist aber eine automatisierte Verarbeitung der Daten eine absolute Voraussetzung.
Einen wichtigen Beitrag zu dieser Problematik könnte eine datengestützten Validierung liefern, bei der die in der grossen Masse der Daten in Form von „impliziten Regeln“ liegenden Gesetzmässigkeiten genutzt werden. In dieser – statistischen – Betrachtungsweise zeigen sich Fehler als „multivariate Ausreisser“ und könnten als „verdächtigen Beobachtungen“ qualifiziert werden. Die Fehlersuche wird in der statistischen Betrachtung zu einer Ausreisseranalyse. Auf diese Weise kann auch die Konformität der Daten insgesamt, etwa eines ganzen Spitals, beurteilt bzw. als Mass „ex post“ für die Qualität der gelieferten Daten. bezeichnet werden
Die Absicht der Datenvalidierung durch statistische Methoden besteht darin, anhand der Zusammensetzung der verschiedenen Variablen Aussagen zu machen, ob ein Datensatz potentiell falsch sein könnte ("suspekt"). Dies anhand der kombinierten Verteilungen der Variablen, daten- und nicht regelgesteuert. Bestehende Daten können als Referenz genutzt werden.
Dieser Ansatz wurde in Österreich schon für die Plausibiliserung in den Spitälern angewendet, mit viel versprechenden Resultaten. Methodisch entspricht der österreichische Ansatz jedoch nicht einem streng multivariaten System, sondern eher einer multiplen univariaten Merkmalskombination. Im Rahmen einer Diplomarbeit am ZHW wurde das System überprüft und weiterentwickelt. Die Resultate sind sehr interessant, insbesondere bei Verwendung des so genannten multinomialen Ansatzes.