ServicenavigationHauptnavigationTrailKarteikarten


Forschungsstelle
BAG
Projektnummer
05.002766
Projekttitel
Datenvalidierung mit statistischen Methoden

Texte zu diesem Projekt

 DeutschFranzösischItalienischEnglisch
Schlüsselwörter
Anzeigen
-
-
-
Kurzbeschreibung
Anzeigen
-
-
-
Projektziele
Anzeigen
-
-
-
Abstract
Anzeigen
-
-
-
Umsetzung und Anwendungen
Anzeigen
-
-
-
Publikationen / Ergebnisse
Anzeigen
-
-
-

Erfasste Texte


KategorieText
Schlüsselwörter
(Deutsch)

Datenqualität

Datengesteuert

Outlyer Analyse

Kurzbeschreibung
(Deutsch)

Auftragsumschreibung

 

Basierend auf den Vorarbeiten in Österreich und der erwähnten Diplomarbeit der ZHW soll ein Verfahren zur Datenvalidierung mit statistischen Methoden entwickelt werden. Eine mögliche Anwendung ist, die Daten der Medizinischen Statistik in Nachhinein (ex post) auf ihre Plausibilität zu bewerten, also eine Art Qualitätsindikator für die Konformität der Datensätze zu entwickeln. Als Benchmark zur Messung der Gültigkeit der Resultate kann dem probabilistischen Ansatz ein regelgesteuerter Ansatz (MedPlaus) gegenübergestellt werden.

Projektziele
(Deutsch)

Zielsetzung und Wirkung des Vertrags

 

Mit der Medizinischen Statistik, die seit 1998 gesamtschweizerisch erhoben wird, steht eine Datenquelle zur Verfügung, welche die von den Spitälern erbrachten stationären und teilstationären Leistungen auf systematische Art und Weise abbildet. Nach einer Konsolidierungsphase in den ersten Durchführungsjahren der Erhebung sind die Daten inzwischen von relativ guter Qualität. Trotzdem weiss man aus verschiedenen in- und ausländischen Untersuchungen, dass bei einer eingehenden Prüfung der Angaben durch Experten der medizinischen Codierung (je nach Quelle) regelmässig zwischen 5 und 20% der Fälle beanstandet werden.

Die bisherige Validierung der Daten erfolgt mittels Integritätsprüfung und der Gegenüberstellung der Angaben einzelner Felder. Die Prüfung erfolgt also regelgestützt aufgrund eines Plausibilitätskonzeptes und einer Prüfsoftware (MedPlaus). Es wird nun aber, infolge der permutierenden Abhängigkeiten der Variablen, zunehmend schwierig, diese regelgestützten Vorschriften weiterzuentwickeln und zu warten. Angesichts der grossen Datenmengen ist aber eine automatisierte Verarbeitung der Daten eine absolute Voraussetzung.

Einen wichtigen Beitrag zu dieser Problematik könnte eine datengestützten Validierung liefern, bei der die in der grossen Masse der Daten in Form von „impliziten Regeln“ liegenden Gesetzmässigkeiten genutzt werden. In dieser – statistischen – Betrachtungsweise zeigen sich Fehler als „multivariate Ausreisser“ und könnten als „verdächtigen Beobachtungen“ qualifiziert werden. Die Fehlersuche wird in der statistischen Betrachtung zu einer Ausreisseranalyse. Auf diese Weise kann auch die Konformität der Daten insgesamt, etwa eines ganzen Spitals, beurteilt bzw. als Mass „ex post“ für die Qualität der gelieferten Daten. bezeichnet werden

Die Absicht der Datenvalidierung durch statistische Methoden besteht darin, anhand der Zusammensetzung der verschiedenen Variablen Aussagen zu machen, ob ein Datensatz potentiell falsch sein könnte ("suspekt"). Dies anhand der kombinierten Verteilungen der Variablen, daten- und nicht regelgesteuert. Bestehende Daten können als Referenz genutzt werden.

 

Dieser Ansatz wurde in Österreich schon für die Plausibiliserung in den Spitälern angewendet, mit viel versprechenden Resultaten[1]. Methodisch entspricht der österreichische Ansatz jedoch nicht einem streng multivariaten System, sondern eher einer multiplen univariaten Merkmalskombination. Im Rahmen einer Diplomarbeit am ZHW wurde das System überprüft und weiterentwickelt. Die Resultate sind sehr interessant, insbesondere bei Verwendung des so genannten multinomialen Ansatzes.



[1] Documentation, Data Quality and Continuous Observation of the Hospital Sector, Karl P. Pfeiffer,  The Austrian-LKF-Team, PCSE 2002, (http:// www .pcse.org/articles/index.asp?id=168)
Nur noch verfügbar im Web-Archiv: http://web.archive.org/web/20061007091948/http://www.pcse.org/articles/index.asp?id=168

Abstract
(Deutsch)
nicht verfügbar
Umsetzung und Anwendungen
(Deutsch)
nicht verfügbar
Publikationen / Ergebnisse
(Deutsch)
nicht verfügbar