Mit dem Pilot der Kosten- und Leistungsstatistik (KoLe) des Bundesamts für Gesundheit (BAG) wurden die Grundlagen geschaffen für eine definitive Einführung der Statistik zur Umsetzung des 2009 in Kraft tretenden, revidierten, gesetzlichen Auftrags gemäss dem Krankenversicherungsgesetz(KVG), Art. 21 und der Krankenversicherungsverordnung (KVV) Art. 28 ff.
Im Rahmen von KoLe wurden anonymisierte Individualdaten der obligatorischen Krankenversicherung (für die Jahre 2005 bis 2008) mit dem Beitrag von drei Krankenversicherungen erhoben, dies mit dem Ziel die Aussagekraft von Routinedaten der Krankenversicherung anhand ausgewählten Forschungsfragen zu evaluieren. In diesem Zusammenhang stellen sich Fragen zur Repräsentativität und Aussagekraft besonders wenn die Analysen auf Teilerhebungen basieren.
So wurde eine generische Repräsentativitätsfunktion erstellt, welche die Repräsentativität der KoLe Datenbank anhand geeigneter statistischer Verfahren in Bezug auf bestimmte Auswahlkriterien gewährleistet. Zu diese Zweck wurde ein allgemeines R-Package erstellt, das die Stichprobe sowohl in Bezug auf Auswahlkriterien, als auch auf selektierte Gütekriterien, z.B. die Grösse der Stichprobe oder der maximale Stichprobenfehler konfigurierbar ist. Der Ansatz einer generischen Repräsentativitätsfunktion ermöglicht es zudem, das Verfahren in einem Datawarehouse-Prozess leicht einzugliedern und die Auswertungsinfrastruktur gezielt in Grösse und Datenumfang zu minimieren, und wissend, dass auch bei Vollerhebungen, ein kleiner Anteil an fehlenden Daten, ernsthafte Repräsentativitätsprobleme darstellen kann.