ServicenavigationHauptnavigationTrailKarteikarten


Forschungsstelle
ASTRA SBT
Projektnummer
SVI2004/014
Projekttitel
Neue Erkenntnisse zum Mobilitätsverhalten dank Data Mining

Texte zu diesem Projekt

 DeutschFranzösischItalienischEnglisch
Schlüsselwörter
Anzeigen
-
-
Anzeigen
Forschungsprogramme
Anzeigen
-
-
-
Kurzbeschreibung
Anzeigen
-
-
Anzeigen
Projektbeschreibung
Anzeigen
-
-
-
Methoden
Anzeigen
-
-
-
Spezielle Geräte und Installationen
Anzeigen
-
-
-
Allgemeiner Stand der Forschung
Anzeigen
-
-
-
Projektziele
Anzeigen
-
-
Anzeigen
Umsetzung und Anwendungen
Anzeigen
-
-
-
Berichtsnummer
Anzeigen
-
-
-
Literatur
Anzeigen
-
-
-

Erfasste Texte


KategorieText
Schlüsselwörter
(Deutsch)

Verkehrsplanung, Verkehrsverhalten, Verhaltensmuster, Statistische Datenanalyse, Data Mining

Schlüsselwörter
(Englisch)

Transportation Planning, Travel Behaviour, Behaviour Patterns, Statistical Data Analysis, Data Mining

Forschungsprogramme
(Deutsch)

Es sind die folgenden Arbeitsschritte vorgesehen:

  • Definition von Data Mining
  • Phasen des Data Mining Prozesses und ihre Bedeutung
  • Data Mining Methoden
  • Praktische Anwendung von Data Mining
  • Beurteilung der Eignung von Data Mining in der Verkehrsplanung
  • Data Mining Software
  • Empfehlungen zur Anwendung von Data Mining in der Verkehrsplanung
Der Zeitbedarf beträgt 12 Monate
Kurzbeschreibung
(Deutsch)
Als Grundlage für die Verkehrsplanung werden umfangreiche Datenmengen erhoben. Beispiele sind die Mikrozensen Verkehr, die KEP-Erhebungen der SBB, Befragungen von Haushalten und Einzelpersonen zum tatsächlichen (Revealed Preference Erhebungen) oder zum antizipierten Verkehrsverhalten (Stated Preference Erhebungen). Mit konventionellen statistischen Methoden lassen sich aus diesen Datensätzen wertvolle Erklärungsmuster und -modelle für das Mobilitätsverhalten finden. Diese sind aber bekanntermassen nicht vollständig. In den gesammelten Verkehrsdaten stecken vermutlich weitere, mit den bisherigen Auswertungsmethoden unentdeckt gebliebene Informationen, welche zu einem vertieften Verständnis des Mobilitätsverhaltens wichtig sind und beispielsweise auch zu einer Verbesserung der Verkehrsmodelle beitragen können. Die oben erwähnten Datenerhebungen sind mit grossem Aufwand verbunden. Es lohnt sich also, die gesammelten Daten mit speziellen Methoden nach weiteren relevanten Informationen abzusuchen ("die Zitrone vollständig auszupressen"). Data Mining hat sich als Methode für explorative Untersuchungen grosser Datenmengen etabliert, wurde aber bisher in der Verkehrsplanung wenig eingesetzt. Mit diesem Forschungsprojekt sollen die Möglichkeiten und Grenzen von Data Mining als Hilfsmittel in der Verkehrsplanung ausgelotet und der praktisch tätige Verkehrsingenieur mit dem Prozess von Data Mining vertraut gemacht werden. Dazu werden der Prozess des Data Mining und die für Anwendung in der Verkehrsplanung geeigneten Methoden beschrieben. Am Beispiel von drei vorhandenen, umfangreichen Datensätzen aus der Verkehrsplanung wird die praktische Anwendung von Data Mining demonstriert und darauf basierend die Eignung von Data Mining in der Verkehrsplanung beurteilt. Für die Beurteilung von Data Mining Software wird ein Leitfaden erstellt und es werden Empfehlungen für die praktische Anwendung von Data Mining in der Verkehrsplanung formuliert
Kurzbeschreibung
(Englisch)

For transportation planning purposes huge amounts of mobility data are collected, such as the Swiss micro census in traffic, investigations of the Swiss railway companies on passenger frequencies, as well as surveys monitoring the actual (revealed preference) or the anticipated (stated preference) travel behaviour. Conventional statistical data analysis techniques were (and are) employed to exploit these data. While valuable patterns could be found and useful conclusions were drawn, it is well known that they were far from complete.

It is a fact that traffic survey data contain features that remain hidden to traditional data analysis, but which could substantially improve the comprehension of mobility patterns and improve model-based transportation forecasting. As running these surveys is expensive, time consuming and labour intensive, it will well pay off to use modern data mining techniques that allow for exploiting such data to the full extent, i.e. it is worthwhile to fully squeeze the lemon.

Data mining, while in many disciplines being a well established means of extracting information from large amounts of data, has not yet made it into the toolbox of the (Swiss) transportation planner. The aim of this project is to explore the prospects and limits of data mining for practical application in the field of transportation planning, as well as to acquaint the engineer with this novel approach.

The focus is on a process-oriented view of data mining, as well as on techniques deemed suitable for applications in transportation planning. We will exemplify and illustrate the theory on three large, traffic-related survey datasets, from where conclusions on the suitability of data mining for every day use in the field of transportation planning will be drawn. Moreover, we will establish guidelines for the choice and evaluation of data mining software, as well as a recipe on how to optimally attack data mining projects in transportation planning.
Projektbeschreibung
(Deutsch)

Das Vorgehen gliedert sich in die folgenden Arbeitsschritte:

Definition von Data Mining
Die in der Literatur zu findenden Beschreibungen von Data Mining werden zu einer einheitlichen Definition verdichtet. Grundsätzlich ist unter Data Mining ein durch den Anwender gesteuerter, standardisierter Prozess, durch welchen aus grossen Datenmengen Informationen gewonnen und Folgerungen gezogen werden.

Phasen des Data Mining Prozesses und ihre Bedeutung
Es wird der "klassische" Data Mining Prozess von CRISP (Cross Industry Standard Process for Data Mining) beschrieben und praxisorientiert, als Guideline für den Verkehrsplaner, vorgestellt. Zentral ist das Verständnis von Data Mining als iterativer, "lernender" Prozess, in dessen Zentrum die zu analysierenden Daten stehen.

Data Mining Methoden
Inhalt dieses Arbeitsschrittes ist eine auf den praktisch tätigen Verkehrsplaner ausgerichtete Einführung in die analytischen Methoden des Data Mining. Es wird unterschieden nach Methoden des überwachten und des unüberwachten Lernens. Die Vor- und Nachteile sowie der Hauptverwendungszweck jeder Methode werden diskutiert.

Praktische Anwendung von Data Mining
Die Demonstration der praktischen Anwendung von Data Mining an wirklichen Daten aus der Verkehrsplanung bildet den Schwerpunkt der Forschungsarbeit. Dabei kommt der in den vorangegangen Arbeitsschritten im Detail beschriebene iterative Prozess nach CRISP zur Anwendung. Als Datensätze, an welchen die praktische Anwendung von Data Mining demonstriert werden soll, sind vorgesehen:

­ Mikrozensus Verkehr 2005

­ Zusammengeführte Mobilitätsdatenbank 2005 (Poolen der Daten des Mikrozensus Verkehr 2005 mit den Daten zum Verkehrsangebot 2005 (MIV und ÖV) und den Daten zur Raumstruktur 2005 (Raumtypen, Einwohner-, Arbeitsplatzdichten, Ausstattung mit Einrichtungen usw.)

­ Daten von SP-Befragungen (z.B. Datensätze der 4 SP's aus dem Projekt SVI 2005/004)

Beurteilung der Eignung von Data Mining in der Verkehrsplanung
Anhand eines Kriterienkataloges wird die Eignung von Data Mining in der Verkehrsplanung beurteilt. Insbesondere wird auch die Frage beantwortet, wie weit der Verkehrsplaner Data Mining selbständig anwenden kann und wann er besser im Team mit Spezialisten zusammenarbeitet.

Data Mining Software
Es wird ein Leitfaden zur Beurteilung von Data Mining Software entwickelt, mit welchem der Verkehrsingenieur selbständig Software bezüglich ihrer Eignung für die Bearbeitung einer bestimmten Fragestellung prüfen kann.

Empfehlungen zur Anwendung von Data Mining in der Verkehrsplanung
Die Empfehlungen sollen dem Verkehrsplaner ermöglichen, sich beim Aufbau einer Data Mining Analyse und bei der Auswahl geeigneter statistischer Methoden in der zur Verfügung stehenden Vielfalt zu orientieren. Weiter werden die typischen Stolpersteine im Data Mining diskutiert und es wird aufgezeigt, wie diese vermieden werden können.

Methoden
(Deutsch)
Literaturstudium, Desk Research, Auswertung praktischer Anwendungen des Data Mining Prozesses, Empirische Herleitung von Empfehlungen
Spezielle Geräte und Installationen
(Deutsch)

keine

Allgemeiner Stand der Forschung
(Deutsch)

Data Mining gelangt in den verschiedensten Bereichen erfolgreich zum Einsatz. In der Literatur sind verschiedene Anwendungen im Verkehrsbereich beschrieben, z.B.

­ Analysen von Daten zum Mobilitätsverhalten

­ Analysen von Zähl- und Videodaten

­ Analyse von Unfalldaten

In der Schweiz fehlen Erfahrungen mit Data Mining-Anwendungen in der Verkehrsplanung

Projektziele
(Deutsch)

Ziel dieser Forschungsarbeit ist, die Möglichkeiten und Grenzen von Data Mining als Hilfsmittel in der Verkehrsplanung auszuloten und den praktisch tätigen Verkehrsingenieur mit dem Prozess von Data Mining vertraut zu machen. Teilziele sind:

­ Definition von Data Mining in der Verkehrsplanung, Verfassen eines für die Anwendungen in der Verkehrsplanung passenden Projekt-Schemas.

­ Darstellung und Erläuterung dieses Schemas an praktischen Beispielen mit vorhandenen Datensätzen aus der Verkehrsplanung.

­ Vermitteln eines Überblicks über die Data Mining Methoden sowie Möglichkeiten von Data Mining in der Verkehrsplanung aufzeigen. Hinweise im Hinblick auf zu vermeidende Stolperstellen sowie für den Verkehrsingenieur empfehlenswerte Vorgehensweisen, Methoden und Software.

­ Beantwortung der folgenden Fragen:

­ Welche Möglichkeiten und welches Potential bietet Data Mining zur explorativen Datenanalyse in der Verkehrsplanung?

­ Können mit Data Mining Muster und Zusammenhänge in Daten zum Mobilitätsverhalten effizienter und zuverlässiger gefunden werden als mit konventionellen statistischen Methoden?

­ Lassen sich mit Data Mining Muster und Zusammenhänge entdecken, welche bei den bisherigen Auswertungen mit konventionellen Techniken verborgen geblieben sind?

Projektziele
(Englisch)

The goal of this project is to explore the prospects and limits of data mining in transportation planning, as well as to familiarize practitioners with the relevance of the subject for their daily business. Some sub-goals are:

- to provide a definition of data mining in the context of transportation planning, and to establish a blueprint of how to handle data mining projects in this field

- illustration and exemplification of the blueprint through practical application with real world data sets in transportation planning

- to provide a summary over the technical aspects of data mining, as well as its prospects and limits, both with respect to the subject of transportation planning. Besides discussing the pitfalls of data mining, we will also provide guidance on how to plan and implement such projects with a special focus on suitable methods and software.

- answering the following questions:

- What are the prospects and potential of data mining for explorative data analysis in transportation planning?

- Does the use of data mining allow for a more efficient and reliable identification of patterns and correlations in mobility behaviour data compared to conventional statistical data analysis?

- Do data mining techniques detect patterns and dependencies that could not be identified with a traditional data analytical approach?

Umsetzung und Anwendungen
(Deutsch)
Die ganze Forschungsarbeit ist auf die Praxis ausgerichtet. Insbesondere die herausgearbeiteten Empfehlungen werden die Umsetzung der Ergebnisse der Forschungsarbeit in die Praxis von grossem Nutzen sein
Berichtsnummer
(Deutsch)
1365
Literatur
(Deutsch)

Chang et al. (2005): Data Mining of Tree-Based Models to Analyze Freeway Accident Frequency. Journal of Safety Research

Chen et al. (2002) A Multimedia Data Mining Framework: Mining Information from Traffic Video Sequences. Journal of Intelligent Information Systems

Chen et al. (2001) Freeway Performance Measurement System – Mining Loop Detector Data. Transportation Research Record

O'Mahony (2003) Analysis of Public Transport Data Using Data Mining Techniques

Kalyoncuoglu et al. (2004) An Alternative Approach for Modelling and Simulation of Traffic Data: Artificial Neural Networks. Simulation Modeling Practice and Theory

Lambe et al. (1996) Driver Choice of Parking in the City. Socio-Economic Planning Sciences

Lee D-H. et al. (2004) Applying Data Mining Techniques for Traffic Incident Analysis. Journal of the Institution of Engineers, Singapore, Vol. 44 Issue 2, 2004

Pande et al. (2006) Assessment of freeway traffic parameters leading to lane-change related collisions. Accident Analysis and Prevention

Raz et al. (2004) Detecting Semantic Anomalies in Truck Weigh-In-Motion Traffic Using Data Mining. Journal of Computing in Civil Engineering

Scuderi M. und Clifton K.J. (2004) Bayesian Approaches to Learning form Data: Using NHTS Data for the Analysis of Land Use and Transportation. National Household Travel Survey Conference, Washington, Nov. 2004

Shmueli et al. (1996) Neural Network Analysis of Travel Behavior: Evaluating Tools for Prediction. Transportation Research Part C

Tseng et al. (2005) Distractions and Motor Vehicle Accidents: Data Mining Application on Fatality Analysis Report System Data Files. Industrial Management & Data Systems

Turochy et al. (2002) Measuring Variability in Traffic Conditions by Using Archived Traffic Data. Transportation Research Record

Wang et al. (2005) Improved Variable and Value Ranking Techniques for Mining Categorical Traffic Accident Data. Expert Systems with Applications

Wets G. et al. (2000) Identifying decision structures underlying activity patterns: An exploration of data mining algorithms, 79th TRB Annual Meeting, Washington

Xie C., Lu J. und Parkan E. (2003) Work travel mode choice modeling with data mining: Decision trees and neural networks. Transportation Research Record 1854