Les différents types de données permettant d’analyser la mobilité urbaine
Différents types de données (données personnelles, non personnelles) peuvent être utilisés pour analyser la mobilité urbaine. Sur le territoire de l’Union européenne et au Canada, les données personnelles (informations se rapportant à une personne physique identifiée ou identifiable) sont soumises à des régulations.
En effet, sur ces territoires, le traitement de telles données est encadré par le Règlement Général sur la Protection des Données, RGPD. Tout organisme quels que soient sa taille, son pays d’implantation et son activité peut être concerné. En effet, le RGPD s’applique à toute organisation publique et privée qui traite des données personnelles pour son compte ou non, dès lors qu’elle est établie sur ces territoires ou que son activité sociale cible directement des résidents européens ou canadiens.
Données utilisées pour l’analyse des déplacements des usagers
De nombreux travaux ont porté sur l’analyse des déplacements des individus en zone urbaine et péri-urbaine et plus particulièrement sur l’exploitation de données numériques pour cette analyse. Plusieurs sources de données existent ayant chacun des avantages et des inconvénients. 4 Chapitre 1 Introduction Données d’enquêtes L’analyse des déplacements dans les transports en commun s’appuie traditionnellement sur des enquêtes déclaratives [Zmu+13].
On peut notamment citer les différentes enquêtes de déplacements qui existent en France à savoir les Enquêtes Ménage Déplacement (EMD), les Enquêtes Nationale de Transport (ENT), les Enquêtes Globale de Transport (EGT) et les enquêtes OrigineDestination (OD) et au Canada, les Enquêtes Nationale auprès des Ménages (ENM) et les enquêtes OD.
Les informations obtenues grâce aux enquêtes sont détaillées, il est par exemple possible d’obtenir des informations socio-économiques et démographiques par individu (e.g., âge, sexe, etc.) ainsi que des informations sur le ménage (taille, structure) ou encore des informations sur le journal de déplacement (e.g., mode, motif, etc.). En revanche, ces enquêtes sont coûteuses et ne permettent pas d’avoir une information exhaustive sur l’ensemble des usagers des transports en commun (échantillon pouvant varier de 5% à 15% du nombre total des ménages pour les enquêtes OD).
De plus, ces données ont un biais important dans les réponses (absence/imprécision) et ne sont récoltées que sur un échantillonage temporel large (entre 5 et 10 ans). Données GPS Ces traces sont mono-mode ou multi-modes, elles permettent d’obtenir la localisation d’un individu ou d’un moyen de déplacement (e.g., bus ,taxi, etc.) de manière continue. Le défi avec ce type de données est de définir le mode de déplacement utilisé par les individus en fonction de plusieurs paramètres tels que leur position et leur vitesse.
Données de téléphonie
Ces données collectées par des antennes de téléphonie, sont découpées géographiquement en fonction de la position des antennes. Elles ne permettent pas d’avoir directement l’information sur le mode de déplacement et ne représentent qu’un échantillon réduit de la population (données obtenues par opérateur téléphonique). Les données de téléphonie peuvent être classées en deux catégories principales, à savoir les statistiques d’appels (Call Detail Records, CDR) et les enregistrements passifs du réseau.
Le désavantage des données CDR est que leur fréquence d’échantillonnage peut varier de quelques minutes à plusieurs heures. De plus la localisation des usagers à l’aide de ces données exige une utilisation active du téléphone (appels et sms). Contrairement aux données CDR les données passives permettent quant à elles de localiser les téléphones lorsque ceux ci ne sont pas utilisés. Les enregistrements passifs sont donc plus pratiques que les données CDR pour le suivi des téléphones mobiles car plus fréquents.