Modélisation ontologique des connaissances expertes pour l’analyse de comportements à risque
Enrichissement sémantique des trajectoires spatio-temporelles
Géographique par nature, une trajectoire est constituée d’une succession d’événements (stops, moves) spatio-temporels. Bien que cette dimension spatio-temporelle soit nécessaire à l’analyse d’un objet mobile, elle est néanmoins insuffisante. En effet, différentes informations, dites sémantiques, sont nécessaires et doivent être ajoutées. Les paragraphes ci-dessous présentent l’approche choisie ainsi que la notion de trajectoire sémantique.
Processus d’enrichissement sémantique et modélisation ontologique
Jusqu’à présent, l’essentiel de la problématique a consisté à proposer une modélisation la plus fidèle possible possible des trajectoires. Néanmoins, une trajectoire encodée sous la forme d’une suite de coordonnées ne fournit aucune information à propos du contexte dans lequel évolue l’objet. Or ce contexte participe tout autant à la compréhension et à l’interprétation d’une situation. C’est pourquoi en se basant sur la notion de trajectoire sémantique définie par Spaccapietra (Spaccapietra et al., 2008), Baglioni (Baglioni et al., 2008) propose d’augmenter le contenu informationnel d’une trajectoire par un processus d’enrichissement sémantique (Figure 1.3).
D’un objet mobile à une trajectoire sémantique
Ce processus permet à partir de données brutes d’obtenir des trajectoires dont le contenu informationnel a été enrichi par l’ajout d’informations liées à la zone géographique ou encore d’informations ayant trait au domaine d’activité de l’utilisateur. En plus d’apporter des informations complémentaires, ces trajectoires sémantiques doivent être manipulables directement par l’utilisateur en utilisant un langage expressif et humainement compréhensible. De ce fait, il est nécessaire de les modéliser à l’aide d’un formalisme de représentation spécifique. Actuellement, c’est le domaine des ontologies qui offre la plus grande expressivité. C’est pourquoi les auteurs ont choisi d’utiliser le formalisme OWL pour représenter les trajectoires. L’ontologie obtenue (Figure 1.4) est constituée des différents composants d’une trajectoire (cf Paragraphe 1.1.1.2). Dans celle-ci sont définis les deux éléments Stop et Move permettant de délimiter spatialement et temporellement l’activité d’un objet mobile. Ainsi, dans l’approche des auteurs, la conceptualisation d’une trajectoire est représentée par une séquence d’arrêt connecté à un déplacement. Cette connexion se fait à l’aide de l’une des quatre relations : fromStop, toStop, inMove, outMove. De plus, chaque Stop s’inscrit dans une dimension temporelle spécifique comme cela est précisé par la relation StopHasTime. Néanmoins, bien que ces trajectoires soient sémantiquement plus riches, ce processus s’accompagne selon les auteurs d’une diminution de la précision géométrique des données. Cela permet notamment une manipulation plus simple des informations contenues pour les langages de représentation. Mais, dans l’hypothèse où un langage ontologique disposerait de types spatiaux Page | 37 Figure 1.4: Représentation ontologique de la notion de trajectoire sémantique. Source (Baglioni et al, 2008) Trajectory Move Stop Interval Duration Time fromStop toStop inMove outMove trajIsCompOfStop hasDuration stopHasTime isa Figure 1.3: Processus d’enrichissement sémantique des trajectoires. Source : (Baglioni et al, 2008)
Application du processus d’enrichissement sémantique
Basé sur une logique similaire d’enrichissement sémantique, Yan propose dans son travail de thèse une architecture complète pour la création, la gestion et l’analyse des trajectoires (Yan, 2011). Pour cela, il s’appuie sur une infrastructure modulaire composée de trois principales ontologies : une ontologie géométrique des trajectoires, une ontologie géographique et une ontologie du domaine d’application (Figure 1.5). Bien que les notions relatives aux ontologies seront étudiées dans le paragraphe suivant (Chapitre 2. p.57), il est nécessaire de préciser succinctement la signification de ce terme. Conceptuellement, une ontologie peut être vue comme un réceptacle possédant les structures nécessaires à la modélisation des connaissances. En fonction du formalisme utilisé, ces connaissances sont ensuite encodées afin d’être utilisées aussi bien par les individus que par les systèmes. Les trois ontologies nécessaires à la description d’une trajectoire sont détaillées ci-dessous. L’ontologie géométrique des trajectoires est elle-même constituée de plusieurs sous ontologies spécialisées dans la description des concepts spatiaux ou temporels. Tout l’intérêt de l’approche proposée est de modéliser la trajectoire d’un objet mobile comme une suite de positions ordonnées temporellement. Ainsi, une trajectoire peut être représentée par une suite de triplets contenant la position en x et en y ainsi qu’une référence temporelle t. Cette abstraction des entités géométriques peut être alors modélisée à l’aide des logiques de description (Tableau 3.1) (Yan et al., 2008). Page | 38 Figure 1.5: Architecture ontologique pour l’enrichissement sémantique de trajectoires. Source (Yan, 2011). 1.1. D’un objet mobile à une trajectoire sémantique Concept Définition en logique de description TimePoint ⊆ hasGeometry.Point ∃ ∩ hasTime.Instant ∃ Begin End Stop B.E.S ⊆ TimePoint ⊆ TimePoint ⊆ hasGeometry.Point ∃ ∩ hasTime.Interval ∃ ≡Begin ∪ End ∪ Stop Move ⊆ TimeVaryingPoint ∩ from.D.F.A ∃ Trajectory ≡ ∃ hasBegin.Begin ∩=1 hasBegin ∩ ∃ hasEnd.End ∩=1 hasEnd ∩ ∃ hasMove.Move ∩ ∀ hasStop.Stop Tableau 3.1: Représentation des éléments constitutifs d’une trajectoire exprimés en logique de description. Source (Yan, 2008) L’ontologie géographique contient les différents concepts géographiques portant sur la description du territoire. Ces concepts peuvent faire référence aussi bien à des éléments naturels (rivière, montagne, etc.) qu’artificiels (routes, bâtiments, etc.). La granularité et la diversité des informations à intégrer seront fonction bien évidemment des besoins de l’application. Ce module occupe une place centrale dans l’architecture car il est en lien avec les deux autres ontologies. En effet, tout concept géographique possède une référence spatiale et peut donc être décrit en utilisant les éléments contenus dans l’ontologie géométrique des trajectoires. De plus, ce module est également lié à l’ontologie d’application du fait que les concepts géographiques peuvent être précisés en fonction des besoins de l’application. Comme son nom l’indique, l’ontologie du domaine d’application est spécifique au domaine sur lequel porte l’application. Les éléments à intégrer dépendront de la thématique et des besoins identifiés. Ces trois ontologies ont été ensuite combinées afin de fournir l’infrastructure sémantique nécessaire à la description de trajectoires pour une application de gestion du trafic routier. Pour l’exploitation et le stockage des données deux approches ont été explorées. Tout d’abord, une approche purement ontologique s’appuyant sur Protégé et un raisonneur (Racer, Pellet, etc.). Néanmoins, celle-ci entraînait d’importantes limitations notamment sur les performances du système en fonction de l’importance des raisonnements (cf. les notions de Abox et Tbox abordées dans le paragraphe 2.3.1.4 p.72). C’est pourquoi une seconde approche s’appuyant sur une base de données relationnelles possédant une extension spatiale et une extension RDF12 a été proposée (Yan et al., 2008). Notons que c’est également le choix fait par Malki (Malki et al., 2009; Mefteh et al., 2012) dans ses travaux concernant une application similaire mais appliquée aux trajectoires sémantiques des mammifères marins. Néanmoins, si cette solution offre l’avantage de performances élevées en terme de stockage et d’accès à l’information elle ne permet pas, à notre connaissance, l’utilisation de règles. Or celles-ci sont au cœur de ce travail de thèse. De ce fait, il sera donc nécessaire de s’appuyer sur une architecture ontologique classique.
Partie 1 État de l’art |