LA QUALITE DE L’INFORMATION
Définir ce que l’on entend par qualité de l’information peut s’avérer fort difficile étant donnée la diversité de dimensions que prend ce concept. De façon générale, nous souscrivons à la définition de Goodchild (2006): «Quality […] is a measure of the difference between the data and the reality that they represent, and becomes poorer as the data and the corresponding reality diverge. Thus, if data are of poor quality, and tell us little about the geographic world, then they have little value». Ainsi, dans le cas de données archéologiques et spatiales, évaluer la qualité de l’information est nécessaire afin de pouvoir mesurer notre «légitimité» à formuler certaines hypothèses et interpréter les résultats des analyses effectuées avec ces mêmes données au sujet des structures et des dynamiques spatiales passées. Evaluer la qualité des données nous permet de fixer les limites du cadre interprétatif : objectiver le cadre interprétatif et calibrer les questionnements en fonction des données disponibles. Les poids attribués aux données permettent d’estimer le risque qu’on prend en réalisant telle ou telle interprétation. Cette procédure s’avère cependant complexe. Naumann et Rolker (2000) en expliquent les raisons: «1) IQ criteria are often of subjective nature and can therefore not be assessed automatically 2) Information sources usually are autonomous and often not publish useful (and possibly compromising quality metadata). Additionally, many sources take measures to hinder information quality assessment. 3) The enormous amount of data to be assessed impedes assessment of the entire formation set. Thus sampling techniques are often necessary which decrease the accuracy of the assessed scores. 4) Information from autonomous sources is subject to sometimes surprising changes in content and quality». Bovee et al. (2003) ajoutent: « Without clearly defined attributes and their relationships, we are not just unable to assess information quality; we may be unaware of the problem. We need to understand the attributes of information quality and to have a broadly applicable, meaningful way to combine evaluations of them into a single quality measure». Si l’on se réfère à la description des données effectuée dans le chapitre 1, on constate que la qualité de notre information se décline en deux catégories majeures : la précision de l’information, et la fiabilité de l’information (Tableau 9).
LE CHOIX D’UNE UNITE TEMPORELLE DE REFERENCE LE SIECLE
Dans la mesure où il s’agit ici de décrire la qualité de l’information associée aux données de la base PaléoSyr, la question du mode de représentation du temps s’est rapidement posée. Nous avons opté pour une déconstruction de la chronologie par périodes, et d’une discrétisation de celle-ci par tranches de 100 ans. Il convient de préciser que ce choix ne relève pas d’un parti-pris thématique fort, mais de la nécessité de choisir une unité de référence continue, nous permettant de visualiser l’information de manière précise mais synthétique. Ce choix relève d’une volonté d’expérimentation en amont de notre étude, et pourra être remis en question par les résultats des premières analyses, et tout au long de l’étude. Nous nous inscrivons donc dans cette pensée de Daniel S. Milo (1992): « Si l’on admet que l’aspect expérimental du siècle réside dans son arbitraire, il faut assumer cet arbitraire ! En d’autres mots, on ne peut fort mal tenir une expérimentation, puis la délaisser car nonrentable. En d’autres mots encore, l’expérimentation séculaire n’a pas produit les résultats escomptés parce qu’on ne l’a pas comprise, donc on l’a mal gérée – du coup, on était incapable d’évaluer les résultats qu’on a quand même produits ».
ADAPTATION D’UNE METHODE D’AIDE A LA DECISION : L’ANALYSE MULTICRITERE
Etat de l’art et présentation générale de la méthode
En utilisant l’analyse multicritère (AMC), nous pouvons attribuer à chaque période un niveau de qualité sous forme d’un « score », afin d’identifier celles qui sont le mieux pourvues en termes de qualité et de quantité d’information. Le but est ainsi de définir et d’adapter ce cadre conceptuel et méthodologique aux problématiques et aux bases de données archéologiques. Diverses écoles ont émergé dans l’AMC depuis les années 1970. Parmi elles, Thomas L. Saaty, professeur à l’Université de Pittsburgh, est le créateur et le premier théoricien de l’ « Analytic Hierarchy Process » qui est à la base de la méthode utilisée dans cette étude. Son objectif était de créer une approche qui permettrait de répondre au besoin de réaliser des comparaisons dans le cas où des échelles standard ne seraient pas disponibles pour mesurer les phénomènes de manière absolue, et de dériver des mesures de ces comparaisons (Saaty, 1990 ; 1993 ; 2008). L’AMC est une méthode d’évaluation multidimensionnelle nous permettant de résoudre des problèmes de décision complexes. Cette approche se fonde sur le principe qu’une solution à un problème de décision peut être trouvée en le divisant en plusieurs petites parts plus facilement appréhendables, et en les intégrant de manière logique (Verhagen, 2006). L’intérêt de la méthode est double : «It provides an overall view of the complex relationships inherent in the situation; and helps the decision maker assess whether the issues in each level are of the same order of magnitude, so he can compare such homogeneous elements accurately» (Saaty 1990). En contexte d’aide à la décision, l’une des tâches les plus complexes est de sélectionner les éléments importants à considérer dans la prise de décision. L’AMC nous fournit un moyen de classer ces éléments, une fois sélectionnés, dans une structure hiérarchique, allant d’un but général jusqu’à plusieurs critères, sous-critères et alternatives en niveaux successifs (Saaty, 1990). Cette méthode a été appliquée dans divers champs de recherche tels que le changement Chapitre 4 : Adaptation d’une méthode d’aide à la décision pour évaluer les variations de la qualité de l’information selon les périodes étudiées. 91 climatique, la finance ou les risques, domaines où des buts multiples et conflictuels compliquent souvent la tâche des décideurs, afin que ceux-ci puissent bénéficier de résultats systématiques et concrets leur permettant d’adopter les politiques adaptées à la situation. Ainsi, l’objectif de l’AMC dans ce contexte n’est pas de calculer quelle est la « bonne » décision, mais de contribuer à améliorer la connaissance dans des situations impliquant des risques, plusieurs critères, et des intérêts multiples (Bell et al., 2003). Cette méthode a été rarement appliquée en archéologie, et lorsqu’elle l’a été, elle avait une fonction prédictive. Il s’agissait alors d’évaluer le potentiel archéologique d’une zone, les limites des zones de prospection et les procédures de planification (Verhagen, 2006, 2007 ; Krist, 2006). En outre, les archéologues ont exploité le potentiel de l’analyse multicritères afin de déterminer les surfaces-coûts dans l’exploration des paysages à échelle régionale, afin de construire et valider des modèles des développements sociaux passés, et prendre en compte les liens sociaux entre les groupes d’individus (Howey 2007). Notre problème de décision est donc ici très différent des applications communes de l’AMC: nous souhaitons classer les diverses périodes identifiées dans la base de données en fonction de la qualité de l’information permettant de les décrire, par l’élaboration d’un certain nombre de critères pouvant permettre d’évaluer l’information archéologique. En d’autres termes, il s’agit d’identifier les siècles pour lesquels l’information disponible maximise la précision et la fiabilité des données, et minimise donc l’incertitude. Il convient de préciser que les critères, alternatives et points de vue déterminés dans cette étude et décrits plus loin ont été identifiés en fonction d’informations propres à notre base de données et à nos objectifs. La solidité et la flexibilité de la méthode assurent toutefois sa reproductibilité à diverses problématiques et bases de données.
Déroulement de la procédure d’analyse multicritère
Etape 1: définir les objectifs
Il s’agit tout d’abord de définir un ou plusieurs état(s) final(aux) souhaité(s). Le nôtre est de classer les périodes de la chronologie de notre base de données en fonction de la qualité de l’information qui les caractérisent (précision et fiabilité de l’information).
Etape 2: identifier les alternatives
Les alternatives sont les diverses options que l’on souhaite classer, dans notre cas, les périodes de la chronologie. Ce qui implique de choisir un mode de division du temps pour cette étude, sachant que celles-ci n’ont pas toutes la même durée, et s’échelonnent en plusieurs sous-périodes (cf. chapitre 1). Chapitre 4 : Adaptation d’une méthode d’aide à la décision pour évaluer les variations de la qualité de l’information selon les périodes étudiées. 92 Nous avons choisi ici de raisonner en dates calendaires plutôt qu’en périodes. Nous avons ainsi choisi de diviser la chronologie, et donc la base de données en intervalles de 100 ans, le siècle étant le niveau de précision -ou la durée- maximum atteint dans la base de données. Chaque intervalle de 100 ans est caractérisé par les données et leurs caractéristiques qui y correspondent, et considéré comme une entité à part entière. Ainsi, nos alternatives, ou en d’autres termes, les éléments que l’on souhaite hiérarchiser, sont chacun des intervalles de 100 ans présents entre le début du Néolithique (-9600 av JC) jusqu’à aujourd’hui, ce qui nous donne un total de 116 alternatives. Les alternatives sont notées i = 1, …… I.