Représentation des trajectoires

Représentation des trajectoires

Séries temporelles

Nous rappelons qu’un vol unique (id_unique_flight ), représentant un trajet indépendemment du site marchand, est défini par un aéroport de départ (departureStation), un aéroport d’arrivée (arrivalStation), une date de départ (jour-mois-année heure : minute), une date de retour, un code de transport aller 1 (ex : AF315, IB412U2650) et un code de transport retour. Nous rappelons aussi que chaque vol possède une série temporelle par site marchand sur lequel il est vendu : la série de prix issue du site de la compagnie aérienne, et celles créées grâce aux prix des agences de voyages proposant le même vol. L’attribut provider qui défini le site marchand (la compagnie aérienne ou l’agence de voyage) est donc associé à l’id_unique_flight pour identifier une série temporelle unique à laquelle nous attribuons un identifiant unique id_flight . 

Problèmes d’échantillonnage

L’échantillonage de nos séries est un problème important pour la construction de notre base d’apprentissage. Les résultats des recherches utilisateurs, qui nous servent a construire notre base d’apprentissage, sont erratiques et ne nous donnent pas des séries avec des points régulièrement espacés. L’enjeu est donc de savoir si un vol peu être considéré comme consistant ou non, c’està-dire déterminer si la perte d’information est trop importante pour ne pas utiliser la série dans notre base d’apprentissage. Pour ce faire, il est intéressant d’observer le temps moyen d’attente entre deux sauts de prix en fonction du nombre de jours avant la date de départ. Sur la Figure 2.2, on observe un temps moyen de 2 jours et demi entre deux sauts sur l’ensemble des dates de recherche mais on note une forte augmentation de la fréquence des changement de prix dans les 20 derniers jours. Figure 2.2 – Temps moyen d’attente entre deux sauts en heures. En abscisses nous avons le moment du premier saut et en ordonnées le temps d’attente moyen avant le saut suivant. 1Dans le cas de vols avec escales, le code sera la concaténation des codes de chaque vol intermédiaire Figure 2.3 – Série temporelle : Paris-Toulouse, départ le 06/11/2012 pour 7 jours par EasyJet Notre corpus est composé de vols ayant un historique de 28 jours maximum sur un panel de destinations restreint (voir chapitre précédent) et de vols ayant un historique de 90 jours sur l’ensemble des recherches utilisateurs. Dans le premier groupe, nous avons décidé de conserver les vols échantillonnés toutes les 6 heures et possédant plus de 80% des 4 × 28 = 112 points maximum. Le nombre de recherches utilisateurs augmentant significativement dans le dernier mois avant la date de départ, ce critère de sélection nous fournit un nombre satisfaisant de courbes consistantes. Pour une question de taille de base de données, nous ne conservons que les points espacés de 6 heures et supprimons les prix intermédiaires. La Figure 2.9 est un très bon exemple de série correctement échantillonnée sur l’ensemble de la période étudiée. Pour le second groupe, l’échantillonage est seulement quotidien car il est impossible de trouver un vol où un utilisateur à vérifié les prix toutes les 6 heures pendant 90 jours. La Figure 2.2 nous confirme par ailleurs qu’il n’est pas nécessaire d’avoir plus de points car cet échantillonage nous permet de détecter une grande majorité des sauts de prix. L’exemple de la Figure 2.3 représentant une trajectoire issue des deux corpus confirme notre choix. Enfin le problème des vols complets reste un point qui n’est pas pris en compte. Lorsqu’une cabine est remplie et que le taux de sur-réservation (overbooking) est atteint, le vol n’est plus proposé à la vente et disparaît donc de nos résultats. La détection de ces vols est problématique car nous ne sommes pas en mesure de différencier un vol complet, d’un vol retiré de la base d’une agence ou même d’une mauvaise collecte des prix. C’est pourtant un point important dans l’aide à la décision d’achat de l’utilisateur. Faire perdre de l’argent à un usager en lui conseillant d’attendre lorsque le prix augmente peut avoir un impact négatif sur sa confiance dans le service, mais lui faire rater un vol peut s’avérer beaucoup plus néfaste. Malheureusement les vols complets sont naturellement ignorés lors de l’étape de sélection des vols consistants et la requête de sélection nous permettant d’identifier des vols complets s’avère complexe et jamais totalement fiable.

Comportements des trajectoires

A titre d’illustration, considérons la série temporelle de la Figure 2.4. Elle décrit l’évolution des prix d’un vol Paris-Marrakech partant le 25 Février 2011 sur Royal Air Maroc (le supplier) et proposé par le site VoyagesSNCF (le provider), pour un voyage de 3 jours. Nous constatons tout d’abord que la trajectoire est constante par morceaux : le prix varie d’un plateau à un autre, déclenché par le système de “yield management” comme décrit dans le chapitre précédent. Selon les compagnies et les techniques de revenue management qu’elles utilisent, ces plateaux peuvent être en nombre fixe et limité ou bien complètement dynamiques. Il est intéressant d’observer l’évolution du nombre de plateaux en fonction du provider, de la destination, du jour de l’année (jour de départ) ou même de comparer entre les agences de voyages, les compagnies régulières et les low cost. Figure 2.4 – Vol Paris-Marrakech, départ le 25/02/2011 pour 7 jours opéré par Royal Air Maroc et vendu par VoyagesSNCF. Nous observons la présence de 7 plateaux distincts. Dans la méthode d’optimisation du bid-price vector décrite dans le chapitre précédent, le nombre de plateaux est défini par le nombre de classes par cabines, chacune ayant un prix supérieur à la classe inférieure. Cependant il arrive que la demande ne corresponde pas aux prévisions et qu’une classe (celle courante généralement) voit son tarif modifié (à la baisse généralement). Sans modification manuelle du prix des classes, le nombre de plateaux par courbe serait sensiblement le même pour des vols similaires (même route, même période de l’année, etc.) et ne dépasserait pas le nombre de classes tarifaires de la cabine. 

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *