Extraction des caractéristiques depuis le compteur global
Préparer et extraire les statistiques de puissance
Le prétraitement des données dépend du choix du capteur sélectionné pour mesurer la consommation d’énergie. Dans cette partie, nous présentons les connaissances tirées depuis le compteur global d’électricité, en particulier au niǀeau du secteur résidentiel où la puissance active et la puissance réactive sont mesurées chaque seconde. Les connaissances tirées de cette partie sont généralisables peu importe la fréquence de mesure, seule la fenétre d’échantillonnage évoluera. Dans le cas de l’identification de l’ensemble des appareils, une étude à la seconde est nécessaire pour les appareils avec des durées de cycle court comme les convecteurs électriques ou le tambour du lave-linge. Cela permet de soutirer des connaissances liées aux appareils à cycle court : nous parlons de densité d’évènements [GUE-2011]. Ainsi, la fenétre de temps d’identification des variations de puissance doit étre différente selon le problème posé. Dans cette thèse, nous nous intéressons à l’identification du chauffage et de l’eau sanitaire fournis par des pompes à chaleur. Ces appareils ont des cycles lents supérieurs à la minute. Un filtre médian permettra d’enlever du bruit sur le signal électrique et d’enlever les appareils à cycle court qui pourrait se confondre avec des pompes à chaleur.d’un point de vue électrique, en régime permanent, une variation est caractérisée par la transition entre un état électrique « stable » caractéristique du fonctionnement d’un appareil et un état instable. Dans la littérature, un évènement est une variation d’état au niveau de la seule puissance active et/ou réactive si le capteur récolte cette information [HART-1992]. Les seuils de puissance utilisés sont compris entre 40 Watts et 50 Watts pour une identification complète des charges individuelles et de 15 VAR pour la puissance réactive [HART-1992]. Cela sera notre point de départ comme seuil pour l’identification d’évènements sur la courbe de charge globale par phase. Cette variation peut se faire à partir d’une moyenne glissante sur une fenétre de temps à définir selon le problème et les charges à identifier.
Identification du chauffage et de l’eau chaude
La plus grande difficulté dans l’identification des appareils électriques de manière non intrusive est sa généralisation. Dans les études qui ont porté sur des centaines de logements [ENE-2010] [ADE2010], les données collectées ont souvent portées que sur la puissance active et sur la consommation d’énergie mais les analyses présentent des variations extrémes entre les logements. Il devient ainsi difficile avec une fréquence à la seconde de séparer les évènements, en particulier ceux liés à des faibles puissances (généralement en dessous de la puissance du réfrigérateur-congélateur de 250 Watt en pic) mais qui représentent la plus grande part dans la répartition parmi l’ensemble des évènements détectés (Figure 48) [DUF-14]. Leurs nombres sont conséquents et correspondent à des appareils à un état (lampes, congélateurs) ou un sous-état spécifique (compresseur d’une pompe à chaleurͿ (Figure 43).Pour l’électroménager, une étude à la seconde est nécessaire pour tirer parti du nombre d’évènements liés aux appareils électriques à forte densité. Cette notion est définie dans [GUE-2009]. Elle permet par exemple d’extraire les variations dites rapides d’un convecteur électrique ou d’un laǀelinge. Ainsi, le type de traitement avant l’identification des appareils de manière individuelle dépend de l’appareil visé. Nous nous sommes basés sur le secteur résidentiel car nous avions accès aux bases de contenant la puissance active et réactive d’appareils électriques. Nous nous sommes concentrés sur les plus gros consommateurs et avec le plus gros potentiel de pilotage : le chauffage et l’eau chaude. Ces usages énergétiques sont fournis par une pompe à chaleur, appareil électrique qui a un cycle de fonctionnement lent. Les variations entre une variation positive et négative sont supérieures à la minute dans nos cas d’étude. Notre méthode peut se résumer en six étapes (Figure 49) : Création d’une base de données d’appareils électriques avec la puissance active et réactive Décomposition des appareils multi-états en sous états Définition des différents évènements à partir de la puissance active et réactive sur chacune des phases (3 points de mesureͿ à partir d’un filtre médian à la minute Recherche spécifique par classe : Pompe à chaleur/Autre Ajouts de seuils spécifiques liés à la puissance active et réactive Identification des évènements dans le plan actif/réactif à partir d’une base de données d’apprentissage et de méthodes d’identification non superǀisé
Créer son propre modèle de prédictions météorologiques
Les données météorologiques en particulier pour la production solaire décentralisée et pour le chauffage sont essentielles particulièrement les données prédites pour l’heure suivante.nous avons remarqué que les valeurs de prédiction fournies par Météo Suisse comprenaient des erreurs en luminosité et en température extrêmes correspondant à des phénomènes locaux difficilement prévisibles. Nous définissons les erreurs liées aux prédictions fournies de température et de luminosité qui correspondent chaque heure à la différence entre la réalité et la prédiction (Equations 4.16 et 4.17). Notre objectif sera d’apprendre l’erreur sur des années d’historirue pour l’appliruer sur nos années utilisées en test. Puisque nous avons plusieurs années de données réelles et prédites, nous allons créer notre propre modèle de prédiction de la température et de la radiation lumineuse. Ainsi, nous avons créé un modèle mathématique de l’erreur par station météo et par donnée d’entrée ;température, luminosité) (Figure 53). Cette erreur est apprise par une méthode non paramétrique détaillée dans le chapitre 2. Pour cette étape, nous utilisons un ensemble d’arbres de décision. Les nouvelles prédictions de luminosité et de température corrigées seront nos nouvelles données d’entrée Pour caractériser l’erreur, un historque basé sur les données réelles et prédites est construit. Cet historique représente les données d’entrée de notre modèle mathématique. Les données d’apprentissage correspondent aux mesures du 1 Janvier 2010 au 31 Août 2012. Les données de test vont du 1 septembre 2012 au 31 Mars 2014 (Figure 54). Cette répartition a été réalisée pour avoir les données corrigées qui correspondent à nos périodes de test pour la prédiction des flux énergétiques. En sortie du modèle mathématique, une erreur est prédite pour chaque heure correspondant à notre set de test représenté par les figures 49 et 50.
Apprentissage supervisé
Le processus se passe en deux phases. Lors de la première phase (hors ligne, dite d’apprentissage), il s’agit de déterminer un modèle des données étiquetées. La seconde phase (en ligne, dite de test) consiste à prédire l’étiquette d’une nouvelle donnée, connaissant le modèle préalablement appris. Cette méthodologie est utilisée dans le cas de la labellisation de l’eau chaude et du chauffage. l’objectif est de définir deux classes ON et OFF rui correspondent respectivement à l’allumage et à l’arrét du système de production de chauffage et d’eau chaude. A partir du besoin en chauffage, un apprentissage supervisé est réalisé sur les données d’entraînement et appliqué sur les données de test. “i l’énergie de chauffage est en dessus d’un seuil, elle est labellisée ON, sinon OFF. Une classification binaire est réalisée à partir de l’énergie de chauffage pour définir les ruarts d’heure et les heures où le chauffage est allumé ou éteint (Figure 51). Si le besoin en chauffage ou en eau chaude à l’instant t;iͿ est en dessous d’un seuil prédéfini, nous considérons le besoin comme OFF. Le même apprentissage est réalisé pour l’eau chaude sanitaire à partir de l’énergie par heure.Un historique des consommations et des données météorologiques est créé par heure pour chacune desvariables d’entrée caractérisées. Cet historique correspond au besoin en chauffage heure par heure sur les deux jours précédents la prédiction à calculer. Par exemple, pour une prédiction à l’heure