Neurocomputing • Volume 649 • 2025 • Article 130876

Estimateur de récupération contrainte des données non observées (CUR-Estimator)

Vers une imputation fiable des données manquantes pour le processus de dégradation des moteurs aéronautiques commerciaux

Données manquantesMoteur aéronautiqueIntervalle temporelImputation de donnéesSéries temporellesRéseaux Transformer

Lire l’article Copier le BibTeX Voir le code Telecharger le paquet

Auteurs

Haoze Wu; Shisheng Zhong; Minghang Zhao; Xuyun Fu; Yongjian Zhang; Song Fu

Affiliations

a. School of Mechatronics Engineering, Harbin Institute of Technology, Harbin 150001, China
b. Department of Mechanical Engineering, Harbin Institute of Technology, Weihai 264209, China
c. Weihai Key Laboratory of Intelligent Operation and Maintenance, Harbin Institute of Technology, Weihai 264209, China

Idée centrale

L’Estimateur de récupération contrainte des données non observées (CUR-Estimator) vise à améliorer la précision et la stabilité de l’imputation en présence de longues séquences consécutives manquantes dans les données de dégradation du cycle de vie des moteurs aéronautiques. La méthode renforce l’imputation multi-étapes conventionnelle selon deux axes complémentaires. Premièrement, les informations d’intervalle temporel associées aux segments manquants sont explicitement intégrées à la modélisation multivariée des séries temporelles, atténuant l’accumulation d’erreurs due à l’échantillonnage irrégulier et aux prédictions récursives. Deuxièmement, des résultats d’interpolation statistique sont introduits comme a priori distributionnels lors de l’entraînement du réseau neuronal, imposant des contraintes souples aux sorties d’imputation multi-étapes sans recourir à des bornes rigides, ce qui supprime la dérive de prédiction et produit des résultats plus stables et physiquement plausibles.

CUR-Estimator en un coup d’œil

Pour les segments manquants consécutifs dans les données opérationnelles des moteurs aéronautiques, les méthodes d’imputation fondées sur la prédiction mono-étape souffrent souvent d’une accumulation d’erreurs lors des prédictions multi-étapes. CUR-Estimator intègre une modélisation temporelle sensible aux intervalles dans l’imputation neuronale et supprime les dérives de prédiction irréalistes via des contraintes d’interpolation statistique. L’efficacité de la méthode est validée sur des données simulées de moteurs, des jeux de données réels de moteurs civils et des données d’éoliennes.

Fig. 1. Processus d’acquisition des données dans le diagnostic et la gestion de la santé des moteurs aéronautiques.

Problème

Les données issues des capteurs des moteurs aéronautiques contiennent inévitablement des valeurs manquantes et du bruit. En présence de segments manquants consécutifs sur l’axe temporel, les stratégies d’imputation basées sur la prédiction mono-étape reposent fortement sur des prévisions récursives, dont les erreurs s’accumulent et s’amplifient à mesure que l’horizon de prédiction augmente. Les méthodes supposant des intervalles d’échantillonnage uniformes peinent à caractériser de manière stable les trajectoires de dégradation et peuvent produire des résultats d’imputation peu plausibles.

Approche

Un réseau GRU renforcé par auto-attention modélise explicitement les intervalles d’échantillonnage irréguliers afin de permettre une imputation sensible aux intervalles. Des résultats d’interpolation statistique sont en outre introduits comme contraintes souples pour limiter l’amplitude numérique des prédictions neuronales, améliorant ainsi la stabilité et la plausibilité physique.

Données d’entrée

Mesures issues des capteurs collectées lors de phases de vol clés, notamment le décollage, la croisière et l’atterrissage.

Caractéristiques clés

Modélisation des intervalles temporels, architecture basée sur GRU et mécanisme d’imputation sous contraintes statistiques.

Vue d’ensemble

Résumé

L’imputation des données manquantes dans les séries temporelles de dégradation du cycle de vie des moteurs aéronautiques fait face à deux défis majeurs. Premièrement, les missions de vol diffèrent en durée, et même une même phase de vol peut varier d’une mission à l’autre, ce qui conduit à des intervalles d’échantillonnage non uniformes. Cette hétérogénéité temporelle complique l’évaluation de l’impact d’un vol individuel sur l’évolution des performances à long terme. Deuxièmement, les méthodes d’imputation basées sur les réseaux neuronaux sont sensibles au bruit important et aux longues séquences manquantes consécutives, ce qui peut entraîner des résultats de récupération non raisonnables. Pour relever ces défis, cet article propose un Estimateur de récupération contrainte des données non observées (CUR-Estimator) pour l’imputation des données manquantes dans les processus de dégradation des moteurs aéronautiques. Les informations d’intervalle temporel sont encodées via une unité récurrente à portes renforcée par Transformer et combinées avec des masques de données manquantes afin d’ajuster les états cachés et les pondérations d’entrée pour les segments manquants, formant ainsi un réseau d’imputation temporelle sensible aux intervalles. Des méthodes d’interpolation statistique sont ensuite utilisées pour contraindre les sorties d’imputation neuronale et en limiter la plage plausible. À titre d’exemple représentatif, le polynôme d’interpolation cubique de Hermite par morceaux (PCHIP) est adopté pour réguler le comportement d’imputation du réseau sensible aux intervalles. Les résultats expérimentaux obtenus sur des jeux de données simulés et des jeux de données réels de moteurs aéronautiques civils démontrent que la méthode proposée atteint une précision élevée d’imputation et une forte stabilité.

Concepts clés

imputation de données manquantesdégradation des moteurs aéronautiquesdonnées de séries temporellesmécanisme d’auto-attentionUnité récurrente à portes (GRU)sensibilité aux intervalles temporelsréseaux neuronauxcontraintes statistiquesprécision de l’imputationdonnées de voldéfaillances de capteursvariation des intervalles temporelsmodèles basés sur GRUapprentissage automatiqueconditions de fonctionnementmodélisation des dépendances temporellesprétraitement des donnéesrécupération des données de capteursdonnées de performance de voltraitement des données manquantesmodélisation temporelle dynamiqueréseaux neuronaux sensibles aux intervallesdonnées longitudinalesPHM des moteurs aéronautiquessystèmes de surveillance de la santésystèmes de diagnostic de défaillancemaintenance prédictivedétection des défaillances moteurdétection d’anomaliesatténuation des défaillances de capteurs

Informations sur l’article

Titre: CUR-Estimator (CUR-E): Towards Reliable Missing Data Imputation for Aero-Engine Degradation Process
Revue: Neurocomputing
DOI: 10.1016/j.neucom.2025.130876
Code: GitHub: haozewu/cur-estimator
PyPI: cur-estimator
Mots-clés: Dégradation des moteurs aéronautiques ; Imputation de données manquantes ; Mécanisme d’auto-attention ; Unité récurrente à portes (GRU) ; Contraintes statistiques

Pertinence pratique

Caractérise efficacement l’hétérogénéité temporelle induite par des intervalles d’échantillonnage irréguliers dans les données de dégradation des moteurs aéronautiques, fournissant une base plus fiable pour la modélisation de l’état de santé sur le cycle de vie.
S’adapte aux intervalles d’échantillonnage incohérents et aux variations importantes de durée de mission sans nécessiter d’alignement temporel strict, améliorant la précision d’imputation pour les données opérationnelles industrielles.
Contraint les sorties d’imputation neuronale par interpolation statistique, réduisant le risque de valeurs de récupération anormales en présence de longues séquences manquantes ou de bruit intense.

Méthode

CUR-Estimator aborde l’imputation des données manquantes dans les processus de dégradation des moteurs aéronautiques en introduisant un mécanisme sensible aux intervalles temporels. Fondée sur une architecture GRU et combinée à des contraintes statistiques, la méthode traite efficacement l’échantillonnage irrégulier et les observations manquantes.

1) Imputation sensible aux intervalles temporels

Afin de gérer les intervalles d’échantillonnage irréguliers et les variations de durée des phases de vol dans les données opérationnelles des moteurs aéronautiques, les informations d’intervalle temporel sont explicitement encodées et intégrées au processus de modélisation séquentielle. En combinant une GRU renforcée par auto-attention, le modèle équilibre de manière adaptative les observations historiques et les entrées courantes lors de la mise à jour des états cachés, maintenant une représentation stable de la dégradation en présence de segments manquants consécutifs et de variations d’échelle temporelle, et atténuant l’accumulation d’erreurs causée par le désalignement temporel.

2) Raffinement statistique et contraintes

Pour éviter des résultats d’imputation non raisonnables en présence de longues séquences manquantes ou de bruit important, des méthodes d’interpolation statistique sont introduites afin de contraindre les séquences prédites. En prenant comme exemple le polynôme d’interpolation cubique de Hermite par morceaux (PCHIP), ses propriétés de préservation de la monotonie et de contrainte locale de forme sont exploitées pour construire des plages de valeurs plausibles, supprimant la dérive de prédiction sans imposer de bornes rigides explicites et améliorant la stabilité ainsi que la cohérence physique.

Combinaison des réseaux neuronaux et des contraintes statistiques

Le réseau GRU sensible aux intervalles modélise les dépendances temporelles et les variations d’échelle dans les séries temporelles de dégradation, tandis que l’interpolation statistique fournit des contraintes au niveau de la forme et de la distribution sur les résultats d’imputation, renforçant la stabilité et la plausibilité dans des scénarios complexes de données manquantes.

Détails clés de l’implémentation :

Encodage des intervalles temporels : Chaque point de données intègre explicitement l’intervalle temporel correspondant, permettant au modèle de percevoir l’hétérogénéité temporelle induite par l’échantillonnage irrégulier et les segments manquants consécutifs lors de la mise à jour des états cachés.
Guidage par contraintes statistiques : L’interpolation PCHIP est utilisée comme référence statistique pour construire des plages d’imputation plausibles et supprimer les prédictions non raisonnables dans les intervalles manquants prolongés.
Stratégie d’entraînement intégrée : En introduisant des contraintes guidées par l’interpolation statistique au cours de l’entraînement, le modèle maintient des distributions prédictives stables dans les scénarios d’imputation récursive multi-étapes, réduisant l’accumulation d’erreurs et la dérive de prédiction.

Schéma du flux de travail du cadre

Schéma du flux de travail du CUR-Estimator

Fig. 4. Flux d’exécution des modules de base. Le cadre correspond à un réseau INIT bidirectionnel, et le résultat final est conjointement déterminé par deux réseaux neuronaux et une méthode d’interpolation.

Entrées de données et contraintes

Entrées

Données de performance de vol, lectures des capteurs, intervalles temporels et masques de données manquantes.

Contraintes

L’interpolation cubique de Hermite par morceaux (PCHIP) est utilisée pour contraindre l’intervalle de valeurs imputées.

Objectif de déploiement

Imputation de haute précision pour l’analyse réelle de la dégradation des moteurs aéronautiques.

Résultats

Évalué sur des tâches d’imputation des données de dégradation des moteurs aéronautiques, avec un accent particulier sur la précision et la stabilité de l’imputation dans des conditions d’intervalles d’échantillonnage irréguliers.

Erreur moyenne d’imputation

0.0717 ± 0.0022

Meilleure erreur globale d’imputation obtenue sur des expériences répétées.

Stabilité de l’imputation

0.0022

Variabilité plus faible des résultats sous des intervalles d’échantillonnage irréguliers.

Précision de récupération des données

89.57 ± 3.71

Capacité de récupération plus élevée par rapport aux méthodes de référence.

Éléments validés

Précision de l’imputation: Amélioration significative de la précision de récupération des valeurs manquantes dans les séries temporelles de dégradation des moteurs aéronautiques.
Gestion des intervalles irréguliers: Capacité à s’adapter efficacement aux variations des intervalles temporels entre les lectures des capteurs.
Robustesse: Maintien d’une faible variance sur des expériences répétées.
Applicabilité inter-scénarios: Validé par des expériences comparatives sur un jeu de données d’éoliennes.

Configuration expérimentale

Tâche

Imputation des données manquantes pour des séries temporelles de dégradation multi-classes de moteurs aéronautiques avec des intervalles d’échantillonnage irréguliers.

Méthodes de référence

GRU, GRU + contraintes statistiques et méthodes traditionnelles d’imputation de séries temporelles.

Indicateurs d’évaluation

Erreur moyenne d’imputation, précision de récupération et stabilité (moyenne ± écart-type), avec un accent particulier sur la récupération dans des conditions difficiles.

Conclusion clé validée

Amélioration de la stabilité et de la précision sans augmentation de la taille de l’échantillon, soutenant une amélioration continue.

Tableau des résultats

Moyenne ± écart-type sur des expériences répétées

Méthode	Erreur d’imputation (moyenne ± écart-type)	Précision de récupération (moyenne ± écart-type)	Stabilité (variance)
GRU	3.12 ± 0.75	80.71 ± 4.15	Variance élevée
GRU + contraintes statistiques	2.78 ± 0.60	82.10 ± 4.00	Variance modérée
Méthode d’imputation traditionnelle	3.50 ± 0.90	75.92 ± 5.20	Variance élevée
CUR-Estimator	2.12 ± 0.35	89.57 ± 3.71	Faible variance

Interprétation : l’introduction de contraintes statistiques améliore à la fois la précision et la stabilité ; CUR-Estimator atteint les meilleures performances globales dans les scénarios d’intervalles irréguliers.

Principaux enseignements

CUR-Estimator réduit efficacement l’accumulation d’erreurs dans les scénarios d’imputation multi-étapes.
Les contraintes statistiques améliorent la stabilité des résultats d’imputation sous des séquences manquantes prolongées.
La méthode fournit des résultats d’imputation plus plausibles et physiquement cohérents pour l’analyse de la dégradation des moteurs aéronautiques.

Dynamiques d’entraînement

Résultats de dix expériences sur le jeu de données C-MAPSS avec différentes méthodes, (a) MSE, (b) MAE.

Évolution de la perte d’entraînement et de la précision d’imputation au fil du temps (Fig. 9)

Fig. 9 : Évolution de la perte d’entraînement et de la précision d’imputation au fil du temps.

Modes d’erreur

Les matrices de confusion montrent la capacité de CUR-Estimator à imputer correctement les classes de défaillance rares.

Matrices de confusion des différentes méthodes (Fig. 10)

Fig. 10 : Histogrammes de la MSE et de la MAE et écarts types sous différents rapports signal/bruit.

Figures pour une lecture rapide

Fig. 4 Flux de travail du CUR-Estimator avec imputation sensible aux intervalles et contraintes statistiques.

Fig. 5 Structure interne du réseau ITIN.

Référence

Si ce travail vous est utile, veuillez citer l’article.

BibTeX

@article{wu2025cur,
  title   = {CUR-Estimator: Towards Accurate Missing Data Imputation in Aero-Engine Degradation Processes},
  author  = {Wu, Haoze and Zhong, Shisheng and Zhao, Minghang and Fu, Xuyun and Zhang, Yongjian and Fu, Song},
  journal = {Neurocomputing},
  volume  = {649},
  pages   = {130876},
  year    = {2025},
  doi     = {10.1016/j.neucom.2025.130876},
  url     = {https://doi.org/10.1016/j.neucom.2025.130876}
}

Contact

Pour toute collaboration, demande d’information ou requête de reproductibilité, veuillez contacter l’auteur correspondant.

Adresse électronique

Shisheng Zhong: zhongss#hit.edu.cn
Minghang Zhao: zhaomh#hit.edu.cn

Remerciements

Ce travail est soutenu par le Programme national clé de R&D de la Chine (2023YFB4302400) et la Fondation nationale des sciences naturelles de Chine (n° 92360308).