Prédiction d'alarmes dans les réseaux via la recherche de motifs spatio-temporels et l'apprentissage automatique

Achille Salaün

Résumé

Nowadays, telecommunication networks occupy a central position in our world. Indeed, they allow to share worldwide a huge amount of information. Networks are however complex systems, both in size and technological diversity. Therefore, it makes their management and reparation more difficult. In order to limit the negative impact of such failures, some tools have to be developed to detect a failure whenever it occurs, analyse its root causes to solve it efficiently, or even predict this failure as prevention is better than cure. In this thesis, we mainly focus on these two last problems. To do so, we use files, called alarm logs, storing all the alarms that have been emitted by the system. However, these files are generally noisy and verbose: an operator managing a network needs tools able to extract and handle in an interpretable manner the causal relationships inside a log. In this thesis, we followed two directions. First, we have inspired from pattern matching techniques: similarly to the Ukkonen’s algorithm, we build online a structure, called DIG-DAG, that stores all the potential causal relationships between the events of a log. Moreover, we introduce a query system to exploit our DIG-DAG structure. Finally, we show how our solution can be used for root cause analysis. The second approach is a generative approach for the prediction of time series. In particular, we compare two well-known models for this task: recurrent neural nets on the one hand, hidden Markov models on the other hand. Here, we compare analytically the expressivity of these models by encompassing them into a probabilistic model, called GUM.

Les réseaux de télécommunication prennent aujourd'hui une place prépondérante dans notre monde. Ils permettent en effet de partager des informations en masse et à l’échelle planétaire. Toutefois, il s’agit de systèmes complexes, en taille comme en diversité technologique. Cela rend d’autant plus complexes leur maintenance et leur réparation. Afin de limiter l’influence négative de ces dernières, des outils doivent être développés pour détecter une panne dès qu’elle a lieu, en analyser les causes afin de la résoudre efficacement, voire prédire ladite panne pour prévenir plutôt que guérir. Dans cette thèse, nous nous intéressons principalement à ces deux derniers problèmes. Pour cela, nous disposons de fichiers, appelés logs d’alarmes, recensant l’ensemble des alarmes émises par le système. Cependant, ces fichiers sont généralement verbeux et bruités: l’administrateur à la charge d’un réseau doit disposer d’outils capables d’isoler et manipuler de façon interprétable les liens de causalité au sein d’un log. Dans cette thèse, nous avons suivi deux approches. La première est inspirée des techniques de correspondance de motifs: en s’inspirant de l’algorithme d’Ukkonen, nous construisons en ligne une structure, appelée DIG-DAG, qui stocke toutes les chaînes de causalité possibles entre les événements d’un log. Nous proposons également un système de requête pour exploiter cette structure. Enfin, nous appliquons cette approche dans le cadre de l’analyse de causes racines. La seconde approche est une approche générative pour la prédiction de données. En particulier, nous comparons deux modèles classiques pour cette tâche: les réseaux de neurones récurrents d’une part et les modèles de Markov cachés d’autre part. En effet, dans leurs communautés respectives, ces deux modèles font office d’état de l’art. Ici, nous comparons analytiquement leurs expressivités grâce à un modèle probabiliste, appelé GUM, englobant ces deux modèles.

Alarm prediction in networks via space-time pattern matching and machine learning

Prédiction d'alarmes dans les réseaux via la recherche de motifs spatio-temporels et l'apprentissage automatique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager