Alain Gély

Recherche : Travaux de thèse

Thèse

Sujet de thèse :
Algorithmique combinatoire : Cliques, Bicliques et Système d'implications

Thèse soutenue le 8 décembre 2005, sous la direction du professeur Lhouari Nourine, devant le jury suivant :

Résumé des travaux de thèse

Mes travaux s'articulent autour de l'algorithmique d'énumération, consistant à lister tous les objets obtenus à partir d'une structure discrète (typiquement, un graphe) et possédant une propriété particulière (par exemple, être une clique maximale, une biclique maximale, ...)

Mes travaux de thèse se sont découpés en trois grandes parties :

La première partie traite du problème de l'énumération des cliques maximales d'un graphe. A cette occasion, nous donnons une vision unifiée des algorithmes existants sur le sujet en présentant une nouvelle structure : H(G), le graphe de transition des cliques maximales d'un graphe G.

La deuxième partie traite des problèmes d'énumération des bicliques maximales d'un graphe. Après une étude bibliographique de trois problèmes d'énumération de bicliques maximales (bicliques maximales induites d'un graphe, bicliques maximales non induites d'un graphe et bicliques maximales induites d'un graphe biparti), nous nous intéressons particulièrement au dernier de ces trois problèmes.

En effet, le problème de l'énumération des bicliques maximales d'un graphe biparti a des applications dans plusieurs grands domaines de l'informatique, comme le datamining (recherche des motifs fermés fréquents), l'analyse de concept formel (construction du treillis des concepts), les mathématiques discrètes (recherche des pavés maximum de 1 dans une matrice booléenne). Pour chacune de ces applications, des algorithmes ont étés développés pour résoudre ce problème.
Nous étudions les propriétés du graphe de transition dans ce cas précis, après transformation du problème permettant de se ramener à un problème d'énumération de cliques. Encore une fois, cette méthode nous permet de donner une vision unifiée d'algorithmes existants, développés dans les divers domaines présentés ci-dessus.

L'ensemble des bicliques maximales d'un graphe biparti est en bijection avec deux systèmes de fermeture. Un graphe biparti est donc une représentation d'un système de fermeture. Une autre représentation, les bases d'implications, est utilisée dans de nombreux domaines.
En effet, le problème de l'énumération des implications d'une base minimum à partir d'une autre représentation d'un système de fermeture (les éléments inf-irréductibles) est équivalent à de nombreux autres problèmes dans de nombreux champs applicatifs (datamining avec la recherche des clés dans une base de données. Théorie des graphes avec la recherche des transversaux minimaux d'un hypergraphe. Logique avec le passage d'une fonction booléenne monotone de la CNF à la DNF). A l'heure actuelle, il n'existe pas d'algorithme polynomial (par implication) d'énumération des implications d'une base minimum. D'autre part la taille d'une base minimum peut être exponentielle en la taille de la famille des éléments inf-irréductibles d'un système de fermeture. Dans cette thèse, nous proposons deux approches permettant de réduire la combinatoire associée au problème : Les éléments clones sont des éléments jouant un rôle symétrique (similaire) dans une base minimum. Il s'en suit qu'en ne gardant qu'un seul élément de chaque classe de clones ainsi que les informations sur les classes d'équivalences, on peut réduire fortement la taille d'une base minimum. L'exemple exponentiel de Mannila et Räihä (1992) se réduit à une seule implication après traitement des éléments clones.

Malheureusement, on ne sait pour l'instant détecter qu'un sous ensemble des éléments clones d'une base minimum à partir des éléments inf-irréductibles d'un système de fermeture. Il est en effet possible que la symétrie de deux éléments dans une base minimum soit brisée dans le système de fermeture à cause d'implications particulières : Les implications unitaires (possédant un singleton pour prémisse). Or, ces implications sont en nombre polynomial et faciles à calculer. La deuxième approche permettant de réduire la combinatoire associée au problème est basé sur la manipulation de l'ensemble des implications unitaires. Puisque ces dernières empêchent la symétrie entre deux éléments, nous nous intéressons aux conditions nécessaires et suffisantes permettant de rajouter ou d'enlever de telles implications sans modifier les implications non unitaires. Nous avons notamment caractérisé, à partir de la famille des éléments inf-irréductibles, dans quels cas une implication unitaire peut être ajoutée à la base de telle façon que le nouveau système de fermeture obtenu soit en relation de couverture avec le système de fermeture de départ dans la famille des systèmes de fermeture partageant les mêmes implications non unitaires. Nous avons aussi montré comment obtenir la famille d'éléments inf-irréductibles correspondante. Le cardinal de celle-ci est plus petit ou égal au cardinal de la famille d'éléments inf-irréductibles de départ. Nous en déduisons un algorithme permettant de calculer la famille des éléments inf-irréductibles d'un système de fermeture minimal possédant les mêmes implications non unitaires, réduisant ainsi les données d'entrées du problème (les éléments inf-irréductibles) ainsi que certaines données généralement utilisées comme intermédiaire (le système de fermeture)