Construction et intégration d'ontologies pour la cartographie socio-sémantique de fonds documentaires arabes guidée par la fiabilité de l'information, Thèse de doctorat, Université Tunis El Manar, Tunis, Tunisia

TitleConstruction et intégration d'ontologies pour la cartographie socio-sémantique de fonds documentaires arabes guidée par la fiabilité de l'information, Thèse de doctorat, Université Tunis El Manar, Tunis, Tunisia
Publication TypeThesis
Year of Publication2012
AuthorsBounhas, I
Academic DepartmentUniversité Tunis El Manar, Tunis, Tunisia
DegreePhD
Number of Pages201
Thesis TypePhD
KeywordsCartographie des connaissances, Fiabilité de l'information., Ontologie, TALN Arabe, Web socio-sémantique
Abstract

La présente thèse propose un processus de cartographie des connaissances de fonds documentaires arabes. L'objectif principal de ce processus est de permettre à des utilisateurs différents de retrouver l'information pertinente qu'ils recherchent. Etant conscient que la pertinence est une notion multidimensionnelle, nous avons conçu un modèle générique pour représenter des cartes de connaissances multi-critères. En effet, une carte est composée d'un ensemble d'ontologies (dont chacune représente une dimension) qui sont liées aux fragments de documents. Les cartes sont munies de mécanismes d'évaluation de l'information selon les besoins des utilisateurs. A ce stade, nous avons donné une importance primordiale à la fiabilité de l'information en tant qu'exigence critique dans la situation actuelle du Web. Nous avons adopté le point de vue du Web socio-sémantique qui considère les documents comme des productions sémiotiques. Un autre choix primordial, effectué dans le cadre de cette thèse, consiste à utiliser le corpus hadithien qui est un fonds documentaire volumineux, structuré et riche en connaissances et en divergences. En outre, le hadith constitue une méthodologie solide pour assurer la fiabilité de l'information. De part ces caractéristiques, les livres du hadith constituent des productions sémiotiques adaptées aux traitements socio-sémantiques. 
La représentation multidimensionnelle nécessite l'extraction et l'organisation des connaissances selon plusieurs axes. Dans l'axe sémantique, nous proposons d'extraire les termes pertinents à chaque thème, considéré comme un domaine de connaissances. Dans l'axe social, nous proposons un moteur de recherche social qui permet d'extraire les entités nommées et de reconnaître les identités des acteurs. Les connaissances extraites sont organisées en utilisant la méthode d'analyse distributionnelle basée sur les réseaux petits mondes hiérarchiques, ce qui permet de construire des ontologies différentielles. Enfin, nous intégrons les réseaux possibilistes en tant qu'outil d'évaluation de l'information. Ainsi, l'utilisateur dispose du jugement du système sur la pertinence thématique et sur la fiabilité, mais aussi des outils nécessaires pour conduire une démarche d'enquête dans une perspective de recherche ouverte de l'information. 

Attachement: 

Topics: