Ph.D Defense of José M. Giménez-García"Formaliser, capturer, et gérer le contexte des déclarations dans le Web Sémantique"

The Monday, July 18, 2022

at 2:30 PM

Room D03
Campus Manufacture
18 rue du Professeur Benoît Lauras
42000 Saint-Etienne

"Formaliser, capturer, et gérer le contexte des déclarations dans le Web Sémantique"

(French version below)

Abstract

Representing the context of statements has been a challenge in computer science for more than fifty years, and has been a concern in the Semantic Web since its inception. Ideally, when representing a set of statements in a context, their semantics should remain unchanged but confined within the context. That is, the same inferences that were possible before contextualizing the statements should be possible after the contextualization, but the inferred knowledge should be true only in the same context. Existing solutions in knowledge representation and reasoning usually deal with this issue by separating the contexts in one way or another and adding rules to transfer knowledge between them. These approaches seem unfeasible in the Semantic Web paradigm, where the existing solutions are based on reifying the statements into new individuals, whether by introducing new statements to relate this term to the original statement it represents, or by extending the formalisms of the language. These individuals will be used to make ``statements about statements'', providing information about the contexts in which the statements are true. This reification approaches, however, have the consequence of either breaking the semantics of the original statements, and/or having inferences that are not confined within the context.

In this dissertation we theorize that it is possible to represent statements within their context, and preserve and keep confined their semantics, without separating in different universes or extending the formalism of the language used to assert them. We formalize the process of contextualizing a set of statements in a \emph{contextualization function}, formalize the properties that a contextualization function can have \wrt how it preserves and separates the semantics of each context, analyze existing contextualization approaches under these properties, and propose a new contextualization approach that better preserve and separate the semantics of the statements. We capture contextual information existing in real-world data, and we argue that the selection of a contextualization approach can depend on the information we want to represent and how these properties are respected. However, the selection of a specific approach heavily impacts how to capture, store, and query the statements. We postulate that it should be possible to manage contextualized statements using a representation-agnostic solution, therefore allowing to to capture and represent statements and their context using any desired contextualization approach. We make a first step towards such a solution presenting a binary serialization that can store and query contextualized statements using the currently most used contextualization approaches.

COMMITTEE

Champin, Pierre-Antoine Associate Professor, Université de Lyon (Reviewer)
Koubarakis, Manolis Professor, University of Athens (Reviewer)
Hernandez, Nathalie Professor, Université de Toulouse (Examiner)
Laforest, Frédérique Professor, Université de Lyon (Examiner)
Maret, Pierre.Professor Professor, Université Jean Monnet (Main advisor)
Zimmermann, Antoine Associate Professor, École des Mines (Co-advisor)
Fernández, Javier D. Senior Information Architect , Roche (Invited)
Martínez-Prieto, Miguel A. Associate Professor, Universidad de Valladolid (Invited)

Résumé

La représentation du contexte des énoncés est un défi pour l'informatique depuis plus de cinquante ans et constitue une préoccupation pour le Web sémantique depuis sa création. Idéalement, lorsqu'on représente un ensemble d'énoncés dans un contexte, leur sémantique devrait rester inchangée mais confinée dans le contexte. En d'autres termes, les mêmes inférences qui étaient possibles avant la contextualisation des énoncés devraient être possibles après la contextualisation, mais la connaissance inférée ne devrait être vraie que dans le même contexte. Les solutions existantes en matière de représentation des connaissances et de raisonnement traitent généralement ce problème en séparant les contextes d'une manière ou d'une autre et en ajoutant des règles pour transférer les connaissances entre eux. Ces approches semblent irréalisables dans le paradigme du Web sémantique, où les solutions existantes sont basées sur la réification des énoncés en de nouveaux individus, soit en introduisant de nouveaux énoncés pour relier ce terme à l'énoncé original qu'il représente, soit en étendant les formalismes du langage. Ces individus seront utilisés pour faire des "déclarations sur les déclarations", fournissant des informations sur les contextes dans lesquels les déclarations sont vraies. Ces approches de réification ont cependant pour conséquence de briser la sémantique des énoncés originaux, et/ou d'avoir des inférences qui ne sont pas confinées dans le contexte.

Dans cette thèse, nous théorisons qu'il est possible de représenter les énoncés dans leur contexte, et de préserver et garder confinée leur sémantique, sans séparer dans des univers différents ou étendre le formalisme du langage utilisé pour les affirmer. Nous formalisons le processus de contextualisation d'un ensemble d'énoncés dans une \emph{fonction de contextualisation}, nous formalisons les propriétés qu'une fonction de contextualisation peut avoir quant à la façon dont elle préserve et sépare la sémantique de chaque contexte, nous analysons les approches de contextualisation existantes selon ces propriétés, et nous proposons une nouvelle approche de contextualisation qui préserve et sépare mieux la sémantique des énoncés. Nous capturons les informations contextuelles existant dans les données du monde réel, et nous soutenons que la sélection d'une approche de contextualisation peut dépendre des informations que nous voulons représenter et du respect de ces propriétés. Cependant, la sélection d'une approche spécifique a un impact important sur la façon de capturer, de stocker et d'interroger les déclarations. Nous postulons qu'il devrait être possible de gérer les énoncés contextualisés en utilisant une solution indépendante de la représentation, permettant ainsi de capturer et de représenter les énoncés et leur contexte en utilisant toute approche de contextualisation souhaitée. Nous faisons un premier pas vers une telle solution en présentant une sérialisation binaire qui peut stocker et interroger des déclarations contextualisées en utilisant les approches de contextualisation les plus utilisées actuellement.

Membres du jury

Champin, Pierre-Antoine Associate Professor, Université de Lyon (Rapporteur)
Koubarakis, Manolis Professor, University of Athens (Rapporteur)
Hernandez, Nathalie Professor, Université de Toulouse (Examinatrice)
Laforest, Frédérique Professor, Université de Lyon (Examinatrice)
Maret, Pierre.Professor Professor, Université Jean Monnet (Directeur de thèse)
Zimmermann, Antoine Associate Professor, École des Mines (Co-directeur de thèse)
Fernández, Javier D. Senior Information Architect , Roche (Invité)
Martínez-Prieto, Miguel A. Associate Professor, Universidad de Valladolid (Invité)

La présentation se fera en anglais.