Une base de connaissance personnelle intégrant les données d'un utilisateur et une chronologie de ses activités

Résumé

Aujourd’hui, la plupart des internautes ont leurs données dispersées dans plusieurs appareils, applications et services. La gestion et le contrôle de ses données sont de plus en plus difficiles. Dans cette thèse, nous adoptons le point de vue selon lequel l’utilisateur devrait se voir donner les moyens de récupérer et d’intégrer ses données, sous son contrôle total. À ce titre, nous avons conçu un système logiciel qui intègre et enrichit les données d’un utilisateur à partir de plusieurs sources hétérogènes de données personnelles dans une base de connaissances RDF. Le logiciel est libre, et son architecture innovante facilite l’intégration de nouvelles sources de données et le développement de nouveaux modules pour inférer de nouvelles connaissances. Nous montrons tout d’abord comment l’activité de l’utilisateur peut être déduite des données des capteurs de son téléphone intelligent. Nous présentons un algorithme pour retrouver les points de séjour d’un utilisateur à partir de son historique de localisation. À l’aide de ces données et de données provenant d’autres capteurs de son téléphone, d’informations géographiques provenant d’OpenStreetMap, et des horaires de transports en commun, nous présentons un algorithme de reconnaissance du mode de transport capable de retrouver les différents modes et lignes empruntés par un utilisateur lors de ses déplacements. L’algorithme reconnaît l’itinéraire pris par l’utilisateur en retrouvant la séquence la plus probable dans un champ aléatoire conditionnel dont les probabilités se basent sur la sortie d’un réseau de neurones artificiels. Nous montrons également comment le système peut intégrer les données du courrier électronique, des calendriers, des carnets d’adresses, des réseaux sociaux et de l’historique de localisation de l’utilisateur dans un ensemble cohérent. Pour ce faire, le système utilise un algorithme de résolution d’entité pour retrouver l’ensemble des différents comptes utilisés par chaque contact de l’utilisateur, et effectue un alignement spatio-temporel pour relier chaque point de séjour à l’événement auquel il correspond dans le calendrier de l’utilisateur. Enfin, nous montrons qu’un tel système peut également être employé pour faire de la synchronisation multi-système/multi-appareil et pour pousser de nouvelles connaissances vers les sources. Les résultats d’expériences approfondies sont présentés.

Publication
Laboratoire Spécification et Vérification
Date