Une base de données douteuses

, Partager

Une équipe de chercheurs de Stanford a créé un prototype de système de bases de données adapté aux données incertaines (erreurs de capteurs, points de vue différents selon les sources, observateurs qui ont des doutes). Avec les systèmes de bases de données classiques actuels, la seule possibilité de tenir compte de ces données est de développer du code informatique spécifique pour chaque application accédant à ces données. Dans le système mis au point, nommé Trio, une modélisation de l’incertitude des valeurs est prise en compte (ensembles de valeurs possibles avec probabilités, distributions gaussiennes, plages de valeurs etc.), qui sera gérée et mise à jour par le système et utilisée lors des requêtes (écrites dans un langage nommé TriQL, le modèle de données étant de type relationnel étendu). De plus, le système mémorise et gère l’historique (lineage) des données. Les requêtes peuvent alors prendre en compte l’incertitude, porter sur cette incertitude (trouver les valeurs bonnes à x% près, sur l’historique ou la combinaison de l’incertitude et de l’historique, etc. Par ailleurs, le système utilise l’historique pour propager des modifications (par exemple si on change la précision d’une valeur). Mais le prototype a encore besoin d’ajustements selon le chef du projet, ainsi que de compléments (gestion explicite du temps par exemple). Le code pourrait devenir open-source. Ces recherches sont financées par la National Science Foundation et Boeing ; elles ont des applications dans de nombreux domaines, tels que les bases de données d’observation issues de réseaux de capteurs, etc. L’équipe de Stanford a une collaboration ancienne avec l’INRIA (projets Verso puis Gemo).

Source :


- http://news-service.stanford.edu/news/2006/march22/widom-032206.html
- http://www.stanford.edu/dept/news/pr/2006/pr-widom-032206.html

Pour en savoir plus, contacts :


- Projet Trio - http://www-db.stanford.edu/trio/
- http://www-db.cs.wisc.edu/cidr/cidr2005/papers/P22.pdf
- http://sites.computer.org/debull/A05mar/olston.ps
- http://www-db.stanford.edu/~widom/pubs.html
Code brève
ADIT : 32849

Rédacteur :

Sébastien Morbieu, sebastien.morbieu@ambafrance-us.org
Jean-Philippe Lagrange, jean-philippe.lagrange@ambafrance-us.org

Voir en ligne : http://www.bulletins-electroniques….