Un programme pour détecter vos opinions ?

, Partager

Le Department of Homeland Security a accordé à un consortium de trois universités un financement de 2,4 millions pour travailler sur un système qui différentierait des énoncés de faits d’assertions qui relèvent de l’expression d’opinions (Information Extraction of Events and Beliefs from Text). Les trois universités sont Cornell, l’université de Pittsburgh et celle de l’Utah, elles constituent ensemble l’un des quatre centres chargés de travailler sur de nouvelles méthodes d’analyse de données pour la sécurité nationale.
Leur projet consiste à analyser des textes en langage naturel en utilisant, d’une part, des techniques classiques de représentation (graphes sujet - verbe etc.) et, d’autre part, l’analyse des coréférences de mots dans les phrases (différents mots -voire groupes de mots- qui désignent le même concept) et d’apprentissage faiblement supervisé. L’idée est de présenter des textes successifs au système, pour qu’il apprenne à reconnaître lorsque des mots désignent le même concept, suivant une approche développée à Cornell. Par ailleurs, des techniques principalement développées à Pittsburgh (Subjectivity and Sentiment Group du laboratoire NLP) permettent de distinguer les énoncés de faits des opinions, en recherchant des composants classiquement associés à l’une ou l’autre catégorie (selon et craintes) dans le graphe de dépendance, ainsi que les sources des énoncés et la tonalité (positive ou négative) des phrases. Les sources interviennent également ensuite comme moyen d’évaluer la fiabilité des énoncés.

Source :


- Can computers have an opinion ?
http://blogs.zdnet.com/emergingtech/?p=364
- Communiqué de presse de Cornell : With Homeland Security grant, Cornell seeks to sort facts from opinions
http://www.news.cornell.edu/stories/Sept06/Cardie.homeland.ws.html

Pour en savoir plus, contacts :


- La page NLP de Cornell : http://www.cs.cornell.edu/Info/Projects/NLP/
- Publications récentes de ces équipes
OpinionFinder : A system for subjectivity analysis
http://www.cs.cornell.edu/home/cardie/papers/hlt-emnlp05-demo.pdf#search=%22pittsburgh%20nlp%20facts%20opinion%22
Feature Subsumption for Opinion Analysis
http://www.cs.pitt.edu/ wiebe/pubs/papers/emnlp06.pdf#search=%22wiebe%20cornell%20opinions%22
Annotating Expressions of Opinions and Emotions in Language
http://www.cs.cornell.edu/home/cardie/papers/lre-2005.pdf
- Page du projet Mostrare à l’INRIA : http://www.grappa.univ-lille3.fr/cgi-bin/twiki/view/Mostrare/MLInfoExtract
- Une bibliographie du domaine : http://www-connex.lip6.fr/~amini/PageRessource.html
Code brève
ADIT : 39318

Rédacteur :

Jean-Philippe Lagrange, attache-stic.mst@ambafrance-us.org

Voir en ligne : http://www.bulletins-electroniques….