Google à la chasse de la grippe

, Partager

Le bulletin électronique de l’Ambassade de Londres du 7 juillet dernier évoquait une des nouveautés de Google, Flu Trends, accessible sur google.org [1]. Les ingénieurs de Google sont partis d’un constat bien simple : quand on est malade, on cherche des informations sur sa maladie. Et aujourd’hui, quand on cherche, on le fait sur le Web et on utilise Google.

Ils ont donc exploré la possibilité d’une corrélation entre la fréquence relative des recherches qui utilisent certains mots clés (influenza complications, cold/flu remedy, etc.) et le pourcentage de visites chez le médecin concernant un patient avec des symptômes grippaux. Les résultats ont été publiés dans la prestigieuse revue Nature [2], et ils ont permis la réalisation de Flu Trends, un outil de prévision de l’évolution d’une épidémie (ou pandémie) de grippe comme celle que nous vivons en ce moment.

Mais, est ce que ça marche vraiment ? Evidemment, les auteurs de l’article dans Nature ont vérifié la possibilité de reproduire les données du passé. Cependant, comme l’on sait la prévision, surtout celle du futur, est une autre paire de manches…

Pour répondre à la question, je me suis donc lancé dans une chasse au trésor sur Internet. Première étape : le site de Google, qui propose les estimations de la progression de la grippe basées sur l’historique des requêtes dans 18 (pour l’instant) pays. J’ai sélectionné les Etats-Unis, le Canada, la France et l’Australie, cette dernière parce que la saison hivernale vient de s’y terminer. Etape suivante, les données épidémiologiques réelles. J’ai choisi (de façon plutôt arbitraire) comme paramètre épidémiologique le nombre d’échantillons viraux testés positifs pour la grippe A, par semaine. D’abord, une visite au site des Centers for Disease Control and Prevention [3] qui suit l’évolution de l’activité grippale aux USA permet de récupérer les données en question, à partir de la semaine 36. Ensuite, click sur le lien FluWatch de l’Agence de la Santé Publique du Canada [4], où j’ai choisi de commencer par la semaine 35. Le site de L’Institut de Veille Sanitaire [5] m’a fourni le nombre hebdomadaire de virus de grippe A détectés en France Métropolitaine depuis la semaine 37. Finalement, j’ai trouvé sur le site du Department of Health and Ageing australien [6] les cas vérifiés en laboratoire de grippe H1N1 du 19 mai au 8 décembre.

A noter : Google met à jour les données de la semaine quotidiennement, tandis que les sites de santé le font de façon hebdomadaire, et souvent avec du retard, c’est-à-dire que les données de la semaine qui se termine ne sont publiées qu’une semaine ou deux plus tard. La dernière estimation de Google est indiquée par un cercle vide, et est à jour à la date du 8 décembre 2009.

Les comparaisons entre données épidémiologiques et estimations de Google pour les quatre pays apparaissent dans les figures 1, 2, 3 et 4, respectivement. On remarque d’emblé qu’il y a un accord qualitatif très bon pour les USA (Fig. 1) et pour le Canada (Fig. 2.) Dans les deux cas, les estimations de Google présentent un maximum à la même semaine que les données épidémiologiques, bien que la forme détaillée des pics soit différente. Les estimations précèdent les données de deux semaines dans le cas des USA, et de trois pour le Canada. On peut observer que la diminution des cas de grippe semble en train de s’arrêter et peut-être de s’inverser dans le continent Nord Américain.

Le cas de la France (Fig. 3) est intéressant, parce que les données épidémiologiques, en retard de deux semaines sur les prédictions, apparaissent croissantes, tandis que les prédictions de Google montrent qu’un maximum devrait être atteint cette semaine. La courbe en gris surimposée aux données est une extrapolation basée sur une variante du modèle SIR [7] bien connu des épidémiologistes. On pourra voir dans les jours à venir si ce comportement se produit.

L’Australie est sortie de sa saison grippale depuis plusieurs semaines, et la courbe prédite par Google (multipliée par un facteur 10 en Fig. 4 pour faciliter la comparaison) reproduit assez fidèlement les données épidémiologiques si on la translate de trois semaines et demie, ce qu’il fait qu’elle apparaît précéder l’observation épidémiologique d’environ un mois.

En conclusion, il apparait que Flu Trends de Google est un outil très efficace pour connaître en temps réel l’évolution de la situation épidémiologique. A condition évidemment que la population ait un accès capillaire au Web, et qu’elle utilise massivement les moteurs de recherche.

Sommes-nous au lit malades ? Let’s google !





Pour en savoir plus, contacts :


- [1] http://www.google.org/flutrends/
- [2] Jeremy Ginsberg et al. Detecting influenza epidemics using search engine query data, Nature 457, 1012-1014 (19 February 2009) | doi:10.1038/nature07634 ; en ligne (sur abonnement) http://www.nature.com/nature/journal/v457/n7232/full/nature07634.html
- [3] http://www.cdc.gov/flu/weekly/fluactivity.htm
- [4] http://www.phac-aspc.gc.ca/fluwatch/09-10/index-eng.php
- [5] http://www.invs.sante.fr/surveillance/grippe_dossier/
- [6] http://www.healthemergency.gov.au/internet/healthemergency/publishing.nsf/Content/updates
- [7] http://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology
- http://www.math.duke.edu/education/ccp/materials/diffcalc/sir/index.html
Code brève
ADIT : 61556

Rédacteur :

Alberto Pimpinelli, attache-phys.mst@consulfrance-houston.org

Voir en ligne : http://www.bulletins-electroniques….