4 hubs régionaux pour doper l’innovation dans le big data

, Partager

L’administration Obama avait lancé, dès mars 2012, une campagne ambitieuse de financement de la recherche dans les domaines du big data [1]. Dotée de 200M$, cette initiative conjointe de la Maison Blanche (OSTP), de la National Science Foundation (NSF) avec le soutien de 6 grandes agences fédérales, avait notamment permis de proposer des appels à projets thématiques autour des applications en santé ou en géosciences, de bâtir des programmes de sensibilisation et de formation, ou de financer à hauteur de 10M$ le centre de recherches AMP (Algorithms/Machines/People) de l’Université de Berkeley [2]. C’est dans ce laboratoire d’excellence, dirigé par Michael Jordan et Michael Franklin, qu’a notamment été mise au point la suite open source complète BDAS (Berkeley Data Analytics Stack), qui permet d’analyser les très grands volumes de données pour des applications en oncologie ou en énergie.

Dans le sillage de ce chantier national autour de l’innovation dans le big data, après avoir financé de la R&D, des infrastructures et des programmes de formation, le département CISE [3] de la NSF avait souhaité, en début d’année, structurer géographiquement la communauté des acteurs publics et privés impliqués sur ces thématiques liées aux grands volumes de données. Un appel à projets avait ainsi été lancé en mars 2015 [4] pour constituer 4 consortia régionaux, appelés BD Hubs (Big Data Regional Hubs), ayant pour vocation d’animer le tissu de toutes les parties prenantes, et de réfléchir ensemble à des problématiques big data plus spécifiques aux zones du pays concernées. Chacun de ces réseaux régionaux pouvait prétendre à un financement maximal de 1,25M$ sur 3 ans pour composer une équipe et financer des activités d’animation, de sensibilisation, de diffusion des bonnes pratiques.

Les résultats de cette consultation ont été annoncés début novembre 2015 [5]. 281 acteurs du big data, entreprises, centres de recherches, collectivités territoriales, associations, se retrouvent donc répartis en 4 hubs, pilotés chacun par un (ou plusieurs) leader(s) académique(s), et focalisés sur quelques thèmes prioritaires reflétant les spécificités économiques ou géographiques des régions concernées :

  • Hub Nord-Est (9 Etats), piloté par Columbia University, focalisé sur l’énergie, la finance, l’éducation, le climat et l’environnement
  • Hub Sud (16 Etats), piloté par Georgia Institute of Technology et University of North Carolina, focalisé sur la santé publique, l’industrie, les matériaux, les risques côtiers
  • Hub Midwest (12 Etats), piloté par University of Illinois at Urbana Champaign, focalisé sur l’agriculture, l’eau, les villes intelligentes
  • Hub Ouest (13 Etats), piloté par UC San Diego, UC Berkeley et University of Washington, focalisé sur la gestion des ressources naturelles, les technologies hardware sous-jacentes, le machine learning et la médecine de précision.

Ces 4 consortia lauréats disposeront chacun d’un site web dédié et seront également rassemblés sur le portail commun https://bdhub.info. Les leaders des différents hubs ont présenté leur stratégie régionale lors d’une conférence inaugurale qui s’est tenue du 3 au 5 novembre à Arlington en Virginie [6]. Les multiples missions confiées à ces hubs recouvrent la plupart de celles remplies par nos pôles de compétitivité depuis 10 ans, de l’animation de l’écosystème à l’accompagnement vers les sources de financement, de la circulation des bonnes pratiques à l’émergence de nouveaux projets collaboratifs, de la définition de projets pilotes territoriaux à la promotion du transfert de technologies.

Le cas de UC Berkeley, qui copilotera le hub Ouest, sera probablement intéressant à observer, pour comprendre comment s’opérera la partition entre d’un côté les projets collaboratifs inter-universités et inter-Etats dans le cadre du hub, et de l’autre les projets internes à l’université, conduits dans ses propres laboratoires de recherches. UC Berkeley peut en effet déjà s’appuyer sur le laboratoire AMP, évoqué précédemment, et sur l’institut interdisciplinaire dédié aux sciences des données, BIDS (Berkeley Institute for Data Science) [7], sans compter le CITRIS (http://citris-uc.org) ou l’ITS (Institute of Transportation Studies), deux instituts d’excellence également plongés au cœur de la révolution des données. C’est Meredith Lee, une ancienne du Département de la Sécurité Intérieure des Etats-Unis, qui a été recrutée à Berkeley pour prendre la direction du hub, tandis que Michael Franklin, professeur d’informatique et co-directeur d’AMP, jouera le rôle de président.

Dans la foulée immédiate de l’annonce des hubs, la NSF vient par ailleurs de lancer un second appel à candidatures, pour constituer également ce qu’elle appelle des spokes [8]. Le modèle « moyeu/rayons » (hub/spokes) a été choisi pour exprimer la complémentarité et l’interdépendance entre les 2 approches, et pour insister sur le côté largement ouvert et rassembleur des hubs, par opposition à des collectifs plus réduits, plus engagés dans une direction donnée, avec des objectifs et une mission bien précise pour les spokes. Selon Fen Zhao, responsable du programme BD Hubs à la NSF, les spokes ne sont ni des projets de R&D, ni des mini-hubs, plutôt une segmentation différentes des enjeux du big data (ex : le partage des jeux de données, ou la mise au point d’outils d’analyse robustes et partagés). Les collectifs intéressés par cet appel pourront déclarer leur intention avant mi-janvier 2016 et finaliser leur dossier avant fin février. 2 types de financements sont disponibles, des tickets exploratoires pour préparer une future candidature (100K$ sur 1 an) et des subventions pour les candidatures effectives (1M$ sur 3 ans). La NSF consacrera à cet appel une enveloppe totale de 10M$, ce qui devrait permettre de financer une dizaine de tickets exploratoires et 9 dossiers de spokes.

Fen Zhao [9] précise que le modèle hub/spokes est expérimental pour la NSF, même si sa structuration peut faire penser à celui utilisé pour les Research Coordination Networks (RCN), qui s’adressent à la communauté académique pour l’émergence de consortia de recherches. D’après elle, le choix de proposer un découpage régional plutôt qu’une série d’alliances thématiques directement au niveau national tient au fait que de tels « chapeaux nationaux » existent déjà et qu’ils peuvent présenter certaines limites en termes de véritable interaction entre les acteurs des écosystèmes régionaux. Le découpage des 4 régions pour implémenter ces BD Hubs s’appuie sur des données de recensement, afin d’équilibrer la partition en termes de population (et pas de poids économique ou d’excellence de recherche). Fen Zhao rappelle par ailleurs que ces communautés (hubs et spokes) ne sont pas figées et pourront accepter de nouveaux membres. En réponse à la question sur l’ouverture internationale de cette démarche, elle mentionne un champ de coopération possible et souhaitable, celui du partage de grands jeux de données mondiales.


Rédacteur :
- Philippe Perez, Attaché pour la Science et la Technologie, philippe.perez@ambascience-usa.org