ONNX : vers la standardisation des outils de l’apprentissage automatique

, Partager

Les avancées dans les domaines de l’apprentissage automatique et de l’apprentissage profond ont mené à la création d’outils toujours plus nombreux, qu’ils soient propriétaires ou non. Face au besoin de standardisation, les acteurs de l’intelligence artificielle ont décidé de joindre leurs forces pour développer un socle commun.

Des environnements techniques différents

Avant de prendre pied dans l’industrie, l’intelligence artificielle, dont l’apprentissage automatique est l’une des disciplines centrales, reposait sur un petit nombre d’outils destinés aux chercheurs. L’intérêt croissant des entreprises telles que Google, Facebook ou encore Microsoft, pour l’exploitation de données massives a poussé ces géants à concevoir leurs propres outils dédiés au machine learning. Ainsi, l’industrie dispose aujourd’hui d’une multitude d’outils, libres ou propriétaires, reposant sur des standards différents.

Des objectifs communs

Les outils créés par les départements de recherche et développement des géants de la tech, prennent le plus souvent la forme de bibliothèques logicielles intégrables au sein d’autres applications ou plateformes suivant l’usage. Au cœur des applications d’Amazon, de Google, d’Apple ou de Microsoft, chaque acteur a cloisonné son développement, tentant d’imposer son moteur dans un contexte concurrentiel. Chacune de ces boites à outils indépendantes a pour objectif de fournir un modèle issu de données d’entrainement, utilisé ensuite pour identifier des objets au sens large (texte, image, son etc).

Le logiciel libre, plateforme de développement et force de proposition

Tensor Flow, PyTorch, Apache MTNx ou Cognitive Toolkit sont tous des logiciels libres. La stratégie de leurs éditeurs de les rendre librement accessibles est une force pour eux, externalisant une partie de la recherche et développement tout en s’assurant l’adhésion de la communauté et l’émergence de processus standardisés.

L’écosystème bâti autour des différents types d’apprentissages, socles communs de l’intelligence artificielle, n’est plus simplement composé d’un petit nombre d’outils à destination du chercheur. Les développements autour du véhicule autonome, de la reconnaissance d’images, de la sécurité ou encore de la robotique, ont rendu l’apprentissage automatique indispensable à la multidisciplinarité des projets.

ONNX : vers une standardisation des modèles

L’une des problématiques engendrées par la concurrence est l’émergence de standards incompatibles. Assurer la compatibilité d’un modèle généré par une bibliothèque lors de l’intégration dans un autre logiciel est difficile et chronophage. Dans une optique d’assurer l’interopérabilité des bibliothèques logicielles, les grandes firmes de l’IA (Amazon, Microsoft et Facebook), via leur politique Open-Source ont ainsi travaillé sur un format ouvert et commun. Le projet ONNX (Open Neural Network Exchange), entré officiellement en production, rend les outils de l’IA interchangeables en proposant un cadre commun à destination de la communauté, par l’intermédiaire de groupes de travail, notamment sur la plateforme GitHub. L’un des grands acteurs de l’intelligence artificielle, bien que contributeur au logiciel libre via ses outils d’apprentissage automatique (Tensor Flow et Sonnet) ne participe pas à se projet. Google fait ainsi le choix d’affirmer une position alternative, semblant poursuivre un objectif différent que celui de favoriser l’accès à une intelligence artificielle générale.

Perspectives

Dans les récentes annonces en marge de la conférence des développeurs du réseau social Facebook, le point central est le rôle prépondérant de la communauté Open Source. Elle intervient ici à la fois comme force de développement et comme caution unificatrice pour la création d’un format commun. Ce format est de bon augure pour les acteurs exploitant le machine learning, ayant notamment pour effet de potentiellement voir l’apparition de modèles ouverts déjà entrainés. Leur compatibilité avec tous les outils via ONNX pourrait également bénéficier à la recherche académique en renforçant sa capacité à fournir des modèles entrainés sur des données auxquelles il est difficile d’avoir accès (spatial, nucléaire, physique etc.).


Rédacteur :
- Marc-Emmanuel Perrin, Attaché Adjoint pour la Science et la Technologie, Consulat Général de France de San Francisco, deputy-sf@ambascience-usa.org

Sources
- http://onnx.ai
- https://code.facebook.com/posts/1714175645317654

- https://code.facebook.com/posts/172423326753505/announcing-pytorch-1-0-for-both-research-and-production/
- https://www.forbes.com/sites/janakirammsv/2018/05/04/facebook-announces-pytorch-1-0-and-expanded-onnx-ecosystem/#73cf0ced3fc0
- https://www.linuxjournal.com/content/onnx-open-neural-network-exchange-format
- https://www.engadget.com/2018/05/02/facebook-open-source-ai-pytorch-tools-development/