NLP

Novelis classée 2ème sur le challenge de recherche international SPIDER autour du NLP

23/03/2021

NLP

23 Mar , 2021 read

Un pas de plus vers la démocratisation de l’Intelligence Artificielle et du NLP (Natural Language Processing)

A Paris, le 25 mars 2021 – Novelis, jeune entreprise innovante de conseil et de technologie, participe actuellement à deux challenges de recherche sur la scène internationale visant à générer des requêtes SQL automatiquement grâce au langage naturel. Suite à la publication récente de ses travaux, Novelis se positionne ainsi aux côtés des leaders en Intelligence Artificielle tels que Microsoft, Salesforce, Google et bien d’autres.

Le volume de données traitées quotidiennement dans le monde n’a jamais été aussi important et ces dernières sont majoritairement rassemblées dans ce que l’on appelle des bases de données relationnelles sur lesquelles la maîtrise d’un langage de requête structurée SQL (Structured Query Language) est nécessaire pour stocker ou manipuler les données en question. L’objectif des travaux de recherches menés par Novelis visent à démocratiser l’accès à ces données en générant automatiquement ces requêtes techniquement complexes à partir du langage humain, aussi appelé traitement naturel du langage ou NLP (Natural Language Processing).

Novelis participe ainsi à 2 grands challenges internationaux : SPIDER et WikiSQL

Le challenge Spider piloté par l’Université de Yale, regroupe un ensemble de données sémantiques complexes et inter-domaines à grande échelle et de requêtes SQL. L’objectif de Spider est la transformation du texte naturel en anglais vers des requêtes SQL exécutables (cette tâche est connue par son nom anglais “Text-to-SQL task”). Ce challenge se compose de 10 181 questions, 5 693 requêtes SQL complexes uniques sur 200 bases de données avec plusieurs tables couvrant 138 domaines différents. Suite à la publication de ses travaux et au moment de la publication de cet article, Novelis se place au 2ème rang mondial, aux côtés de Salesforce, à seulement 2.9 points d’écart du premier (Tel-Aviv University & Allen Institute for AI). Il faut savoir que ce type de challenge est évolutif et que les résultats peuvent changer. En savoir plus et découvrir les résultats : Spider: Yale Semantic Parsing and Text-to-SQL Challenge (yale-lily.github.io)

L’objectif du challenge WikiSQL est le même que pour Spider mais avec des contraintes et des contextes différents. On ne va traiter ici qu’une seule table à partir de modèles avec apprentissages non-supervisés (où la machine opère de façon indépendante) ou avec apprentissages supervisés (où la machine se base sur des annotations dont elle génère des prédictions). Des entreprises leaders en Intelligence Artificielle et NLP participent à ce challenge aux côtés des plus grandes universités  Microsoft, Google, Alibaba et Salesforce, les universités de California, Berkeley, Fudan… Dans le cadre de ses travaux, Novelis a réalisé un modèle d’apprentissage hybride qui la positionne à la 7ème place du classement sur 31 travaux scientifiques. En savoir plus et découvrir les résultats : GitHub – salesforce/WikiSQL: A large annotated semantic parsing corpus for developing natural language interfaces.

Novelis a fait de l’innovation et de la R&D une priorité stratégique dans son développement

Depuis sa création, Novelis a fait le choix d’investir massivement (30% de son chiffre d’affaires) dans la recherche et le développement. Pour Mehdi Nafe, CEO de Novelis « Au-delà des impacts sur la recherche fondamentale, notre volonté est de faire évoluer le modèle de conception des logiciels pour atteindre l’excellence opérationnelle, changer le rapport aux technologies et impacter durablement les processus d’innovation dans la société. Les avancées majeures de ces dernières années autour de la data science, de l’IA ou plus récemment du NLP, offrent un potentiel immense en termes d’usages et d’optimisation des processus métier. La création d’un Laboratoire de R&D est l’un des actes fondateurs de Novelis. En tant que société technologique, s’engager dans la recherche est pour nous un élément clé et nécessaire pour mieux servir nos clients. »

Blogs recent

Tous les blogs