L’I.A. au service de l’automatisation des processus : mythe ou réalité ?

 

Réseaux de neurones, Machine Learning, Deep Learning, … Les algorithmes d’Intelligence Artificielle (I.A.) sont aujourd’hui omniprésents dans notre quotidien ! Couplés au big data -alimenté par notre monde désormais hyper connecté – ils semblent pouvoir révolutionner tous les domaines : celui de la santé, du commerce, de l’art ou même de la politique internationale comme l’a récemment titré Le Monde (1). Mais quid de l’I.A. et de l’automatisation des processus documentaires ? Quelles applications ? Mythe ou réalité ? On fait le point !

 

Non l’I.A. n’est pas une nouveauté

On pourrait croire que l’I.A. est un concept du 21eme siècle. Il n’en est rien !
Lorsque l’on parle I.A., nous avons tous en tête des innovations récentes telles que la Google Car roulant sans pilote mais capable d’évoluer sans encombre en plein centre-ville. Ce que l’on sait moins c’est que l’histoire de l’I.A. remonte aux années 50 avec Alan Turing, considéré comme le précurseur de l’I.A. et connu pour son fameux « test de Turing » (2), l’une des premières expériences en matière d’Intelligence Artificielle de l’histoire. Plus près de nous – mais il y a 20 ans tout de même (1997) – Deep Blue, le super-ordinateur d’IBM battait pour la première fois le champion du monde d’échecs, Garry Kasparov. Mais il faudra attendre 2016, pour qu’AlphaGo, l’algorithme d’I.A. de Google DeepMind batte le champion Coréen de Go – jeu plus complexe que les échecs dont le nombre de combinaisons possibles serait supérieur au nombre d’atomes dans l’univers. Dernier retentissement en date en octobre 2017 : une nouvelle version d’AlphaGo nommée AlphaGo Zero devient 100% autodidacte. Cette fois l’IA n’apprend qu’en jouant contre elle-même, plus aucune supervision humaine n’est nécessaire pour réussir à battre en 1 mois seulement le meilleur joueur de GO.
En presque 70 ans, l’I.A. n’a cessé de progresser en efficacité !

L’I.A. fait son « revival »

Si l’I.A. n’est pas une nouveauté en soi, il est un point indiscutable : nous assistons depuis quelques années à un véritable « revival » de l’Intelligence Artificielle.
Selon une enquête réalisée par Serena Capital (3), trois fois plus de start-up spécialisées dans l’Intelligence Artificielle ont été financées en 2016, par rapport à 2015. Et le sujet de l’I.A. ne suscite pas seulement l’intérêt des entrepreneurs et des géants du web : philosophes, juristes, scientifiques, déontologues, politiques… s’emparent du débat.

Cette renaissance s’explique par la conjonction de 3 facteurs cruciaux :

  • L’explosion des data, créant ainsi une immense base de données mondiale issue de l’usage désormais massif d’internet et du cloud ;
  • L’accès à des coûts de plus en plus faibles à des « supercalculateurs » informatiques capables de brasser et analyser ces big data dans des temps record ;
  • Les progrès sur l’étude du fonctionnement du cerveau humain qui permet à ces supercalculateurs de ne plus seulement gérer des données sous l’angle de la « connaissance » mais aussi sous l’angle de la « compréhension » devenant ainsi de fait intelligent.

Tous les secteurs d’activités sont concernés

Ainsi, sur ces dernières années, le monde de l’I.A. a permis des progrès visibles dans les techniques de la détection de fraude, dans la reconnaissance vocale (son inventeur n’est autre que Ray Kurzweil, patron de la R&D de Google, également concepteur d’OCR) ou la reconnaissance d’image pour identifier des personnes et objets sur des photos (pièces d’identité, photos de foules…) ou sur des vidéos (permettant ainsi aux voitures sans conducteur de distinguer un piéton d’un panneau de signalisation, ou dans un autre domaine d’identifier les émotions des clients filmés devant un article dans un magasin).

A plus ou moins court terme, tous les secteurs d’activité sont concernés par l’I.A. :

  • Des robots conversationnels destinés à optimiser le service clients en ligne sont promis à un fort développement dans le BtoC ;
  • Les banques s’appuieront sur l’I.A. pour connaître parfaitement leurs clients et leur proposer des solutions d’investissement sur mesure ;
  • Les assureurs auront de nouveaux risques à couvrir, par exemple avec l’avènement des transports conduits par un programme d’I.A. ;
  • Dans le domaine de la santé, des programmes d’aide au diagnostic médical révolutionneront le suivi des patients en détectant des pathologies émergentes le plus tôt possible…

Ce ne sont que quelques exemples. L’effervescence des startups est considérable et les applications innombrables.

Quid des processus documentaires ?
ITESOFT et l’I.A., une longue histoire…

Dans le monde de la capture de documents et de l’automatisation des processus, l’utilisation de l’IA fait aussi partie du quotidien comme le rappelle Vincent Poulain d’Andecy, Responsable du Laboratoire R&D au sein du groupe ITESOFT :

« Chez ITESOFT, nous pratiquons aussi l’I.A. et cela depuis fort longtemps. Notre première utilisation des réseaux de neurones remonte au tout début des années 90. Aujourd’hui nous travaillons sur des technologies beaucoup plus poussées telles que l’Incremental Learning. »

Voici quelques illustrations pratiques des applications d’ITESOFT dans le domaine de l’IA :

Des réseaux de neurones et du Deep Learning pour apprendre l’écriture manuscrite

Dès le début des années 90, pour lire automatiquement des formulaires, ITESOFT s’est appuyé sur les réseaux de neurones pour effectuer de l’OCR sur des caractères manuscrits. Objectif : simuler la vision humaine pour faire de la reconnaissance automatique de formes. Les réseaux de neurones sont aujourd’hui encore utilisés par les solutions ITESOFT… mais dans une version toutefois beaucoup plus puissante désormais car capable d’effectuer un apprentissage sur un volume de données sans commune mesure : on parle là du Deep Learning.

Du Machine Learning pour typer et classer des documents

Les solutions ITESOFT permettent aussi d’identifier automatiquement la nature de tout type de documents entrants et de les trier selon leur classe : RIB, pièce d’identité, facture, courrier de réclamation… Comment ? En exploitant les techniques d’apprentissage du Machine Learning. Si les premières applications de l’éditeur, permettaient dès 1993 d’analyser des flux de formulaires avec des classes de documents assez limitées (ex : distinguer des feuilles de soins médecins, auxiliaires ou biologie), il est aujourd’hui possible pour le système d’apprendre des flux très hétérogènes de documents de plusieurs dizaines voire centaines de classes.

Du Text Mining pour catégoriser des courriers libres

Les années 2 000 ont été marqués par un nouvel enjeu i.e. typer des documents « non-structurés » tels que des courriers libres. Chez ITESOFT, cette variabilité extrême du document (les informations peuvent être écrites n’importe où sur le document) et de son contenu (une même information peut avoir différentes formulations selon les individus) a pu être adressé au travers de l’I.A. et du Text Mining. Le Text Mining utilise des techniques de traitement automatique du langage naturel tout comme l’humain le ferait. Il détecte et sélectionne des groupes de mots appris pour catégoriser un contenu. Exemple ? Trouver les mots « bulletin » et « salaire » séparément dans un courrier est insuffisant pour indiquer qu’il s’agit d’un bulletin de salaire. En revanche, trouver le groupe de mots « bulletin de salaire », expression du langage naturel – que le système aura appris et saura reconnaître quel que soit sa position dans le courrier – sera particulièrement utile pour le typage.

Des Systèmes Experts pour traiter automatiquement les factures

Les factures fournisseurs sont les documents « semi-structurés » par excellence : il existe autant de formats de factures que de fournisseurs. Dès lors, comment automatiser un flux aussi variable et hétérogène ? L’approche d’ITESOFT est celle des « Systèmes Experts ». Au départ, le système est alimenté d’un ensemble de connaissances et de règles sur les problématiques du traitement de la facture qui vont lui permettre par la suite de faire de lui-même des déductions. Nous pouvons même le spécialiser avec des boucles d’auto-apprentissage. Parmi ses connaissances : des bibliothèques de mots clés ou des règles de format de données qui vont lui permettre de retrouver et d’extraire les données des factures. Ainsi, lorsqu’un format « date » est identifié à proximité d’un mot-clé « date », lui-même localisé à proximité du « numéro de la facture », alors le système saura déduire de lui-même que l’information lue correspond à la « date de facture ». Le système reproduit ainsi la logique – la déduction – qu’aurait eu le comptable !

…Et de nouveaux horizons

La recherche ne s’arrête pas. Parmi les travaux les plus récents du laboratoire R&D d’ITESOFT, deux innovations majeures sont à souligner :

La Capture as a Service (CaaS) : un tout nouveau « super système expert »

La Capture as a Service est une nouvelle approche disruptive de la capture de documents en mode cloud enrichie de fonctions cognitives et d’Intelligence Artificielle. Dans le domaine du traitement de la facture, les moteurs d’identification de fournisseurs et de lecture de documents d’ITESOFT s’appuient ainsi sur une base de connaissance mutualisée, plus complète et de meilleure qualité que celles de chaque clients pris indépendamment. Au final : un super système expert à la puissance décuplé ! Et des taux d’automatisation qui passent de 50% à 85%.

L’Incremental Learning : lorsque le périmètre documentaire est changeant

Le Deep Learning est particulièrement bien adaptée pour typer de nombreux documents. Une limite cependant : il ne peut reconnaître que des éléments présents dans son set d’apprentissage. Si le périmètre documentaire est connu, peu variable, aucun problème ! En revanche si votre flux documentaire évolue souvent, le Deep Learning devra régulièrement refaire un apprentissage complet pour rester performant dans le temps.
L’Incrémental Learning permet de pallier à cela. Il n’est plus nécessaire de ré-entraîner le système, il le fait de lui-même en permanence. La machine progresse en auto-apprenant – au fur et à mesure- des nouveaux documents reçus.

Attention toutefois de ne pas céder trop vite au chant des sirènes de l’I.A. : privilégiez le résultat avant tout

Nous l’avons vu, les applications et les opportunités existent bel et bien. Mais ne nous y trompons pas l’I.A. n’est pas une finalité en soi. L’innovation – qu’elle soit portée par l’I.A. ou pas – se doit toujours de servir un résultat de performance. C’est la vision portée par ITESOFT. Vouloir à tout prix utiliser des algorithmes d’I.A. sans se poser la question de leur intégration dans le processus global de gestion documentaire peut parfois paradoxalement s’avérer moins efficace. A quoi bon par exemple mettre en place du Deep Learning si votre flux comporte seulement quelques classes de documents ?

Vous l’aurez compris, l’I.A. au service de l’automatisation des processus est bel et bien une réalité pour ITESOFT et pour ses clients. Elle n’a en fait jamais cessé de l’être. Ses équipes y travaillent quotidiennement, avec le bon sens et le recul nécessaire, guidées par la quête de l’efficacité avant tout !

Envie de mieux comprendre les impacts de l’Intelligence artificielle sur notre quotidien ?

Revivez l’intervention de Stéphane Mallard, Digital Evangelist lors de la Rencontre Clients ITESOFT 2016

Conférence :

INTELLIGENCE ARTIFICIELLE :
COMMENT VA-T-ELLE CHANGER NOS VIES ?

Stéphane MALLARD, Innovation & Strategy Evangelist
Jeudi 23 Juin 2016 / Paris 8ème (les Salons Hoche)

 

Article écrit par Laurent Olier,
Directeur de Projet Marketing

Laurent rejoint ITESOFT en 2000. Directeur de Projet Marketing et diplômé de l’IAE d’Aix en Provence, il dispose d’une expérience de plus de 15 ans dans la production d’évènements, d’études et de contenus autour de la dématérialisation et de l’automatisation des processus.

ses autres articles
Twitter Facebook LinkedIn