Deep learning, quésako ?

L’apprentissage profond ou deep learning  est la branche de l’intelligence qui  attire beaucoup l’attention ces  dernières années à cause des performances incroyables qu’il permet d’obtenir quel que soit le domaine dans lequel on l’utilise. Que ce soit les voitures autonomes, la détection de cellules cancéreuses par imagerie médicale,  le traitement du langage naturel ou encore le programme AlphaGo, qui a battu le champion du monde du jeu GO, tous utilisent des algorithmes d’apprentissage profond. Dans cet article, nous présenterons un résumé des concepts et origines de l’Apprentissage profond, puis nous décrirons ses composants et son fonctionnement. Enfin, nous évoquerons quelques-unes de ses utilisations dans la vie de tous les jours.

Origines et concepts

Sur le plan conceptuel, l’apprentissage profond est inspiré par le cerveau humain. Ses origines remontent aux travaux de  McCulloch et Pitts, qui dans les années 1940 ont montré que les neurones du cerveau sont des unités de seuil avec des états de marche et d’arrêt ; ainsi, il est possible de construire un circuit booléen pour effectuer des inférences logiques, en connectant des neurones entre eux. En 1947, Donald Hebb a établi le principe de modulation des connexions entre neurones, permettant aux neurones de mémoriser de l’expérience. Selon ce principe, les neurones du cerveau apprennent en modifiant la force des connexions qui les relient. Si deux neurones sont activés ensemble, la force de la connexion entre eux augmente et s’ils ne le sont pas, cette  connexion diminue. Enfin, les expériences de Fukushima (1982-1999) ont permis de comprendre  que le cortex visuel effectue une reconnaissance des motifs de manière hiérarchique.  L’idée, derrière ces travaux et bien d’autres encore (Norbert Wiener en 1948,  Frank Rosenblatt en 1957, etc. ) est d’essayer de construire des machines intelligentes en simulant de nombreux neurones, pour conduire à la création des réseaux de neurones artificiels qui sont aujourd’hui à la base des applications de deep learning.

Principes et fonctionnement

Le Deep Learning est l’une des principales technologies de Machine Learning et d’intelligence artificielle qui s’appuie sur des réseaux de neurones artificiels à plusieurs couches dites couches cachées. Plus le nombre de couches est élevé, plus le réseau est « profond ». Les couches permettent à une application de Deep learning de décomposer de manière hiérarchique le contenu d’une donnée complexe, pour ensuite la classifier, en identifiant des caractéristiques spécifiques comme des mots ou des tonalités dans une voix ou encore des tags descriptifs dans une image.  En effet, pour une application de Deep learning, les données aussi complexes soient-elles, sont constituées de structures hiérarchiques. Une image par exemple est considérée au niveau le plus granulaire, comme un ensemble de pixels. Les combinaisons de pixels constituent des bords qui, lorsqu’ils sont combinés, forment des textons (formes à bords multiples). Les textons forment des motifs et les motifs forment les parties de l’image. En combinant ces parties ensemble, on obtient l’image finale. De la même manière, il existe une hiérarchie inhérente aux données textuelles. Les caractères forment des mots, lorsque nous combinons des mots ensemble, nous obtenons des groupes de mots, puis en les combinant nous obtenons des phrases. Les phrases nous disent finalement quelle histoire est véhiculée par le texte. On retrouve la même structure hiérarchique dans la représentation de la parole où les échantillons composent des bandes, qui composent des sons, puis des phonèmes, puis des mots entiers, puis des phrases.
Dans le deep learning, notamment pour la détection d’images, le réseau de neurones découvre tout seul les composantes de la donnée avec des niveaux d’abstraction évoluant de bas en haut et de couche en couche. Chaque niveau du réseau, réalise une fonction de classification d’un type d’objet en un type d’objet supérieur ; ainsi, pour la reconnaissance faciale par exemple, le réseau recevra en entrée une image sous forme  pixels. Une première couche va classifier les pixels pour identifier des formes ; les formes sont ensuite  passées à une autre couche qui aura pour but d’identifier par exemple un nez et ainsi de suite jusqu’à une dernière couche qui va permettre de reconnaître le visage en question. Il faut noter que cette dernière étape utilise des calculs de probabilité ce qui fait que les applications de deep learning ne sont pas  infaillibles ; elles peuvent se « tromper » dans leurs prévisions ou classifications. C’est pour réduire au maximum ces erreurs, que le deep learning a besoin de grands volumes de données pour « apprendre » toutes les subtilités du problème à résoudre.
Le deep learning exploite de très nombreuses variantes des réseaux de neurones multicouches selon l’objectif visé. On retrouve par exemple le perceptron multicouche totalement connecté, les réseaux de convolution (CNN), les réseaux récurrents (RNN), les réseaux à mémoire (LSTM), les réseau à graphe (GNN), les réseaux génératifs (GAN), etc.

Applications

Depuis 2012, le deep learning s’impose dans presque tous les domaines. Il est surtout utilisé aujourd’hui pour la reconnaissance des formes dans les images et celle de la parole. Il peut aussi servir à exploiter des données textuelles non structurées. Les principales applications du deep learning se retrouvent dans la reconnaissance faciale, la rédaction automatique, les véhicules autonomes, les diagnostics médicaux, les recommandations personnalisées, les modérateurs automatiques, les réseaux sociaux, les prédictions financières et trading automatisé, l’identification de pièces défectueuses, la détection de malwares ou de fraudes, les chatbots, l’exploration spatiale, les robot intelligents etc.

Remarques

Le deep learning a prouvé son efficacité et son utilité dans beaucoup de domaines et ses performances continueront de s’améliorer dans les années à venir. Il faut cependant noter qu’il est très coûteux en ressources machines, surtout pendant les phases d’entraînement. Il faut aussi préciser que le deep learning ne réfléchit pas, il ne fait qu’utiliser des algorithmes, les probabilités et des connaissances métiers pour proposer des solutions à des problèmes. Par ailleurs, le deep learning n’est pas exclusivement dédié au traitement de l’image et du langage. Il peut aussi servir dans d’autres environnements complexes comme dans le traitement de graphes, comme en génomique ou en chimie. Notons enfin, que le deep learning n’est pas la solution à tous les problèmes que l’intelligence artificielle cherche à traiter. Sur certains problèmes, d’autres techniques d’IA peuvent être plus efficaces et surtout plus simples à mettre en œuvre que le deep learning. 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut