On entend beaucoup parler d'intelligence artificiel dans le monde du numérique depuis quelques années. C'est un sujet qui m'agace beaucoup, car le marketing s'est emparé d'un concept et l'a simplifié à outrance. Maintenant on ne sais plus de quoi on parle.

Machine learning

L'essentiel des sujets sur l'IA ne traite pas d’intelligence mais de machine learning, c'est à dire des processus d'apprentissage transposés à un ordinateur qui vont lui permettre d’acquérir des capacités de choix plus performantes basées sur l'apprentissage et non l'analyse. Le machine learning est un morceau de la science de l’intelligence artificielle, ce n'est pas toute l'IA. En gros, on donne à la machine des milliers de problèmes avec leur solution à analyser. La machine, si les algorithmes sont bien écrits, peut ensuite, quand on lui présente un problème, trouver beaucoup plus rapidement la réponse. Il n'y a aucune capacité déductive, c'est un mécanisme statistique.

Dernièrement, cette approche a été utilisée en médecine. Cela permet d'obtenir extrêmement rapidement et automatiquement, une lecture des scanners des patients pour détecter d'éventuels cancers. Grâce à l'apprentissage, la machine aboutie à un taux de réussite équivalent à une équipe de médecins spécialisés. La médecine est un secteur qui produit beaucoup de données complexes, mais qui ont un énorme avantage, c'est qu'elles sont validées et complétées par une expertise humaine. On a donc des millions de données médicales, interprétées par des médecins, et dont on connaît les suites médicales. Ces données sont en plus extrêmement reproductibles. Une mine de données pour former des algorithmes prédictifs.

Le machine learning est partout, il existe même des modules à ajouter aux programmes informatiques. Renomé IA, c'est l'Eldorado du moment, le bonus marketing à mettre sur une fiche produit.

Et avec quoi entraîne-t-on les machines à apprendre ?

Dès que l'on dispose d'une grande quantité de données, il est possible de les donner à manger à une machine, et donc de produire des analyses ou des prédictions sur des échantillons de données beaucoup plus réduits. C'est ce que font nos très, très chers GAFAM. Toutes les données que nous partageons avec eux sont digérées en permanence par des milliers de machines dont la seule mission consiste à essayer de prédire les comportements individuels.

Ces géants du net font du machine learning depuis longtemps, c'est comme ça qu'il valorisent les données que nous leur donnons.

C'est magnifique, j'en veux !

Le problème, c'est que le machine learning n'est pas de l'intelligence, mais de l'ingurgitation de données. La question est la pertinence de ces données.

Dernièrement, un magnifique scandale a explosé chez Amazon qui avait mis en place un système de tri des CV par une machine. Qu'a donc fait la machine ? Puisqu'elle a été entraînée à partir des recrutements précédents qui avaient fonctionné, elle a reproduit les même schéma de tri que les service de recrutement faisaient avant, qui étaient sexistes et racistes.

Le machine learning n'est pas de l'intelligence, mais une automatisation de processus complexes. Et tout comme le code d'un programme défini comment il fonctionne, la source d'apprentissage définie ce que la machine va faire des données futures.

Ce sont les algorithmes et ceux qui les écrivent qui décident, quant ils ont les compétences...