Le foutage de gueule des solutions d'AI qui se prétendent Open Source

Généré par DALL·E le 2023-04-04 - many minds connected with a luminous networkCe pouet renvoi vers un tableau des solutions d'AI se prétendant "Open source". On y découvre que c'est bien sûr une vaste fumisterie pour la grande majorité et tout particulièrement ChatGPT.

Le principe d'un logiciel Open Source, c'est que l'on puisse en analyser le code et le reconstruire chez soit en disposant de son code et de la documentation nécessaire. Cette ouverture du code pose un problème pour bon nombre d'entreprises, selon comment elles bâtissent leur modèle économique. Même si code ouvert ne veut pas dire gratuité, cela veut dire transparence puisque tout le monde a accès à la technologie et aux algorithmes. Pour que cela fonctionne en entreprise, il faut que le business de l'entreprise soit le service autour du logiciel et non le logiciel lui même. Il faut aussi être suffisamment compétitif pour que les concurrents n'aient pas d'avantage à consulter votre code et accepter que les clients soient "libre" d'aller voir ailleurs. Bref ce n'est pas donné à toutes les entreprises.

Or les solutions d'Intelligence Artificielle sont en plein essor, dans un marché hyper concurrentiel et juteux. Personne n'est prêt donner à la concurrence l'accès aux sources de son produit. Et ceci d'autant plus que dans le domaine de l'AI, le logiciel ne fait qu'une toute petite partie. Le gros du job, c'est la construction des sets d'apprentissage, de la configuration de l'apprentissage et des mesures de correction de cet apprentissage.

Donc admettons, le business de l'AI n'est prêt pour l'open source, il est encore trop concurrentiel. Soit. Mais alors, pourquoi tous les produits qui sortent se prétendent open source ?

A mon avis, j'imagine les raisons suivantes:

  • L'AI vient du monde universitaire qui est perméable aux concepts d'open source et de réciprocité qu'il induit. La recherche est un domaine de connaissance incrémentale qui ne peut fonctionner que si les résultats sont (1) publiés (2) reproductibles. Pour attirer les talents, bosser avec les labos, les entreprises qui travaillent dans le secteur de l'AI doivent séduire les chercheurs et à minima les brosser dans le sens du poil.
  • Les logiciels propriétaires, et pire encore les plateformes de service qui enferment les données des entreprises pour en faire des clients captifs, commencent à avoir mauvaise presse. Je ne serais pas surpris que commercialement parlant le logiciel ouvert commence à être porteur auprès des clients finaux.
  • Même lorsqu'un logiciel est à code ouvert, cela ne veut pas dire que n'importe qui peut en copier le code source et s'en resservir. Code ouvert, ne veut pas dire code libre, et il peut y avoir des copyright, des brevets ou toute solution pour rendre le code inutilisable par un concurrent. Se faisant, c'est aussi un moyen d'empêcher les concurrents d'utiliser certains algorithmes. Comme le brevet qui publie une solution technologique pour la protéger, le code ouvert non libre est un moyen de montrer le code tout en empêchant les concurrents de s'en servir, et donc de marquer le territoire dans une course concurrentielle.

Ce ne sont que des hypothèses, je n'ai pas fait de recherche sur le sujet, mais cela me semble assez probable.

Partager Partager ce billet sur les réseaux sociaux

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet