dimanche 2 novembre 2025

C'est moi qui l'ai fait

Mes élèves et mes collègues utilisent abondamment les LLM (IA génératives) pour produire du contenu. Je n'ai pas encore vraiment essayé, même si je sais que l'outil peut être très intéressant. Et sur ce blog, je réalise qu'à l'heure de l'usage massif des IA générative, je continu à écrire avec mes petit doigts, des billets plus ou moins intéressants. Combien de temps vais-je encore le faire ?

Il y a une demande du législateur pour que les contenus générés par IA soient identifiés comme tel. Si on le comprend assez bien pour ce qui est des images ou des articles publiés sur un média, il me semble beaucoup plus difficile de le faire pour de l'assistance à la rédaction. Par exemple si je demande à une IA générative de:

  • Corriger les fautes de français dans ma prose
  • Générer une image d'illustration pour un texte
  • Faire une recherche bibliographique pour étayer un propos
  • Construire une argumentation à partir d'un plan que j'ai établi
  • Réaliser une présentation à partir d'un texte structuré
  • Faire le résumer de ma prose
  • Traduire un de mes propos
  • Transcrire un de mes discours
  • Corriger un code que je produis
  • Faire une veille sur le net et faire une synthèse
  • ...

Tout cela, les IA génératives le font très bien et bien plus encore. C'est ce que l'on pourrait appeler de l'assistance puisque je reste le créateur des éléments source à partir desquels l'IA générative travaille. Sauf qu'entre aider un peu et faire le travail à la place, la limite est floue. Où placer le curseur entre ce qui doit être tagué comme produit par IA et juste une aide ?

Pour l'instant ce blog est du 100% fait par de l'humain, avec les fautes qui vont bien pour l'illustrer. Pourvu que ça dure :D

Partager Partager ce billet sur les réseaux sociaux

mardi 26 août 2025

Astroturfing massif pour le 10/09

En ce moment, la Russie qui piétine dans sa guerre en Ukraine, redouble d'activité sur le net pour déstabiliser les démocraties occidentales (grandement aidée par Trump, mais c'est un autre sujet). Lors de ma veille média, notamment tout ce qui concerne la culture du hacking, je tombe sur un fils twitter/X qui utilise le terme Astroturfing. Mais que voilà un joli mot !

Sur la page wikipedia du mot Astroturfing on apprend l'origine de ce terme qui vient d'une marque de pelouse synthétique qui se fait passer pour de la vraie pelouse.

Le lien entre la fausse pelouse et les manipulations faites par la Russie, vient du fait que l'astroturfing consiste à faire croire à un mouvement d'opinion sur un sujet qui est normalement minoritaire. En amplifiant un sujet, celui-ci rentre dans l'actualité et est repris par les média ce qui en accroît encore la visibilité. La manipulation sert à amorcer la pompe. Si le sujet est un peu polémique ou populiste, les réseaux sociaux vont ensuite se charger d'en faire un évènement.

Pour ce faire, la Russie utilise des bots gérants de faux comptes pour inonder les réseaux sociaux de messages, mais surtout d'engagement (click, partage, approbation, lecture...) sur une thématique que les manipulateurs veulent pousser en avant. Dans les exemples passés fameux nous avons le brexit, les gilets jaunes, les messages antivax pendant la pandémie. Le thème du moment est la journée du 10 septembre et faire tomber le gouvernement Bayrou.

La France faisant partie des soutiens les plus fermes de l'Ukraine, elle est une cible privilégiée de l'astroturfing russe. Elle n'est bien sûr pas la seule, mais étant avec le royaume uni la seule puissance nucléaire européenne, elle devient un état à déstabiliser le plus possible. Sachant tout cela, c'est juste hallucinant que des partis politiques se fassent le relais d'une telle manipulation, devenant de fait des relais de la propagande Russe, contre la France.

Pour ceux qui ont un compte X, voici le fil expliquant l'analyse des données sur la mobilisation du 10/09 sur les réseaux https://x.com/visibrainFR/status/19... sinon, plus facile à lire, l'article sur le blog de visibrain.

Partager Partager ce billet sur les réseaux sociaux

lundi 4 août 2025

Le spam c'est par vague

Mon blog est une cible récurrente du spam. L'objectif ici est d'afficher des commentaires plus ou moins insipides et d'utiliser la fonction de liens vers le site de l'auteur du commentaire pour créer des liens entrants vers un site web qui cherche à gagner en notoriété dans les moteurs de recherche. Cela n'a pas beaucoup de sens de faire cela sur mon blog qui lui même a une très faible notoriété. Pour que cela représente le moindre intérêt, il faut obtenir des liens entrants depuis un site bien classé par les moteurs de recherche. Mon blog est très loin d'être concerné, mais cela n'empêche pas les pollueurs du net de constamment publier des commentaires bidons sur mon blog, via probablement des outils automatiques dont ils louent les services.

Il y a encore quelques années, il y avait un peu n'importe quoi comme spam, dès qu'un site douteux de webmarketing essayait de pousser le nouveau site de son client. Puis avec la notoriété baissant, mon blog est devenu la cible de sites porno qui représentent encore une bonne part. Dernièrement, j'ai vu arriver du spam un petit peu plus ciblé par rapport aux sujets que j'abordais: des publicités en langue slave lorsque je parlais de la guerre en Ukraine, en langue asiatique (chinois, coréen) quand je parle de kdrama. On voit donc que certains spammeur, font une veille sur les sujets pour essayer de cibler un potentiel public. Ce n'est clairement pas au point. Je suppose que c'est parce que n'étant un gros site web, mon blog récupère les plus mauvais spammeurs ;)

Il est heureux que ce blog soit protégé contre le spam, et que ces pollutions partent automatiquement en quarantaine puis à la poubelle, car cela représente 5 à 10 par jour.

Partager Partager ce billet sur les réseaux sociaux

vendredi 12 juillet 2024

Le web ne sera bientôt plus le web

Mon blog est protégé par différent anti-spam depuis des années, donc à part si un humain le fait, normalement, tous les commentaires louches passent à la poubelle. Jusqu'à maintenant, l'essentiel du spam concerne des sites pornographiques ou d'arnaques, très majoritairement en anglais. Nouveaux arrivants depuis quelques mois, les spams en cyrillique avec des liens vers des site russes . Ils sont apparus dès que j'ai évoqué Poutine et la guerre en Ukraine. Il y a donc des bots qui surveillent les contenus et répondent dans les commentaires.

Le web que nous avons connu risque de bientôt disparaître, submergé par du contenus généré par des bots dopés aux IA génératives. Les blogs ont déjà été passablement anesthésiés par l'émergence des réseaux sociaux, ils devraient d'ici peu être définitivement noyés par les IA génératives sous des tombereaux de commentaires ou de sites générés afin de gruger les moteurs de recherches.

Les contenus produits par de vrais humains vont devenir introuvables sur le web libre, et il est probable qu'ils migrent vers des espaces protégés qui par essence auront tendance à être payants. Certes la liberté de parole ne disparaîtra pas stricto sensu, car n'importe qui pourra toujours dire n'importe quoi, mais les propos humains seront de petites bouées dans des océans de contenus générés ou agrégés. Ils seront donc statistiquement de moins en moins accessibles, et ceux qui continueront à les produire, voudront les protéger, les différentier et donc s'isoleront sur des plateformes dédiées aux humains, avec filtres et contrôle, qui auront un coût.

Une époque de liberté est en train de disparaître. Pas la peine d'être nostalgique, le web évolue, comme un être vivant. On pourra discuter du bon ou du mal de cette évolution, mais elle est inéluctable et il faudra faire avec.

Partager Partager ce billet sur les réseaux sociaux

mercredi 12 juin 2024

Les IA inventent des citations fausses d’auteurs réels

Dès l’émergence de ChatGPT, il est apparu qu’une IA conversationnelle pouvait inventer du contenu, ce qui est un peu ce que l’on attend d’elle, mais aussi des références. Un avocat qui avait demandé à ChatGPT de lui produire sa plaidoirie s’est retrouvé avec des références à des articles de loi tout à fait crédibles mais absolument farfelues. Il s'est fait explosé au tribunal est a gagné en notoriété grâce à ce bad buzz.

On retrouve le même problème pour les sources d’un propos, qui sont attribuées à n’importe qui. C’est l’expérience qu’à vécu Émilie M Bender, qui s’est vu attribuer des propos qu’elle n’a jamais tenus par une IA générative. Un nouveau média, Biharprabha, dont le contenu est généré non pas par des journalistes mais par une IA générative, a mis en ligne un article prêtant des propos faux à Émilie M Bender. Celle-ci se retrouve donc cité comme auteur de propos qui entache sa crédibilité de scientifique, totalement à son insu. Ce n’est que par ce qu’elle fait une veille des articles la citant qu’elle l’a découvert.

Partager Partager ce billet sur les réseaux sociaux

dimanche 10 mars 2024

Des hashtags dans les titres

J'ai commencé dernièrement à mettre le hashtag #kdrama dans les billets où j'en cause. Je vous explique pourquoi.

J'ai mis en place un système qui publie automatiquement sur Mastodon, les billets que je publie ici sur ce blog. Un pouet et un billet diffèrent dans la longueur, mais aussi dans le fait qu'un billet possède un titre et pas un pouet. L'outil qui fait le lien entre mon blog et Mastodon, a donc choisi de publier un lien vers vers le billet et le titre du billet comme contenu du pouet. C'est tout à fait logique, mais du coup, si je veux qu'un pouet comporte un hashtag, il faut le mettre dans le titre.

Pour l'instant je ne le fait qu'avec le sujet des kdrama, mais il n'est pas à exclure que je généralise la chose.

A noter que les hashtag sont des caractère réserver dans les URL donc les liens vers les billets n'en ont pas.

Partager Partager ce billet sur les réseaux sociaux

mercredi 4 octobre 2023

Utilisez Firefox

Dans l'image ci-dessous on voit de petites estafettes de la fondation Mozilla garées devant un Apple Store à Berlin et offrant du café aux passants avec les messages suivant dessus:

  • Safari est un très bon navigateur pour télécharger Firefox
  • Toutes les routes ne mènent pas à Chrome
Utilisez Firefox

Source

Partager Partager ce billet sur les réseaux sociaux

dimanche 10 septembre 2023

Le foutage de gueule des solutions d'AI qui se prétendent Open Source

Généré par DALL·E le 2023-04-04 - many minds connected with a luminous networkCe pouet renvoi vers un tableau des solutions d'AI se prétendant "Open source". On y découvre que c'est bien sûr une vaste fumisterie pour la grande majorité et tout particulièrement ChatGPT.

Le principe d'un logiciel Open Source, c'est que l'on puisse en analyser le code et le reconstruire chez soit en disposant de son code et de la documentation nécessaire. Cette ouverture du code pose un problème pour bon nombre d'entreprises, selon comment elles bâtissent leur modèle économique. Même si code ouvert ne veut pas dire gratuité, cela veut dire transparence puisque tout le monde a accès à la technologie et aux algorithmes. Pour que cela fonctionne en entreprise, il faut que le business de l'entreprise soit le service autour du logiciel et non le logiciel lui même. Il faut aussi être suffisamment compétitif pour que les concurrents n'aient pas d'avantage à consulter votre code et accepter que les clients soient "libre" d'aller voir ailleurs. Bref ce n'est pas donné à toutes les entreprises.

Or les solutions d'Intelligence Artificielle sont en plein essor, dans un marché hyper concurrentiel et juteux. Personne n'est prêt donner à la concurrence l'accès aux sources de son produit. Et ceci d'autant plus que dans le domaine de l'AI, le logiciel ne fait qu'une toute petite partie. Le gros du job, c'est la construction des sets d'apprentissage, de la configuration de l'apprentissage et des mesures de correction de cet apprentissage.

Donc admettons, le business de l'AI n'est prêt pour l'open source, il est encore trop concurrentiel. Soit. Mais alors, pourquoi tous les produits qui sortent se prétendent open source ?

A mon avis, j'imagine les raisons suivantes:

  • L'AI vient du monde universitaire qui est perméable aux concepts d'open source et de réciprocité qu'il induit. La recherche est un domaine de connaissance incrémentale qui ne peut fonctionner que si les résultats sont (1) publiés (2) reproductibles. Pour attirer les talents, bosser avec les labos, les entreprises qui travaillent dans le secteur de l'AI doivent séduire les chercheurs et à minima les brosser dans le sens du poil.
  • Les logiciels propriétaires, et pire encore les plateformes de service qui enferment les données des entreprises pour en faire des clients captifs, commencent à avoir mauvaise presse. Je ne serais pas surpris que commercialement parlant le logiciel ouvert commence à être porteur auprès des clients finaux.
  • Même lorsqu'un logiciel est à code ouvert, cela ne veut pas dire que n'importe qui peut en copier le code source et s'en resservir. Code ouvert, ne veut pas dire code libre, et il peut y avoir des copyright, des brevets ou toute solution pour rendre le code inutilisable par un concurrent. Se faisant, c'est aussi un moyen d'empêcher les concurrents d'utiliser certains algorithmes. Comme le brevet qui publie une solution technologique pour la protéger, le code ouvert non libre est un moyen de montrer le code tout en empêchant les concurrents de s'en servir, et donc de marquer le territoire dans une course concurrentielle.

Ce ne sont que des hypothèses, je n'ai pas fait de recherche sur le sujet, mais cela me semble assez probable.

Partager Partager ce billet sur les réseaux sociaux

samedi 5 août 2023

Twitter c'est fini sur ce blog

Casser l'accès à nos données

Depuis le printemps, avant même qu'Elon décide d'en changer le nom, mes derniers tweets ne s'affichaient plus dans la colonne de droite. Comme je n'avais pas le temps de regarder, j'avais laissé le truc en vrac qui ne bloquait pas le fonctionnement du blog. Et puis dernièrement j'ai mis à jour mon blog et au passage eut pleins de problèmes avec les différents plugins qui ajoutent des fonctionnalités à ce blog. J'ai crus que le plugins qui affiche les flux RSS en provenance de Twitter était cassé. Que néni, c'est Twitter qui a tout cassé.

J'avais trouvé un chouette projet libre, tweetledee, qui permettait de récupérer les flux Twitter et qui en faisait des flux RSS (syndication ou liste des publication avec lien, image et résumer) ou json (pour programmer avec). Installé sur mon site, il me permettait soit de récupérer mes 10 derniers tweet pour les afficher sur le blog, soit les 100 dernier pour en faire des archives que je vous affichait de temps en temps.

Sauf que Elon a décidé que plus personne ne devait pouvoir récupérer les flux Twitter sans être enregistré et accessoirement payer à partir d'un certain volume. Tweetledee ne pouvait plus fonctionner et sur le site les auteur ont simplement annoncés que le projet était mort. Les données que je publie sur Twitter ne sont donc plus accessible si je veux en faire quoique ce soit, même les miennes.

Mastodon, redonner le pouvoir aux utilisateurs

J'ai commencé à partir à la découverte de Mastodon depuis quelques mois. Rien à redire en terme de fonctionnement, c'est très similaire, avec la liberté en plus et les pubs en moins. Par contre, beaucoup des gens que je lis sur Twitter n'ont pas encore fait le pas, et ils et elles me manquent sur Mastodon. Donc je publie très peu et suis plutôt spectateur contrairement à Twitter, mais je pense que les choses vont évoluer.

Du coup, l'encart en haut à droite de ce blog, affiche mes dernier pouets et non plus tweets. Quand j'aurais fini de réparer mon blog suite à la mise à jour, j'améliorerais tout ça.

Partager Partager ce billet sur les réseaux sociaux

mardi 4 avril 2023

Un podcast sur la parole à l'ère des réseaux sociaux à absolument écouter

Grand bien vous fasse !Je suis tombé un peu par hasard sur cette émission, que je n'écoute que de temps en temps, même si en général je l'apprécie. La brochette d'invités de cet épisode est juste exceptionnelle et la bienveillance de l'animateur Ali Rebeihi permet d'aborder ce sujet très violent:

Quand la parole devient une arme de destruction

J'ai adoré en fin d'émission le fait de souligner que la forme de communication utilisée par les réseaux sociaux ressemblait à de l'écrit mais s'apparentait plus à de l'oral, grâce, entre autre, aux émoticons et au principe des likes et du repartage, ce qui incite à l’immédiateté et à l'utilisation du registre de l'émotion. Le format ne permet donc pas la prise de recule et le temps long que permet normalement l'écrit.


Comme je fait de temps en temps, lorsque je tombe sur des vidéos, sons ou textes que je crains de voir disparaître alors qu'ils méritent à mon sens de perdurer, j'en fait une copie locale, mais préférez toujours l'original.

Partager Partager ce billet sur les réseaux sociaux

jeudi 30 mars 2023

Mes derniers tweets et retweets

Ça fait un moment que je n'ai pas archivé sur ce blog mes tweets. La moulinette que je m'étais créé est sympa, mais elle inclue les média de Twitter ce qui permet à cette plateforme de faire du tracking. J'ai donc viré tous les média, c'est pourquoi vous avez un petit logo Twitter gris à la place. C'est moins joli, mais vous n'êtes plus pisté.

Les messages sont par ordre antéchronologique. Pour retrouver un tweet dans son contexte, cliquez sur l'image ou le lien Twitt.

Lire la suite...

Partager Partager ce billet sur les réseaux sociaux

mardi 13 septembre 2022

La Russie, ce fauteur de trouble

Non content de déverser des milliers de trolls sur les réseaux sociaux, de saper la confiance des citoyens européens dans leurs institutions démocratiques, de financer les partis extrémistes, de faire la guerre à ses voisin, on apprend dans cet article que la Russie est aussi une plaque tournante de l'arnaque numérique.

74 % des fonds volés par des ransomwares sont allés à des portefeuilles affiliées à la Russie

C'est un voisin comme on aime...

Partager Partager ce billet sur les réseaux sociaux

samedi 27 août 2022

Censurer la Russie car elle fait la guerre

Le risque de demander à des opérateurs techniques de prendre position dans un conflit éminemment politique c'est qu'une fois qu'ils l'ont fait une fois, qu'est ce qui empêche qu'ils le fassent dans d'autres contextes politiques (dictature, religion, opinion...) ?

Ouest-France @OuestFrance
Conflit en Ukraine. Facebook, YouTube, Twitter… Les géants de la tech priés de prendre position https://zpr.io/PEGyLKjHUNna

Tweet original

C'est le problème des bonnes intentions. Aujourd'hui on veut censurer un vilain. Mais une fois que l'on commence, qui s'arroge le droit de dire qui est un vilain ?

Même problème que la neutralité du Net

C'est tout le principe de la neutralité du Net: internet est supposé être agnostique en matière de contenu. Que vous transportiez des email, du texte, des images ou de la vidéo, le protocole d'internet (TCP/IP) se fiche du contenu et met tout le monde à égalité. Quand on met en place une hiérarchisation des contenus sur un réseau, cela veut dire que l'on met en place les outils capable d'identifier les contenus pour pouvoir les hiérarchiser, donc certains contenu deviennent prioritaires sur d'autres. Une fois l'outil en place, il peut facilement être étendu et détourné pour filtrer les contenus.

Aujourd'hui c'est pour lutter contre la désinformation. Mais il n'y a rien qui ressemble plus à de la désinformation qu'une information légitime. Au delà de la difficulté de les différencier, une fois que l'on en est capable, on peut donc censurer n'importe quel contenu. C'est une boite de Pandore qu'il ne faut pas ouvrir.

Partager Partager ce billet sur les réseaux sociaux

lundi 24 janvier 2022

Message de service sur le tracking et les inclusions de média

J'ai supprimé il y a quelques temps les outils de tracking gratuits de Google qui me permettaient d'avoir des indicateurs sur les visiteurs de mon blog. C'est pourquoi, lorsque vous arrivez sur mon blog, vous n'avez pas une de ces ennuyeuse bannière vous demandant d'accepter d'être surveillé et d'enregistrer des cookies dans votre navigateur.

Sauf que de temps en temps j'insère dans mes billets des vidéos ou des tweets. Ce faisant, je permet aux plateformes qui hébergent ces vidéo de déposer des trackers dans votre navigateur, sans vous demander votre avis. Leur logique est la suivante:

  1. Mon blog est supposé vous avoir demandé l'autorisation de vous espionner.
  2. Donc puisque vous auriez donné l'autorisation à mon blog, par extension vous la donnez à ces plateformes.
  3. Donc ils ne vous demandent plus votre avis.
  4. Et moi je suis dans l’illégalité, puisque je ne vous ai pas affiché l'immonde bannière disant que vous allez être espionné.

Et merde ! J'ai beau enlever les outils de tracking de mon blog, je suis coincé, et je permet aux plateformes de vous surveiller, même si je ne veux pas.

Donc depuis quelques temps, je n'insère plus de vidéos qui ne sont pas hébergées sur mon blog. Pour celle que je ne peux pas héberger, vous n'avez qu'un lien vers la plateforme. Je recopie le texte des tweets et n'insère plus les tweets eux même. Honnêtement c'est moins joli et moins pratique, mais petit à petit, je vais réduire les système de tracking qui parasitent mon blog.

En attendant, je suis en infraction pour les billets passés, mais tant pis, j'espère que vous serez indulgents, car je ne prévois pas de revenir sur les centaines de billets de ce blog (à la louche pas loin de 1500, dont peut être 20% avec des média externes inclus).

Partager Partager ce billet sur les réseaux sociaux

samedi 17 juillet 2021

Un peu de zik

Pour un usage perso, j'ai modifié il y a quelques temps le thème Carnet pour habiller un autre blog Dotclear, et en cherchant ce que sont devenus les auteurs de cet habillage, je suis tombé sur la page d’accueil de l'association "Gironde Logiciel Libre" qui propose une petite radio sans publicité:

https://www.giroll.org/

Il y a des trucs supers ou improbables. En tout cas c'est sympa.

Partager Partager ce billet sur les réseaux sociaux

mercredi 25 décembre 2019

Le déterminisme algorithmique

Un tweet de Séverine Erhel (@Sev_Erhel), professeur psychologie et ergonomie cognitive à l'Université de Rennes 2

Rien de nouveau sur l’éthique mais j’apprends quand même que « 70% des vues sur YouTube sont le résultat de recommandations de son intelligence artificielle », ça questionne sévèrement l’autodétermination des individus sur ce type de plateformes

Citant le le Tweet de Usbek & Rica (@USBEKetRICA)

Le chercheur et Youtubeur de @le_science4all Lê Nguyên Hoang propose des pistes pour faire émerger des IA plus éthiques. Un défi très complexe, mais « l’un des plus excitants à accomplir » « L’attention est devenue le nouveau pétrole » https://usbeketrica.com/article/cer...

Sur ce blog, je m'en prend souvent à Facebook comme modèle caricatural pour illustrer la dangerosité des algorithmes utilisés par les réseaux sociaux. Mais Facebook n'est bien entendu pas le seul. En fait, dès qu'il y a une suggestion de contenu faite par un outil, il y a un algorithme derrière, plus ou moins évolué, qui vise un objectif mercantile.

Cela peut être simplement un produit similaire ou complémentaire dans une boutique en ligne. Dans ce cas l'algorithme est extrêmement rudimentaire et comme l'on est dans un processus d'achat, nous avons toujours notre libre arbitre. Cela reste de la publicité ciblée mais au même titre que les promotions. Le commerçant fait son job de commerçant et il n'y a pas d'entourloupe.

Là où il y a problème, c'est lorsqu'il y a altération de notre capacité d'autodétermination. Et c'est ce que font les algorithmes des réseaux sociaux, ou comme cité ici de Youtube, filiale de Google. La personnalisation du contenu est extrêmement dangereuse, car elle encourage et cristallise la démarche communautariste. Une fois le profile créé et donc les contenus correspondants à ce profil mis en avant systématiquement, comment sort-on de cette bulle informationnelle ou de divertissement ? L'internaute profilé, se voit proposer ce que l'algorithme calcule comme étant supposé lui correspondre, l'intéresser ou le faire réagir.

Cette approche correspond au modèle sociale américain, qui est une agglomération de communautés qui vivent en parallèle: les gens font d'abord partie d'un groupe social avant de faire nation. Ce modèle, qui plaît à certains n'est pas le modèle français qui est basé sur l'assimilation, faire en sorte que tous les individus soient français avant d'être autre chose. J'espère me tromper, mais il me semble que l'apposition du modèle américain sur le modèle français est en train de mettre à mal ce dernier, et les réseaux sociaux, dans leur forme actuelle avec des algorithmes qui renforcent la communautarisation, en sont de puissants destructeurs.

L'utilisation des intelligences artificielles pour améliorer encore plus la construction de ces bulles informationnelle est clairement une mauvaise nouvelle pour notre identité et cohésion nationale.

Partager Partager ce billet sur les réseaux sociaux

samedi 7 décembre 2019

Des trolls synthétiques

On entend beaucoup parler d'intelligence artificiel dans le monde du numérique depuis quelques années. C'est un sujet qui m'agace beaucoup, car le marketing s'est emparé d'un concept et l'a simplifié à outrance. Maintenant on ne sais plus de quoi on parle.

Machine learning

L'essentiel des sujets sur l'IA ne traite pas d’intelligence mais de ''machine learning"", c'est à dire des processus d'apprentissage transposés à un ordinateur qui vont lui permettre d’acquérir des capacités de choix plus performantes basées sur l'apprentissage et non l'analyse. En gros, on donne à la machine des milliers de problèmes avec leur solution à analyser. La machine, si les algorithmes sont bien écrits, peut ensuite, quand on lui présente un problème, trouver beaucoup plus rapidement la réponse. Il n'y a aucune capacité déductive, c'est un mécanisme statistique.

Dernièrement, cette approche a été utilisée en médecine. Cela permet d'obtenir extrêmement rapidement et automatiquement, une lecture des scanners des patients pour détecter d'éventuels cancers. Grâce à l'apprentissage, la machine aboutie à un taux de réussite équivalent à une équipe de médecins spécialisés.

La médecine est un secteur qui produit beaucoup de données complexes, mais qui ont un énorme avantage, c'est qu'elles sont validées et complétées par une expertise humaine. On a donc des millions de données médicales, interprétées par des médecins, et dont on connaît les suites médicales. Ces données sont en plus extrêmement reproductibles. Une mine de données pour former des algorithmes prédictifs.

Et avec quoi entraîne-t-on les machines à apprendre ?

Dès que l'on dispose d'une grande quantité de données, il est possible de les donner à manger à une machine, et donc de produire des analyses ou des prédictions sur des échantillons de données beaucoup plus réduits. C'est ce que font nos très, très chers GAFAM. Toutes les données que nous partageons avec eux sont digérées en permanence par des milliers de machines dont la seule mission consiste à essayer de prédire les comportements individuels.

Ces géants du net font du machine learning depuis longtemps, c'est comme ça qu'il valorisent les données que nous leur donnons.

De plus en plus simple

Avec la puissance de nos ordinateurs ou smartphones actuels, il est possible de démocratiser le machine learning et de le faire arriver sur nos terminaux individuels. Et bien sûr, si le code devient "portable" alors on peut l'utiliser pour des usages tout autres, comme par exemple créer des armées de trolls qui pourraient être codé pour se comporter comme n'importe quel individu, au choix un faux consommateur pour gruger des entreprises, un faux militant pour propager des opinions ou en combattre d'autres, un faux citoyen pour manipuler des groupes... Bref une fausse personne qui va consommer de l'énergie et faire perdre du temps aux vraies pour épuiser un adversaire économique ou politique.

Nous entrons dans l'ère des trolls de synthèse, encore détectables, mais plus pour longtemps. Nous vivons une époque formidable...

Partager Partager ce billet sur les réseaux sociaux

- page 1 de 11