Et si, pour comprendre l’IA, on demandait directement à ceux qui la construisent ? C’est l’exercice que nous avons fait avec Vincent Terrasi, entrepreneur et expert de la donnée, lors d’un question / Réponse pour un nouvel épisode du podcast Et Toc SEO!. Découvrez sa vision sur la technologie qui change tout, et embarquez pour une conversation qui redessine la carte du SEO de demain. Nous avons retranscrit pour vous quelques morceaux choisis de cet entretien passionnant dont la totalité est disponible sur Youtube.
Question: Vincent, peux-tu brièvement te présenter pour les gens qui ne te connaissent pas ?
Réponse : Bien sûr. Nous sommes actuellement à Station F, où je développe ma start-up, Draft & Gold, que j’ai initialement créée au Canada il y a trois ans.
Notre mission est d’aider les entreprises à transformer leurs processus métier en workflows basés sur l’IA, avec une approche principalement orientée vers le marketing. En tant que fondateur, j’occupe également le rôle de CTO (Directeur Technique) depuis le début.
Avant cette aventure, mon parcours m’a amené à travailler pour de grands comptes comme M6 et OVH, et j’avais déjà co-fondé une autre start-up par le passé. Disons que je suis entrepreneur depuis un bon moment !
Question: Peux-tu nous vulgariser un peu le fonctionnement de l’IA générative? Qu’est-ce que c’est que cette technologie dont on parle toutes les 5 minutes?
Réponse : Quand on parle de l’IA actuellement, on fait surtout référence aux IA génératives comme ChatGPT. Il s’agit de « Large Language Models » (LLM), ou grands modèles de langue.
Pour le vulgariser, le principe est assez simple : ces modèles ont été entraînés sur une immense partie des connaissances disponibles sur Internet, textes et vidéos inclus. Leur fonction fondamentale est de faire des prédictions.
On leur apprend à prédire le mot suivant dans une phrase pour leur apprendre à parler et à communiquer.
Ce même principe s’applique pour générer des images ou comprendre des vidéos. Sans entrer dans des détails trop techniques, il faut voir cela comme un super outil dont le cœur de métier est la prédiction…
Question: Quelle est ta définition du métier de data scientist et, selon toi, comment a-t-il évolué (outils, méthodes, demandes) au cours des dernières années ?
Réponse : J’aime voir le data scientist comme un « super développeur ». Le métier a énormément changé au fil du temps. Je me souviens qu’en 2016, nous utilisions principalement des algorithmes de machine learning pour des tâches comme la classification, la « clusterisation », la détection d’anomalies ou le « forecast » (prévision).
Aujourd’hui, ces techniques existent toujours et restent pertinentes, mais le grand changement est l’arrivée de l’IA générative.
Le data scientist moderne intègre massivement les grands modèles de langue pour effectuer des tâches beaucoup plus complexes, comme le traitement avancé du langage naturel (NLP).
[…]
Question: Il y a un sujet sur la sécurité. Est-ce que pour toi les IA sont sécurisées ?
Réponse : La réponse dépend vraiment du type de service utilisé, il faut distinguer les offres grand public des solutions professionnelles.
Sur les abonnements gratuits, la règle « si c’est gratuit, c’est toi le produit » s’applique souvent. Leurs conditions générales précisent que les données peuvent être utilisées pour entraîner les modèles. Cependant, même dans ces cas, il est souvent possible de désactiver cette utilisation.
En revanche, la situation est totalement différente pour les entreprises. Nous utilisons des versions payantes, via des API privées sur des plateformes comme GCP (Google Cloud) ou Azure. Dans ce cadre, les données sont cloisonnées, sécurisées, et il n’y a aucun risque de fuite.
La crédibilité de ces grands fournisseurs est en jeu. Pour moi, il n’y a pas de sujet de sécurité majeur, à condition d’être vigilant et de bien lire les petites lignes du service d’IA que l’on choisit.
Question: Quelles sont les barrières à l’entrée (en termes de coût, d’investissement et de complexité technique) pour une entreprise souhaitant mettre en place son propre grand modèle de langue (LLM) afin de protéger la confidentialité de ses données ?
Réponse : Oui, c’est cher. La principale barrière n’est pas seulement financière, mais humaine. C’est un métier à part entière qui nécessite un spécialiste des données, un expert qui maîtrise la gouvernance des données : où elles se trouvent, comment les sécuriser, comment les utiliser, etc. Ce n’est donc pas à la portée de tout le monde.
Je pense qu’aujourd’hui, pour la plupart des entreprises, la stratégie la plus sage n’est pas de tout reconstruire, mais de s’appuyer sur les grands modèles existants via des services sécurisés.
Ces fournisseurs ont déjà réfléchi à ces questions de sécurité et de conformité à notre place. De plus, il faut noter qu’en Europe, nous bénéficions d’un cadre réglementaire très protecteur, avec de nombreuses lois comme le RGPD ou l’AI Act, qui viennent renforcer la sécurité de l’ensemble de l’écosystème.
[…]
Retranscription orale adaptée à l’écrit.
Extrait du Podcast Et Toc SEO! , par Emmanuel de Vauxmorêt fondateur d’ Uplix disponible sur Youtube.