Le nouveau visage de l'IA et autres brèves de l'été
Connaissez-vous cette femme ? Il s'agit du nouveau visage de l'IA ! On en parle, ainsi que de friend, votre prochain meilleur ami (imaginaire ?), et d'autres nouvelles du monde de l'IA
Connaissez-vous le nouveau visage de l’IA ?
Ces derniers jours, aucun amateur d’intelligence artificielle n’a pu naviguer sur les réseaux sociaux sans croiser cette photo. Une femme souriante, micro à la main, tour-de-cou estampillé Google, semble donner un discours inspirant sur la scène d’une conférence TEDx.
L’avez-vous deviné ? Cette femme n’existe pas, et cette image est le résultat du tout dernier modèle de génération d’images baptisé FLUX-1. Le 1er Août dernier, c’est une startup inconnue nommée Black Forest Labs qui a publié ce modèle, annonçant par la même occasion une levée de fonds de 31 millions de dollars. Comme son nom l’indique, cette startup est installée au pied des montagnes de la Forêt noire en Allemagne et a été fondée par des chercheurs et ingénieurs ayant travaillé auparavant sur des projets comme Stable Diffusion (dont je parle dans cet article). Si cette startup n’existait même pas officiellement avant le 1er Août, elle s’est créé en quelques jours une place incontestable parmi les acteurs européens majeurs de l’IA générative grâce à ce modèle FLUX-1 qui dépasse, d’après le consensus général, tous les autres modèles concurrents tels que DALL-E (OpenAI), Stable Diffusion (Stability AI), Gemini (Google) et même le leader Midjourney V6 sur de nombreux points.
FLUX-1 permet en effet de générer des images avec un niveau de réalisme et de détail jamais atteint par les autres modèles existants, tout en ayant une compréhension très avancée des prompts donnés par les utilisateurs. Comme en témoignent les nombreux exemples affichés sur le site officiel, le modèle est capable de générer des images dans de nombreux styles différents.
Le modèle est décliné en 3 variantes :
FLUX-1 [pro] est la version professionnelle et donc payante, plus aboutie et accessible uniquement via API ou via les partenaires officiels de Black Forest Labs
FLUX-1 [dev] est une version plus légère, open source et accessible à n’importe qui gratuitement pour des fins non-commerciales
FLUX-1 [schnell] est la version la plus rapide, prévue pour les usages personnels et l’utilisation en local (donc sur un ordinateur comme le vôtre ou le mien)
Cette décision de publier une partie du modèle en open source est une très bonne nouvelle pour la communauté IA qui va pouvoir s’appuyer sur les recherches réalisées par Black Forest Labs pour concevoir ce modèle innovant par son architecture hybride. Les créateurs ont en effet combiné et approfondi les développements les plus à la pointe du domaine pour aboutir à ce résultat qui surpasse tant la concurrence. On ne va pas se le cacher, l’explication technique est un peu complexe pour être expliquée ici, alors je vous renvoie vers la description et les références données par l’entreprise si ça vous intéresse - en anglais car ces concepts sont si innovants qu’ils n’ont pas encore de traduction française qui fait consensus :
“All public FLUX.1 models are based on a hybrid architecture of multimodal and parallel diffusion transformer blocks and scaled to 12B parameters. We improve over previous state-of-the-art diffusion models by building on flow matching, a general and conceptually simple method for training generative models, which includes diffusion as a special case. In addition, we increase model performance and improve hardware efficiency by incorporating rotary positional embeddings and parallel attention layers. We will publish a more detailed tech report in the near future.”
La suite logique pour Black Forest Labs ? S’attaquer à la génération de vidéos. L’entreprise promet de révolutionner et de démocratiser le text-to-video avec un nouveau modèle dans le futur, sans donner aucune autre précision. Le marché de la génération de vidéos a d’ailleurs connu un récent sursaut comme je l’explique dans mon précédent post.
Sur Twitter, les amateurs d’IA s’en sont donné à coeur joie en réalisant déjà des tests prometteurs combinant la génération d’images via FLUX-1 avec d’autres outils de génération de vidéo tels que Runway ou Kling. Voici par exemple notre nouveau visage de l’IA animée :
Retrouvez plus d’exemples sur ce fil twitter.
Voilà un autre exemple qui nous montre qu’il reste évidemment du travail sur cette technologie qui reste encore aujourd’hui balbutiante mais qui progresse très rapidement avec des améliorations significatives chaque mois.
Votre prochain meilleur ami sera une IA
Le 30 juillet 2024, c’était la Journée de l’Amitié, cette formidable occasion de célébrer l’amitié entre les gens, les cultures, les nations et les religions. Une bien belle initiative créée dans les années 30 par… l’industrie des cartes de vœux. Quoi de mieux que l’authenticité d’un tel évènement pour choisir une date afin d’annoncer la toute dernière abomination venue tout droit de la Silicon Valley ? J’ai nommé friend : un AI wearable (voir mon post sur le sujet) à embarquer avec vous, qui écoute tout ce que vous dites, et qui vous envoie des messages pour interagir avec vous.
Je vous laisse visionner la bande-annonce pour vous faire une idée :
Vous vous en doutez sûrement, l’annonce a été reçue avec beaucoup de critiques, même de la part des amateurs d’intelligence artificielle. J’ai été moi-même d’abord très enthousiaste à l’annonce du Rabbit R1, un autre AI wearable sensé nous accompagner dans notre quotidien (voir mon enthousiasme ici). Puis, j’ai dû me rendre à l’évidence que cet objet n’avait pas plus d’utilité qu’un presse-papier à 199$ lorsque tous ceux qui l’avaient acheté ont manifesté à l’unanimité leur déception (voir ma déception là). La comparaison entre friend et le Rabbit R1 est inévitable et même le créateur est au courant d’après son tweet le lendemain du lancement :
Le créateur de friend, c’est Avi Schiffman et son histoire est intéressante. Actuellement étudiant à Harvard, il a créé en 2020 le site de référence concernant l’agrégation d’informations sur la pandémie de Covid. Un site qui recevait 30 millions de visiteurs chaque jour et qui lui a valu une certaine exposition médiatique. En 2022, il a créé un site pour permettre aux réfugiés ukrainien de trouver des familles d’accueil à l’étranger.
En 2024, il a donc levé 2,5 millions de dollars pour le lancement de friend, dont 1,8 millions ont été utilisés pour acheter le nom de domaine friend.com.
Il croit dur comme fer aux “digital relationships”, dit s’inspirer du film Her et pense que “très bientôt, la plupart des gens traiteront les IA comme des amis, des coachs, des thérapeutes, des partenaires etc. Beaucoup le font déjà. Les gens pensent que c’est parasocial car ce n’est pas une vraie personne, pourtant beaucoup de gens traitent leur chien comme si c’était leur meilleur ami. Je ne pense pas que quelque chose doit être vivant pour qu’on puisse sentir une connexion. Les relations au niveau humain libérées des préjugés seront une belle expression de l’intimité pour beaucoup de gens”.
Alors, êtes-vous prêts à vous libérer de vos préjugés et à vous procurer un ami, un friend à 99$ ? N’hésitez pas à réagir dans la section commentaires !
Les autres brèves de l’été
Encore envie d’un peu de lecture ? Voici pêle-mêle des sujets que je n’ai pas pu traiter plus tôt avec des liens pour en savoir plus sur chaque sujet.
Mai 2024 : Microsoft et OpenAI seraient en train de créer un supercalculateur à 100 milliards de dollars. Le projet baptisé Stargate serait prévu pour 2026 et doit permettre de répondre aux besoins grandissants en matière de calcul nécessaire pour l’intelligence artificielle. Avec 40 000 racks contenant 2,8 millions de GPU Blackwell capables de réaliser 14 400 exaFLOPS de performances FP8 denses, le superordinateur/datacenter pourrait consommer jusqu’à 5 gigawatts. Ce sera alors un véritable défi de trouver autant d’énergie décarbonée pour le faire fonctionner. Dans le même temps, Amazon a annoncé acheter le datacenter à base d’énergie nucléaire Cumulus Data pour 650 millions de dollars prévu à terme pour 2,5 gigawatts d’électricité. Plus d’informations sur Le Big Data.
Avril 2024 : Elon Musk a annoncé que son robot humanoïde Optimus pourrait intégrer les chaînes de production de Tesla cette année pour être supposément commercialisé dès 2025. Un robot pouvant être programmé pour réaliser un certain nombre de tâches comme plier du linge, et qui sait déjà réaliser toutes les tâches nécessaires pour travailler sur les chaînes de montage de Tesla d’après l’entreprise. Un robot utile pour les entreprises mais aussi en tant que robot domestique, ce qui ferait de Tesla la première entreprise à se placer sur le marché. Son prix est estimé à 22 000€. Plus d’informations sur Science-Et-Vie.
Mai 2024 : La première course de voitures autonomes de l’Histoire a eu lieu lors de la première édition de l’A2RL, l'Abu Dhabi Autonomous Racing League. C’est sur le célèbre circuit de Yas Marina que se sont élancées plusieurs voitures de course équipées de nombreux capteurs et des soi-disant dernières technologies de conduite autonome. Il n’a pas fallu attendre longtemps pour se rendre compte que l’évènement était peut-être un petit peu prématuré : dès le premier tour des qualifications, les voitures, roulant pourtant à une allure très faible, se sont mises à faire des têtes à queue, à foncer dans les murs ou à s’arrêter net sans raison apparente. Un spectacle bien affligeant, mais au moins ils pourront dire qu’ils étaient les premiers à le faire ! Plus d’informations sur Ouest France.
J’espère que ces petites nouvelles du monde de l’IA auront suscité votre intérêt pendant l’été ! On se retrouve à la rentrées avec un rythme de publication plus fréquent !