Les actus IA de Juin 2024
Dream Machine, le 1er modèle de génération de vidéos grand public, un ordinateur boosté à l'IA annoncé par Microsoft et les plans d'Apple en matière d'IA
Cette semaine, j’expérimente un nouveau format pour vous parler des différentes actualités très récentes qui font parler dans le monde de l’intelligence artificielle. Au programme : un nouveau modèle de génération de vidéo impressionnant, un ordinateur boosté à l’IA annoncé par Microsoft, et les révélations de la dernière conférence d’Apple.
Sur les traces de l’IA à Berlin
Désolé, il n'y a pas eu de post la semaine dernière ! J’étais à Berlin avec mon associé pour rencontrer les utilisateurs, partenaires et investisseurs de notre startup OpenVC, la plateforme où nous mettons en relation des startups en quête de financement avec des investisseurs du monde entier.
L’IA a été au centre de toutes les discussions pendant cette semaine, et nous avons notamment pu voir de très près comment elle est utilisée pour créer des fonds d’investissement “data-driven”. Les investisseurs commencent en effet à utiliser l’IA pour identifier des startups dans lesquelles investir et même prendre la décision d’investir ou non de façon automatisée. L’une des complexités de ce travail est qu’on ne peut juger de la performance d’un fond d’investissement qu’après une dizaine d’années (le temps nécessaire pour voir si les investissements dans diverses startups ont été fructueux et de pouvoir mesurer le retour sur investissement). Ces investisseurs se lancent donc dans cette aventure sans savoir si cette méthode d’investissement est performante, ce qui fait d’eux des pionniers en la matière mais représente aussi un risque important. Il faudra donc attendre une petite décennie pour constater les résultats et comparer la performance de ces fonds d’investissement “data-driven” par rapport aux méthodes plus traditionnelles. D’ici là, les technologies d’intelligence artificielle auront évidemment grandement évolué, il sera donc important pour ces investisseurs de rester à la pointe de chaque amélioration pour les intégrer. Chez OpenVC, nous utilisons la data pour mettre en relation investisseurs et startups. Nous sommes donc au cœur du sujet et travaillons déjà avec l’IA pour apporter toujours plus de valeur à nos clients.
Maintenant, place aux actualités !
Sursaut dans les IA génératives de vidéos avec Dream Machine
En Février 2024, OpenAI, les créateurs de ChatGPT, ont choqué une nouvelle fois le monde en publiant un rapport sur son nouveau modèle de génération de vidéos baptisé Sora. En s’inspirant du fonctionnement des LLM (que j’explique ici), les ingénieurs de OpenAI ont pu créer un logiciel permettant de générer des vidéos à partir d’une simple instruction texte. Le modèle est entraîné sur des millions de vidéos réelles et est capable de générer des vidéos ultra-réalistes à différents niveaux de qualité et en différents formats d’image. Plusieurs exemples de vidéos générées via Sora sont disponibles ici.
Depuis cette annonce, l’entreprise leader de l’IA est restée bien silencieuse à propos de ce modèle Sora, mais cela n’a pas empêché plusieurs concurrents de rattraper leur retard. La semaine dernière, l’entreprise chinoise KWAI a annoncé à son tour un modèle de génération de vidéos très similaire à celui de OpenAI. Baptisé KLING, ce modèle peut générer des vidéos durant jusqu’à 2 minutes, en résolution 1080p (HD) et à 30 images par seconde. Les exemples publiés sont encore plus réalistes que ceux publiés par OpenAI quelques mois auparavant. Je vous invite vraiment à cliquer sur le tweet ci-dessous pour voir quelques-uns de ces exemples impressionnants :
Mais ce n’est pas tout puisque le 12 juin 2024, un nouveau modèle de génération de vidéo a été publié, et pour la première fois, il est d’ores et déjà accessible au grand public ! La startup Luma AI a en effet publié il y a 2 jours son modèle Dream Machine, que n’importe qui peut utiliser dès maintenant pour générer des vidéos allant jusqu’à 5 secondes. Vous pouvez générer 30 vidéos gratuitement dès aujourd’hui sur le site de Luma AI. Si les vidéos générées ne sont pas aussi bluffantes que ce qu’on a pu voir sur les modèles Sora ou KLING, l’entreprise Luma AI réussit tout de même à mettre la pression à tous les acteurs de la génération de vidéo en commercialisant le premier produit sur le marché. Il faut donc s’attendre à voir de plus en plus d’améliorations sur le sujet dans les prochains mois.
Microsoft annonce une ligne de PC boostés à l’IA
Contrairement à son concurrent historique Apple, Microsoft n’a jamais réussi à percer sur le marché des smartphones qui a depuis longtemps dépassé celui des PC. Rappelons également que Microsoft n’a longtemps été qu’un fournisseur de système d’exploitation (Windows) et non un fabricant de matériel comme Apple (qui a toujours manufacturé ses ordinateurs et smartphones). Ce n’est qu’à partir de 2012 que Microsoft a commencé à concurrencer Apple sur la fabrication en créant la gamme de tablettes puis ordinateurs portables Microsoft Surface. En 2014, Microsoft avait même racheté Nokia et rebrandé les modèles sous la marque “Microsoft Lumia” avant d’abandonner sa stratégie smartphone et de revendre Nokia 2 ans après.
Après avoir échoué sur le marché des smartphones face à Apple et Samsung, et d’être aussi dominé sur le marché des consoles de jeux avec sa Xbox face à la Playstation de Sony, il s’agirait de ne pas se louper sur le marché des ordinateurs pour Microsoft. C’est donc pour relancer ce marché des ordinateurs que Microsoft a annoncé fin Mai une nouvelle ligne de PCs Windows baptisée Copilot+ PCs.
Selon Microsoft, il s’agit des ordinateurs Windows les plus rapides et les plus intelligents jamais conçus, parce qu’ils intègrent nativement la puissance de l’intelligence artificielle. Celle-ci est utilisée pour optimiser le fonctionnement du PC dans son ensemble, permettant par exemple d’atteindre une autonomie de batterie pouvant durer toute la journée ou d’accéder à des nouvelles fonctionnalités telles que :
Recall, pour retrouver facilement tout ce que l’on a pu voir sur son PC
Cocreator, pour générer ou améliorer des images en temps réel
Live Captions, pour traduire de l’audio dans plus de 40 langues
Cette nouvelle architecture spécialement conçue pour faire tourner les derniers modèles d’intelligence artificielle sera accessible sur les nouveaux modèles de la gamme Microsoft Surface mais également chez certains partenaires OEM tels que Acer, ASUS, Dell, HP, Lenovo et Samsung. Les précommandes seront possibles dès le 18 juin à partir de 999$. J’attends donc de voir les premiers retours utilisateurs pour vous donner mon avis sur cette annonce. A priori, je pense que c’est une tentative pour Microsoft de se relancer sur le marché des ordinateurs en surfant sur la vague IA. Je trouve personnellement que les nouvelles fonctionnalités natives annoncées ne justifient pas pour le moment de changer de matériel puisque des logiciels tiers existent déjà avec les mêmes fonctionnalités. Le seul élément vraiment novateur d’après moi est que l’architecture Copilot+ serait selon Microsoft beaucoup plus performante pour faire tourner des modèles IA en local directement sur l’ordinateur : à vérifier à la sortie des premiers PCs Copilot+.
Apple fait des annonces IA : le retard est-il rattrapé ?
La DARPA, c’est l’agence pour les projets de recherche avancée de défense qui dépend du ministère de la défense des Etats-Unis. Ici, on ne rigole pas, et on est à l’origine de toutes sortes d’inventions qui ont changé le monde pour le meilleur et pour le pire. Le drone Predator qui permet à l’armée américaine d’oblitérer n’importe quelle cible depuis les airs avec une précision chirurgicale, le système GPS que le monde entier utilise aujourd’hui pour se géolocaliser, ou tout simplement l’ARPANET devenu plus tard l’internet… toutes ces inventions et bien d’autres sont issues de la DARPA. C’est aussi le cas de Siri, l’assistant vocal embarqué dans tous les smartphones iOS depuis 2011. A l’époque de l’acquisition et de l’intégration de cette technologie par Apple, Siri était ce qui se faisait de mieux en matière de NLP (Natural Language Processing ou Traitement du Langage Naturel, l’une des applications de l’IA). La marque à la pomme était donc à la pointe de l’IA, mais ça, c’était avant.
Depuis, les chercheurs en intelligence artificielle ont travaillé dans l’ombre, développant toujours plus de technologies complexes telles que les réseaux de neurones artificiels, l’apprentissage automatique, les réseaux antagonistes génératifs etc. aboutissant finalement à la création du premier modèle “Transformer” auto-régressif en 2017 qui a permis par la suite la conception de GPT-1 par OpenAI et BERT par Google en 2018. Quatre ans plus tard, en 2022, OpenAI bouleverse le monde en rendant son modèle GPT-3 public à travers ChatGPT, le premier logiciel permettant au public d’utiliser un modèle d’IA de type “Transformer”. Et si cette nouvelle technologie a bouleversé le monde, c’est parce qu’elle est beaucoup, beaucoup plus performante que l’ancienne technologie de NLP utilisée notamment par Siri. Grâce à ChatGPT et à leur capacité à améliorer leur technologie et à l’amener rapidement sur le marché, OpenAI a très rapidement pris une place de leader incontesté sur le marché de l’IA pour les particuliers et les entreprises. Une opportunité saisie par Microsoft qui a investi plus d’un milliard de dollars dans OpenAI dès 2017 et qui lui permet d’utiliser aujourd’hui les modèles d’OpenAI dans ses produits. Google de son côté a toujours été à la pointe du sujet en étant à l’origine même des modèles “Transformers” et de nombreux autres produits et projets IA. Du côté de Meta (Facebook), après avoir investi (et perdu) beaucoup sur le sujet du multivers, on se concentre désormais sur le développement du modèle Llama qui atteint des niveaux de performance respectables bien que inférieurs à ceux d’OpenAI ou Google, mais en open source donc destiné à un autre marché. Chez Amazon, l’accent est mis sur le développement de l’infrastructure destinée aux startups IA, et on investit dans ces mêmes startups, comme par exemple la société Anthropic dans laquelle Amazon a investi 4 milliards de dollars. Mais où se situe donc Apple à côté de ses concurrents des GAFAM ?
C’est la réponse à laquelle a souhaité répondre Apple lors de sa Worldwide Developers Conference du 11 juin 2024 qui s’annonçait riche en annonces IA. Apple a ainsi a annoncé la création du concept “Apple Intelligence”, une suite de fonctionnalités d’intelligence artificielle qui devraient arriver dans les iPhones, iPads et Macs dès la prochaine version du système d’exploitation. A chaque recoin de l’interface, l’utilisateur est désormais invité à utiliser l’IA : dans Notes pour générer une image à partir d’un prompt, dans les emails pour générer une réponse automatiquement etc. Comme d’habitude, Apple annonce mettre un point d’honneur sur le respect de la confidentialité en assurant que l’essentiel des modèles d’IA sont exécutés en local sur l’ordinateur, les données n’étant donc pas transmises à un serveur et potentiellement interceptables ou réutilisables par un tiers. Apple a par ailleurs annoncé un partenariat avec OpenAI pour permettre aux utilisateurs d’accéder aux modèles d’OpenAI directement dans leur appareil. Et pour en revenir à Siri : l’assistant vocal évolue et utilise désormais l’IA pour exploiter les données présentes dans les apps de votre appareil pour mieux vous assister. Alors que l’assistant vous redirigeait souvent vers une recherche internet pour les requêtes qu’il ne pouvait gérer lui-même, il va désormais rediriger vers ChatGPT. Un accord qui sonne comme un aveu d’échec pour de nombreux observateurs, illustrant la difficulté pour Apple de développer leurs propres innovations logicielles en matière d’IA.
D’une manière générale, Apple n’a fait qu’annoncer rattraper son retard sur ses différents concurrents, notamment sur ce que propose Samsung avec Galaxy AI. Les différentes nouveautés liées à l’IA qui ont été annoncées n’ont pas provoqué de retentissement dans le milieu et ont même été moquées par certains. En fait, les fonctionnalités d’agent conversationnel, génération de texte ou d’images etc. qui étaient des grandes nouveautés avec l’apparition de ChatGPT en novembre 2022 se sont aujourd’hui grandement démocratisées à travers de nombreuses apps déjà disponibles dans nos téléphones. Il faudra donc faire beaucoup mieux que cela pour impressionner les utilisateurs qui sont désormais habitués à des bonds technologiques significatifs et fréquents.