"*NEWS 1: DeepSeek: les retombées après le tsunami* Deux semaines après que le mo" – NotPatrick - Actu tech & gaming, February 4, 2025

*NEWS 1: DeepSeek: les retombées après le tsunami* Deux semaines après que le modèle chinois ait frappé la Silicon Valley de plein fouet, on fait un point sur les conséquences de l'impact: *Réaction des intéressés:* Chez OpenAI, Facebook ou NVidia, tout le monde essaye de tirer la couverture à soi. Tous trouvent le modèle impressionnant, mais assurent qu'ils vont faire mieux, ou qu'il existe un peu grace à eux. Il faut avouer qu'ils n'ont pas tort, mais il y a aussi des conséquences plus préoccupantes. Les opérateurs de LLM en particuliers ont maintenant un concurrent efficace, open source, et moins onéreux. *Bourse* NVidia a dévissé ces derniers jours, mais personnellement j'y vois une sur correction, voir une excuse pour un réajustement nécessaire: efficace ou pas, tout le monde a toujours besoin de leurs puces, que ce soit pour l'entrainement ou pour l'utilisation. Si DeepSeek peut être entrainé avec moins d'entre elles, je n'ai pas vu dans l'histoire de la tech une technologie plus efficace qui réduisait l'utilisation du matériel; au contraire, si on peut faire plus avec moins, imaginez ce qu'on peut faire avec encore plus avec plus... *Fiabilité* On a immédiatement parlé de la censure appliquée au modèle chinois, mais c'est dans un deuxième temps la fiabilité qui a été examinée, et les résultats ne sont pas reluisants: les hallucinations et erreurs sont communes, et quand on évoque l'actualité le modèle refuse carrément de répondre une bonne partie du temps. Des problèmes sérieux dans un environnement où les compétiteurs font systématiquement mieux. *Entrainement* Il semblerait que DeepSeek ait été entrainé en "distillant" les modèles concurrents, c'est à dire en leur posant des questions et en analysant leurs réponses. OpenAI s'est insurgé de l'utilisation non autorisée de son contenu, ce qui a immédiatement provoqué l'hillarité général de l'intégralité du net, où chaque personne qui avait un clavier à porté a fait une blague sur le thème "ah bah oui c'est pas cool quand quelqu'un entraine un LLM sur votre contenu sans vous demander la permission, hein??..." *Adoption* C'était prévu, on retrouve déjà des versions de DeepSeek R1 partout (il a été livré à la communauté, rappelons-le), y compris chez Microsoft sur Azure et GitHub, avec une version Copilot+ PC pour bientôt. *Enseignements* Avec le succès et les downloads par millions, certains pensent que DeepSeek a montré la volatilité des utilisateurs. Personnellement je n'en suis pas convaincu. Tout le monde teste, mais combien l'utiliseront encore dans deux semaines? ChatGPT, Claude et les autres commencent à être bien intégrés aux process de travail. Ce qui est certain c'est que la Chine a été galvanisée par ce succès. Alibaba, Huawei et DeepSeek eux-mêmes n'en sont qu'au début de leurs recherches, et leurs modèles continuent à évoluer et à progresser, avec des premiers exemples (en réaction à R1 bien sûr) qui apparaissent déjà. *Conclusions* Une conclusion de cet événement semble être, après le choc initial, une considération renouvelée pour l'importance des contrôles aux exports mis en place par les États-Unis. S'ils veulent ralentir la Chine (et c'est le cas), cette analyse me parait clairement juste. Quand au coup mortel porté à OpenAI et consorts, je le répète partout depuis une semaine: il me parait largement exagéré. Ce "moment Sputnik" n'en est qu'à moitié un: un coup de fouet qui réveille, sans doute, mais dont les enseignements bénéficient autant à OpenAI qu'à DeepSeek eux-même. De plus les grands acteurs de l'IA ont un écosystème et une fiabilité indispensables aux clients professionnels, en plus d'une gestion attentive de leurs modèles qui augmente leur utilité et réduit les problèmes qu'ils proviquent. En gros il ne suffit pas d'avoir un bon modèle, il faut aussi pouvoir l'exploiter. Et les sociétés qui peuvent les exploiter ne sont pas rendues caduques juste avec l'arrivée d'un nouveau modèle, si efficace soit-il. Il faut une infrastructure pour gérer tout ça, et je ne vois pas Procter & Gamble aller signer chez un concurrent chinois, ou même chez une startup créée hier qui promet monts et merveilles en utilisant R1. Ceci dit il ne faut pas présumer de ce qui se passera dans les mois et les années à venir; le monde entier va intégrer les méthodes nouvelles qui ont rendu possible ce modèle, et les chinois vont continuer à progresser et à en créer de nouveau. Comme depuis trois ans, bien malin celui qui pourra prédire de quoi le monde de l'IA sera fait à l'avenir. Action Nvidia https://www.cnbc.com/2025/01/27/nvidia-sheds-almost-600-billion-in-market-cap-biggest-drop-ever.html Fiabilité DeepSeek https://www.newsguardrealitycheck.com/p/deepseek-debuts-with-83-percent-fail Contrôles à l'export https://darioamodei.com/on-deepseek-and-export-controls Mistral vu des US https://www.ft.com/content/fa8bad75-dc55-47d9-9eb4-79ac94e54d82 Avance des US https://www.platformer.news/deepseek-ai-explainer-china-worries/

NotPatrick - Actu tech & gaming

Comments