Bien décidé à disputer le marché de l’IA à ses rivaux américains comme OpenAI, le nouveau-venu chinois DeepSeek sort une mise-à-jour de son grand modèle de langage (LLM) V3, mieux capable selon lui de tenir compte « des défis du monde réel ».

Distribué sans annonce préliminaire sur la plateforme Hugging Face, la mise-à-jour V3-0324 est destinée au LLM V3, publié originellement en décembre 2024.

La nouvelle version apporte selon Reuters des améliorations conséquentes dans une série de domaines comme les capacités de raisonnement et de codage, tout en mettant en place des benchmarks de précision et d’efficacité sur Hugging Face. La licence a également été changée en faveur du modèle open-source du Massachusetts Institute of Technology, ce qui rend le LLM plus accessible aux développeurs.

V3 a été lancé avant que DeepSeek ne soit reconnu sur la scène mondiale avec la publication de R1 en janvier, le modèle qui a permis au développeur chinois de prendre la tête des applications les plus téléchargées sur l’App Store d’Apple aux États-Unis.

Des analystes ont avancé que R1 démontrait que des modèles d’IA puissants pouvaient être développés à une fraction du coût des grands systèmes rivaux, tout en utilisant des processeurs moins avancés.

Utilisation militaire
Parallèlement à l’annonce de la sortie d’une mise-à-jour, les médias chinois ont révélé que l’armée a commencé à utiliser la plateforme open-source de DeepSeek pour soutenir des activités extérieures aux combats. La presse précise que les modèles de DeepSeek sont par exemple utilisés dans les hôpitaux et pour l’entraînement des soldats, offrant aux militaires un environnement contrôlé pour leurs expérimentations.


Si les tests sont satisfaisants, Sam Bresnick, chercheur à la Georgetown University, explique au South China Morning Post qu’une modèle avancé comme R1 pourrait par exemple aider les militaires dans leurs processus de décision.


Le développeur de solutions de conduite autonome Chongqing Landship Information Technology a quant à lui affirmé dans un document consulté par Asia Times que l’IA de DeepSeek pourrait être employée pour des fonctions comme le contrôle de véhicules sans pilote ou la transmission d’ordres.