Vague silencieuse : les innovateurs chinois en matière d’IA font plus avec moins

Cette tendance n’est pas nouvelle, mais une vague d’annonces au cours des dernières semaines confirme à nouveau que les modèles chinois ne se contentent pas de suivre le rythme des autres, mais qu’ils remodèlent également la dynamique de l’innovation en matière d’intelligence artificielle au niveau local et, dans un certain sens, qu’ils apportent de nouvelles idées à l’échelle mondiale.

Alors que le monde occidental se réjouit souvent des progrès considérables de l’IA, la Chine connaît également une révolution qui se déroule rapidement, motivée à la fois par l’ingéniosité et la nécessité.

Listons les annonces des dernières semaines pour avoir une idée du rythme :

La piste d’innovation méconnue de la Chine

Les modèles chinois sont en phase avec ceux de l’Occident depuis un certain temps, si ce n’est dès le début.

Le parcours chinois a impliqué de nombreuses contributions révolutionnaires, reconnues dans le monde entier bien plus tard, après avoir fait partie des boîtes à outils des modélistes occidentaux plus célèbres. Leur approche de l’IA a toujours consisté à trouver de nouvelles voies privilégiant l’efficacité, l’évolutivité et la praticité.

Wu Dao 2.0, sorti en mai 2021, est un excellent exemple de ce leadership précoce. Il a mis en évidence les capacités de la Chine en matière d’IA multimodale, intégrant le traitement de texte et d’image à une échelle de 1,75 trillion de paramètres, surpassant de nombreux modèles occidentaux de l’époque.

Au-delà de Wu Dao, le modèle Pangu-α de Huawei, introduit en 2021, illustre l’accent mis par la Chine sur le développement d’une IA économe en ressources. Pangu-α a été parmi les premiers à démontrer que les modèles de langage à grande échelle pouvaient être optimisés pour plus d’efficacité, ouvrant ainsi la voie à des tendances mondiales similaires. Baidu a également contribué de manière significative avec ses premiers modèles d’IA multimodaux, qui intégraient des capacités visuelles et linguistiques. Tous ces pays étaient bien en avance sur des avancées similaires en Occident.

Les dernières innovations s’inscrivent dans cette tendance d’approches pionnières qui seront probablement reproduites, voire imitées, à l’échelle mondiale. Par exemple, le modèle Hunyuan Video de Tencent utilise l’alignement contrastif vidéo-langage (CVLA) pour obtenir une qualité impressionnante dans la génération de vidéos, un domaine où l’efficacité est souvent un défi majeur.

Parallèlement, les capacités de raisonnement en «chaîne de pensée» de DeepSeek ont considérablement amélioré la compréhension des invites complexes, soulignant l’adoption précoce et le raffinement des techniques.

Bien sûr, la Chine a pris du retard dans de nombreux domaines. Dans le monde sans brevets, ses maquettistes ont adopté un nombre d’innovations beaucoup plus important que celles lancées aux États-Unis et ailleurs. Ce qui est important, c’est qu’ils ont aussi innové, et que leurs innovations méritent plus d’attention maintenant en raison de leurs objectifs différents.

Contraintes réglementaires : façonner une innovation sûre et maîtrisée

L’environnement réglementaire chinois impose des restrictions uniques au développement de l’IA, ce qui incite les développeurs chinois à trouver des solutions créatives pour répondre à ces demandes. Les réglementations nécessitent que les modèles d’IA contrôlent le contenu généré, empêchant ainsi les sorties potentiellement dangereuses ou indésirables.

Cette nécessité a conduit au développement de méthodes sophistiquées telles que l’abandon adaptatif des jetons, qui optimise l’efficacité des modèles tout en gérant efficacement l’allocation des ressources, en veillant à ce que les modèles respectent les normes réglementaires.

Un autre aspect de la conformité réglementaire est l’intégration de mécanismes de censure dans les modèles d’IA. Ces fonctionnalités, bien que controversées, servent à aligner les résultats de l’IA sur les réglementations locales.

De tels mécanismes pourraient être adaptés à l’échelle mondiale pour le filtrage des spams, la modération des contenus nuisibles et la cybersécurité. L’accent mis par la Chine sur la sécurité et les résultats contrôlés pourrait fournir des informations précieuses sur la construction de systèmes d’IA plus sécurisés dans le monde entier.

Contraintes matérielles : innover avec des moyens limités

Les développeurs chinois ont dû faire face à un accès restreint à du matériel de pointe, tel que des GPU avancés. Ces limites ont stimulé l’innovation, poussant les entreprises à faire plus avec moins. Cela a conduit à des percées dans l’utilisation efficace du matériel et à l’accent mis sur la conception de logiciels qui optimisent la technologie disponible.

Par exemple, Baidu a adapté ses modèles Ernie pour qu’ils fonctionnent efficacement sur les puces Kunlun, tandis qu’Alibaba a optimisé ses modèles Qwen pour les processeurs Ascend de Huawei. Ces adaptations démontrent comment une intégration logicielle-matérielle minutieuse peut surmonter les limites et atteindre des performances compétitives.

Cet accent mis sur l’optimisation de la production à partir de ressources limitées fait preuve d’ingéniosité et s’aligne sur les préoccupations mondiales concernant les coûts environnementaux et économiques du développement de l’IA.

Les innovations récentes dans les architectures SLM (Sparse-Layered Models) et Mixture of Experts (MoE) ont encore amélioré la capacité des systèmes d’IA chinois à fonctionner efficacement malgré les limitations matérielles.

Le Qwen-72B d’Alibaba, par exemple, utilise une architecture MoE avancée qui n’active qu’un sous-ensemble de paramètres du modèle pendant l’inférence. Cette approche, censée être une amélioration par rapport aux efforts déployés par le ministère de l’Éducation à l’échelle mondiale, réduit la charge de calcul tout en maintenant des performances élevées.

De même, les développements agentiques, tels que l’assistant Baixiaoying de Baichuan AI, intègrent des fonctionnalités qui rendent les interactions plus efficaces en exploitant les techniques Sparse-MoE. Ces modèles sont conçus pour être à la fois sensibles aux ressources et très réactifs, ce qui garantit qu’un matériel limité ne compromet pas matériellement la qualité des interactions avec l’utilisateur ou l’efficacité du calcul.

La réduction des coûts de traitement des tokens par DeepSeek à 1 RMB par million de tokens illustre un autre aspect de cette innovation basée sur les contraintes. Bien qu’une validation supplémentaire soit nécessaire, cette approche met en évidence une tendance prometteuse en matière d’IA rentable, établissant des références en matière d’accessibilité financière qui pourraient s’avérer cruciales à mesure que l’IA continue de se développer à l’échelle mondiale.

Se concentrer sur l’application : l’impact réel de l’IA chinoise

Les innovations chinoises en matière d’IA ont excellé dans la mise en place d’applications pratiques qui répondent directement aux besoins du marché. Contrairement à la tendance occidentale à étendre les capacités de LLM à un usage général, les entreprises chinoises se sont concentrées sur des secteurs spécifiques où l’IA peut avoir un impact immédiat. Cette approche a conduit à d’importantes avancées dans les domaines de la mobilité, de la robotique, des soins de santé et du commerce électronique.

BYD intègre des LLM pour des assistants vocaux avancés et des fonctionnalités de conduite autonome, créant ainsi des expériences de conduite plus intuitives et personnalisées. En robotique, les LLM chinois sont à l’origine de progrès dans l’interaction homme-robot. Ces améliorations permettent d’obtenir des systèmes automatisés plus efficaces qui fonctionnent de manière transparente avec les opérateurs humains.

En dehors de ces cobots, des entreprises comme Geek+ et Hai Robotics utilisent des robots alimentés par l’IA pour l’automatisation des entrepôts. Elephant Robotics a développé des robots pour aider les personnes âgées. De nombreuses entreprises utilisent des drones et des robots alimentés par l’IA pour des tâches telles que la pulvérisation des cultures, l’ensemencement et la surveillance des champs, en plus de la récolte.

Pour les applications de soins de santé, l’outil iRAG de Baidu a montré un succès notable dans l’amélioration de la fiabilité de l’IA en imagerie médicale en réduisant les hallucinations, une étape essentielle pour améliorer la précision du diagnostic.

Baidu développe activement ERNIE Bot 4.0 pour la consultation médicale ; cela pourrait être un domaine actif pour la plupart des modèles dans le monde après le récent article du NY Times qui a montré la précision diagnostique étonnante des modèles d’IA par rapport aux médecins professionnels, bien que les obstacles réglementaires puissent être moins importants pour la Chine.

Le modèle de molécule médicamenteuse Pangu de Huawei a appris la structure chimique de 1,7 milliard de molécules similaires à un médicament sur le marché. Huawei s’attend à ce que le modèle fonctionne comme un chimiste virtuel, aidant les chercheurs à concevoir et à identifier de nouvelles molécules susceptibles d’interagir avec des cibles médicamenteuses et de réduire les coûts de R&D de plus de 70%.

Les modèles chinois se distinguent également par l’accent mis sur l’accessibilité. Des outils tels que le constructeur d’applications d’IA sans code Miaoda de Baidu simplifient le développement de solutions alimentées par l’IA, permettant aux petites entreprises sans équipes techniques spécialisées d’exploiter la puissance des LLM.

Tencent exploite les capacités d’IA de HunYuan Pro pour améliorer les flux de travail de développement de jeux. Le modèle peut aider à des tâches telles que la génération de dialogues de jeu, la création de personnages non joueurs (PNJ) avec des comportements réalistes et la génération de niveaux et d’environnements de jeu.

Une voie différente vers un bénéfice mondial

Les modèles et applications d’IA sont développés à l’échelle mondiale dans tous les centres d’innovation. La trajectoire de l’innovation chinoise en matière d’IA ouvre une voie différente vers le progrès technologique, où les contraintes alimentent la créativité et où l’efficacité devient la pierre angulaire du progrès.

Les développeurs d’IA chinois ne se sont pas contentés de s’adapter aux limites de leur environnement réglementaire et à leurs contraintes de ressources, mais les ont transformées en opportunités. L’accent mis sur l’application, l’efficacité et l’adaptabilité constitue un contrepoids précieux à l’accent mis par l’Occident sur la mise à l’échelle et l’expansion des capacités.

Plus important encore, il y a une reprise remarquable des annonces de ces derniers temps. Dans les changements affectant l’utilisateur final comme les dernières fonctionnalités de TikTok, Tencent modifiant l’accessibilité dans WeChat ou les lunettes de Baidu, les innovations chinoises atteignent également rapidement les utilisateurs finaux.

Aucun de ces éléments ne risque d’être ignoré par les marchés pendant longtemps, bien qu’à la lecture des rapports des médias et des communautés d’analystes, il puisse sembler que rien ne se passe avec les entreprises technologiques chinoises dans le domaine de l’IA.

Nous reviendrons sur l’impact néfaste de l’incapacité à générer de l’enthousiasme à l’avenir, en particulier lorsque nous discuterons de la Corée, bien que cela soit également vrai dans le cas de la Chine.