Intelligence Artificielle

À peine sorti, un développeur fait tourner le modèle DeepSeek R1 sur un Raspberry Pi

Un Raspberry Pi et le logo de la startup chinoise DeepSeek

Bip bap boop — Je ne devrais pas vous apprendre grand-chose si je vous dis que la récente sortie du modèle chinois DeepSeek R1 a provoqué une turbulence monstre dans le domaine de l'intelligence artificielle, allant jusqu'à faire trembler des mastodons déjà bien établis comme Nvidia, OpenAI ou encore Meta.

Au sein du groupe tenu par le Zuck, des cellules de crise auraient même été mises en place afin de comprendre comment un modèle si peu cher est parvenu à atteindre de telles performances.

DeepSeek R1, qui se veut beaucoup moins gourmand en ressources que les modèles d'OpenAI (la startup chinoise utiliserait pour son modèle à peine 1% de l'équivalent des ressources d'OpenAI), se révèle en effet plus performant que le dernier modèle en date de la méga-startup IA américaine (c'est dire la branlée monumentale, si vous me permettez l'expression).

DeepSeek R1 sur un Raspberry Pi

La perspective de faire tourner un modèle d'IA sur du matériel abordable n'a pas manqué d'attirer l'attention de la communauté des développeurs Raspberry Pi, adepte des défis techniques en tout genre, et qui s'efforce depuis quelque temps de faire fonctionner ce type de modèle sur le micro-ordinateur le plus simple et le plus accessible au monde.

Comme démontré par le développeur Jeff Geerling dans sa dernière vidéo YouTube, le modèle partagé publiquement par DeepSeek est en effet techniquement capable de tourner sur un Raspberry Pi 5.

Néanmoins, permettez-moi de calmer tout de suite vos ardeurs : ne vous attendez pas à bénéficier des meilleures performances mondialement clamées pour un modèle tournant sur cette adorable bécane. 😉

Pour faire fonctionner son projet, Jeff Geerling a en effet dû remonter dans l'historique des versions de DeepSeek pour déployer la version 14b du modèle sur son micro-ordinateur — la version actuellement mise en avant par DeepSeek est la 671b (celle qui terrasserait ChatGPT), qui pèse pas moins de 400 Go.

Un bébé qui essaie de porter des altères

Même en tenant compte de cette version allégée du modèle, son Raspberry Pi est parvenu à générer 1,2 token par seconde. Autrement dit, quand une question lui est posée, il faut compter environ une seconde pour afficher chaque mot. Après, si vous êtes du genre vraiment pressé, ça peut toujours le faire, hein. 👀

Comme l'indique Jeff Geerling dans l'article dédié à ce projet sur son blog, il est toutefois possible d'améliorer sensiblement les performances en y intégrant une carte graphique externe, les GPU et la VRAM qui lui sont associées étant bien plus rapides que les CPU et la mémoire système.

À l'aide d'une carte AMD W7700 (bon OK, il y va un peu plus fort sur le budget là 😅), le développeur a ainsi réussi à atteindre une vitesse moyenne comprise entre 24 et 54 tokens par seconde.

Ce qui reste beau en soi, c'est la perf du projet dans son ensemble. Jusque-là, quand il était question d'embarquer une IA sur un Raspberry Pi, on était plutôt habitué à se contenter de requêtes adressées à un serveur distant plutôt que de faire tourner le modèle directement sur le micro-ordinateur lui-même !

Vous pourrez en savoir plus en visionnant la vidéo de Jeff Geerling ici :

(Image d'illustration : Jeff Geerling sur YouTube)

À propos de l'auteur
Nicolas Lecointre
Chief Happiness Officer des développeurs, ceinture noire de sudo. Pour rire, j'ai créé Les Joies du Code. J'utilise Vim depuis 10 ans parce que je sais pas comment le quitter.
Événements

Développeurs JavaScript : vous pensez tout savoir ? Passez au niveau supérieur à la conférence dotJS 2025 !

Participez à la conférence JavaScript dotJS 2025 !

Le J c’est le S — Être développeur, c’est passer des heures devant son écran à coder (et à débuguer 🥲), à éplucher des repos GitHub et à enchaîner les articles tech pour essayer de suivre le rythme effréné des nouveautés dans son domaine.

Mais soyons honnêtes : glaner des infos ici et là, c’est bien, les entendre directement des meilleurs experts et pouvoir échanger avec eux, c’est encore mieux !

Et c’est justement ce que vous propose la conférence dotJS 2025 :

🔥 Les dernières évolutions de JavaScript et de son écosystème, expliquées par celles et ceux qui les façonnent.

🎤 Un line-up d’intervenants d’exception, qu’on a rarement l’occasion de voir en France.

🙋‍♂️ L’occasion unique de poser vos questions en direct à des ingénieurs et créateurs de renom.

🤝 1500 développeurs réunis en un seul lieu pour networker, partager leurs idées et créer des opportunités professionnelles.

Le 3 avril 2025, prenez part à l’expérience dotJS au théâtre des Folies Bergère à Paris pour propulser votre expertise JavaScript et votre carrière ! 🚀

Parce que JavaScript, ce n’est pas juste gérer des classes CSS dynamiques ou ajouter des listeners à tout-va (je vous vois 👀), dotJS est l’occasion idéale pour garder une longueur d’avance sur les évolutions du langage, anticiper les transformations majeures liées à l’IA et capter les tendances qui façonneront votre métier demain.

Je réserve ma place pour dotJS 2025 🤩
Le jeudi 3 avril 2025


/* En partenariat avec dotConferences */

Pourquoi participer à dotJS 2025 ?

Vous êtes développeur initié de JavaScript ? dotJS est là pour repousser vos limites, stimuler votre curiosité sur l’écosystème de ce langage — qui ne laisse aucun développeur insensible — et vous donner l’opportunité d’échanger avec 1500 autres passionnés du web !

Un meme sur JavaScript avec Leonardo DiCaprio qui rit : Les gens qui apprennent à coder en JavaScript : 'je vais utiliser array.sort() pour trier cette liste de nombres.' JavaScript : [1, 100000, 21, 30, 4]

Comme vous le savez, j’ai eu le plaisir de participer en octobre dernier à dotAI, la conférence IA de dotConferences, qui est aussi l’organisateur de dotJS.

À l’image de dotAI, dotJS proposera une alternance entre différents formats de conférences. Ayant assisté à dotAI, j’avais d’ailleurs adoré son rythme et sa construction, on peut s’attendre à une organisation tout aussi bien orchestrée pour cette conférence à venir.

Vous y trouverez donc :

  • Des talks condensés (20 minutes max) construits pour maintenir votre attention, accompagnés d’une petite session de questions/réponses avec le public
  • Des lightning talks énergisants de 10 minutes chacun après le déjeuner
  • Un networking game géant pour briser la glace, rencontrer d’autres passionnés et élargir votre réseau dans une ambiance conviviale

Cerise sur le gâteau, la conférence dotJS, qui rayonne déjà auprès de la communauté JS, célèbrera à l’occasion de cette nouvelle édition son 10ème anniversaire ! 🥳

Prenez part à la conférence JavaScript dotJS 2025
(-15% avec le code JOIESDUCODE15)
🎟️

Au programme de dotJS 2025

Pour cette nouvelle itération de la conférence JavaScript, un panel de speakers de renom prendra place sur la scène des Folies Bergère.

Le line-up des intervenants de la conférence dotJS 2025

Parmi les intervenants confirmés, voici un petit aperçu des conférences qui ont d’ores et déjà attisé ma curiosité :

  • Sarah Drasner, directrice principale de l’ingénierie Core Web, Android, iOS et infrastructures multiplateformes chez Google
  • Le développeur JS canadien Wes Bos, figure incontournable sur les réseaux, explorera comment exécuter des modèles IA avec JavaScript
  • Kyle Simpson, auteur des livres à succès "You Don’t Know JS", prévoit quant à lui d’évoquer le passage au Web 2.5
  • Un lightning talk de Vadim Smirnov, qui montrera comment reproduire les graphiques hypnotisants de ce bon vieux Windows Media Player à l’aide de l’API Web MIDI (nostalgie garantie ☺️)

Et enfin, vous pourrez également assister à une conférence de Ryan Dahl, qui n’est autre que le créateur de Node.js et Deno ! Si l’on en croit son récent post sur X, il pourrait d’ailleurs profiter de la conférence dotJS 2025 pour faire une annonce en exclu. 🫣

On s'y retrouve ?

dotJS 2025 vous offrira un tour d’horizon complet du JavaScript moderne, ponctué de conférences pointues qui vous aideront à affûter vos compétences, repousser les frontières du langage et comprendre comment l’IA est en train de redéfinir le métier de développeur.

Au passage, je serai aussi sur place, alors n’hésitez pas à me faire signe sur mes réseaux si vous avez envie qu'on partage un café ensemble ! 😉

Plus on est de fous, plus on jQuery (oh l’affront) ! Ne venez pas seul(e) à dotJS : faites-en un événement d’équipe !

C’est le moment de convaincre votre chef d’offrir à votre dream team une immersion unique dans l’écosystème JavaScript à même de booster votre vision et vos compétences.

Au-delà des conférences de haut niveau, dotJS est une opportunité idéale pour renforcer la cohésion d’équipe dans un cadre stimulant et inspirant.

🎁 En plus, grâce à votre humble serviteur, vous pouvez même profiter d’une réduction de 15% sur le tarif regular des billets avec le code JOIESDUCODE15, que demander de plus ? 😇

Rendez-vous le 3 avril !

Je réserve ma place pour
la conférence JavaScript dotJS 2025
🚀

Aperçu de la conférence dotJS 2024 dans le théâtre des Folies Bergère