L’engouement pour l’intelligence artificielle est tel que la Raspberry Pi Foundation a lancé un nouvel AI Hat+, un module complémentaire dédié à l’IA. Cela dit, il n’est pas nécessaire d’avoir un matériel spécifique pour exécuter des modèles d’IA sur un Raspberry Pi.

Il est tout à fait possible d’exécuter de petits modèles de langage en local à l’aide du CPU. Certes, la génération de texte est plus lente, mais certains modèles légers fonctionnent relativement bien. Voici comment procéder.

Exigences

Pour obtenir une expérience correcte, il est recommandé d’utiliser un Raspberry Pi avec au moins 2 Go de RAM. Dans cet exemple, j’utilise un Raspberry Pi 4 avec 4 Go de RAM. Certains utilisateurs ont même réussi à exécuter des modèles d’IA sur un Raspberry Pi Zero 2 W doté de 512 Mo de RAM. Vous aurez également besoin :

D’une carte microSD d’au moins 8 Go de stockage.
D’un accès à internet pour télécharger les dépendances.

Installation de Ollama sur Raspberry Pi

Avant d’installer Ollama, assurez-vous que votre Raspberry Pi est bien configuré et fonctionnel. Ensuite, ouvrez un Terminal et mettez à jour les paquets en exécutant la commande suivante : sudo apt update && sudo apt upgrade

Une fois la mise à jour terminée, installez Ollama en exécutant la commande suivante : curl -fsSL https://ollama.com/install.sh | sh

Une fois l’installation terminée, Ollama affichera un message d’avertissement, indiquant qu’il utilisera le CPU pour exécuter les modèles IA en local. Vous êtes maintenant prêt à utiliser des modèles d’intelligence artificielle sur votre Raspberry Pi.

Exécuter des modèles d’IA en local sur Raspberry Pi

Après l’installation d’Ollama, vous pouvez commencer à exécuter des modèles légers. Par exemple, pour installer et exécuter TinyLlama, un petit modèle de 1,1 milliard de paramètres qui consomme environ 638 Mo de RAM, utilisez cette commande : ollama run tinyllama

Une fois le modèle téléchargé, vous pouvez entrer une requête et appuyer sur Entrée pour voir la réponse générée. Gardez à l’esprit que la génération est relativement lente, surtout sur un Raspberry Pi 4.

Utilisation d’un modèle encore plus léger ou un modèle plus avancé

Si vous souhaitez un modèle encore plus efficace, Smollm (135M paramètres) ne consomme que 92 Mo de mémoire, ce qui le rend idéal pour un Raspberry Pi : ollama run smollm:135 m.

Si vous utilisez un Raspberry Pi 5 avec plus de RAM, vous pouvez essayer Microsoft Phi, un modèle de 2,7 milliards de paramètres nécessitant 1,6 Go de mémoire : ollama run phi.

C’est ainsi que vous pouvez exécuter des modèles d’IA en local sur un Raspberry Pi, sans avoir besoin de matériel supplémentaire. Ollama est une solution simple et rapide à installer. Bien qu’il existe d’autres frameworks, comme Llama.cpp, l’installation et la configuration peuvent être plus complexes. Avec seulement deux commandes, vous pouvez commencer à utiliser un LLM (Large Language Model) directement sur votre Raspberry Pi.

Windows 11 : Recall et Click to Do, l’IA au service de votre productivité (et de votre vie privée ?)

Proton Mail et Calendar : Nouvelles interfaces, fonctionnalités avancées, et le respect de votre vie privée

Bluesky se muscle : Réactions emoji en DM et un onglet Explorer repensé !

Windows 10 est mort ? Microsoft vous dit d’acheter un nouveau PC

Test des Huawei FreeArc : des écouteurs ouverts à prix cassé pour les sportifs

Test des Huawei FreeBuds Pro 4 : Son haute-fidélité à un prix abordable !

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Galaxy S26 : Samsung prépare une puce Exynos de 2 nm qui pourrait tout changer !

Huawei Pura 80 et Mate 80 : La riposte chinoise à Samsung et Apple est en marche !

Galaxy Z Fold 7, Galaxy Z Flip 7 et Galaxy Z Flip FE : Samsung prépare une offensive pliable en juillet !

OPPO Find X8s et X8s+ : Des alternatives compactes et puissantes

DeepCoder-14B : Un nouveau modèle IA révolutionnaire pour coder plus vite et mieux

Avinox : Le système DJI qui va faire trembler Bosch et les autres

Canva Visual Suite 2.0 : La productivité visuelle redéfinie, de la conception au code

ChatGPT se souvient de tout : L’IA qui vous connaît mieux que vous-même !

Créez sans coder : Le Vibe Coding pour tous avec l’IA

Qu’est-ce que le Vibe Coding et pourquoi il est risqué ?

Vibe Coding : L’IA peut-elle vraiment remplacer les développeurs ? Les dangers du « code à l’aveugle »

Discord Social SDK : l’intégration gratuite des fonctionnalités sociales Discord dans les jeux vidéo

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Connecter Android et Windows : toutes les solutions pour utiliser vos applis sur PC !

Time Machine : Le guide complet pour sauvegarder votre Mac

Que faire avec un Raspberry Pi ? 6 idées originales pour le réutiliser

Raspberry Pi : comment exécuter des modèles d’IA en local ? Guide complet

Exigences

Installation de Ollama sur Raspberry Pi

Exécuter des modèles d’IA en local sur Raspberry Pi

Utilisation d’un modèle encore plus léger ou un modèle plus avancé

Comment organiser vos vonversations avec les Projets sur ChatGPT !

Galaxy S25 Ultra : démontage et analyse de ses secrets !

The author Yohann Poiron

Raspberry Pi : comment exécuter des modèles d’IA en local ? Guide complet

Exigences

Installation de Ollama sur Raspberry Pi

Exécuter des modèles d’IA en local sur Raspberry Pi

Utilisation d’un modèle encore plus léger ou un modèle plus avancé

The author Yohann Poiron

vous pourriez aussi aimer