ByteBot L'IA qui controle le PC

ByteBot est un agent IA open-source auto-hébergé qui prend le contrôle d'un ordinateur virtuel dans un conteneur Docker pour exécuter des tâches via des instructions en langage naturel.

# ByteBot : un agent IA open-source pour le contrôle d’ordinateur

ByteBot est un projet open-source qui permet à un modèle de langage (LLM) de contrôler un environnement de bureau Linux complet via des instructions en langage naturel. L’outil s’exécute entièrement dans un conteneur Docker et n’a aucun accès direct à l’ordinateur hôte.

## Architecture
L’architecture repose sur trois composants principaux :
- Conteneur Ubuntu 22.04 avec interface graphique XFCE et serveur VNC modifié (noVNC).
- Serveur backend Node.js qui relaie les captures d’écran et transmet les actions (clics, déplacements de souris, frappes clavier) au LLM.
- Interface web React accessible sur le port 9992 pour visualiser le bureau virtuel et suivre l’exécution.

## Installation
1. Cloner le dépôt GitHub : `bytebot-ai/bytebot`
2. Créer un fichier `.env` contenant la clé API du LLM choisi (Claude, OpenAI, Google Gemini, Groq, etc.)
3. Lancer avec `docker-compose up -d`

## Fonctionnement
L’utilisateur soumet une tâche en texte simple (exemple : « Créez un dépôt GitHub nommé test-repo et poussez-y un fichier README.md »).
ByteBot :
- Capture l’écran toutes les 1 à 3 secondes
- Transmet l’image au LLM avec le contexte
- Reçoit les actions à effectuer
- Les exécute dans le conteneur

## Fonctionnalités principales
- Navigation web complète (Chrome ou Firefox installé dans le conteneur)
- Gestion sécurisée des identifiants via un gestionnaire de mots de passe chiffré
- Exécution de commandes terminal, scripts bash ou Python
- Création et envoi de pull requests GitHub
- Remplissage automatique de formulaires
- Mode « démonstration » : enregistrement et replay de séquences manuelles
- API REST complète pour lancer des tâches par programme et récupérer les résultats (logs, captures d’écran, statut)

## Sécurité
- Isolation totale dans Docker (pas de privilèges hôte, pas de montage de volumes sensibles par défaut)
- Possibilité de restreindre les domaines autorisés et les commandes shell
- Code entièrement auditable (licence MIT)

## Modèles compatibles
Les modèles les plus performants sont :
- Claude 3.5/4 Sonnet
- GPT-4o
- Gemini 1.5 Pro

Les performances varient selon la complexité visuelle de la tâche et la qualité du prompt.

## Maintenance
ByteBot est maintenu activement (mises à jour toutes les 1-2 semaines) et dispose d’une communauté Discord ainsi que d’un système de plugins en développement.

**Sources** :
- dépôt officiel GitHub bytebot-ai/bytebot (README et documentation technique),
- vidéo de démonstration de Korben du 06 novembre 2025 https://youtu.be/g7WRUxER9nU