Qu'est-ce que MCP exactement et pourquoi auditer ?

MCP (Model Context Protocol) est un protocole open-source publié par Anthropic en novembre 2024 pour standardiser l'accès des LLM aux contextes externes (tools, resources, prompts). Pensé comme un USB-C pour les agents IA, il permet à un host (Claude Desktop, IDE, application custom) de se connecter à des serveurs MCP qui exposent des capabilities. L'audit est nécessaire car la spec se déploie rapidement (centaines de MCP servers communautaires en 2025), avec des implémentations parfois insécurisées et des vulnérabilités émergentes documentées en 2025.

Quels sont les transports MCP et leurs implications sécurité ?

Trois transports principaux : (1) stdio, process local communicant via stdin/stdout, pas d'authentification par défaut, le serveur a accès au filesystem du host s'il n'est pas sandboxé ; (2) HTTP+SSE, communication réseau avec server-sent events pour notifications, authentification optionnelle (souvent absente sur les implémentations communautaires) ; (3) Streamable HTTP, transport simplifié introduit en mars 2025. Chaque transport a ses propres garanties d'isolation à valider lors de l'audit.

Quelle différence entre auditer un MCP server et auditer un agent connecté générique ?

L'agent connecté audité de façon générique couvre n'importe quel framework (LangChain, AutoGen, OpenAI Functions). L'audit MCP est spécifique au protocole standardisé d'Anthropic, capabilities Tools/Resources/Prompts définies par la spec, modèle host/client/server, transports normés. Cette spécificité permet des outils d'audit plus systématiques (tests automatisables sur la conformité spec), mais expose à des classes de vulnérabilités propres au protocole (cross-server confusion, capability escalation via spec ambiguities).

Faut-il préférer les MCP servers officiels ou communautaires ?

En 2025, les serveurs officiels Anthropic (filesystem, github, postgres, etc.) ont reçu plus d'attention sécurité que la moyenne des serveurs communautaires. Plusieurs vulnérabilités d'implémentation ont été documentées sur des MCP servers communautaires populaires fin 2025. Recommandation pratique : (1) utiliser les serveurs officiels quand disponibles, (2) auditer en interne tout serveur communautaire avant déploiement, (3) ne jamais installer un MCP server depuis npm/pypi sans revue de code et de la signature.

Comment sandboxer un MCP server local lancé en stdio ?

Le transport stdio expose le serveur au filesystem et aux capacités process du host par défaut. Patterns 2025 : (1) lancer le serveur dans un container Docker avec mount limité au strict nécessaire, (2) utiliser systemd-nspawn ou bubblewrap sur Linux pour isolation process, (3) sur macOS, utiliser sandbox-exec avec profil restrictif, (4) Windows : AppContainer ou Sandbox. Les hosts MCP modernes (Claude Desktop) commencent à proposer du sandboxing natif mais la couverture reste partielle, l'audit doit valider la configuration concrète.

LLM Security

Audit de sécurité des intégrations MCP (Model Context Protocol)

Méthodologie d'audit des intégrations MCP : architecture host/client/server, classes de vulnérabilités, outils 2025 et patterns de défense.

Naim Aouaichia

13 mars 202610 min de lectureMis à jour le 15 mai 2026

MCP
Model Context Protocol
Audit IA
Sécurité agent
Anthropic
Tools LLM
Sandboxing
Supply chain

Le Model Context Protocol (MCP), publié par Anthropic en novembre 2024, est devenu en moins d'un an le protocole de référence pour standardiser l'exposition de tools, resources et prompts aux LLM. Adopté par Claude Desktop, des IDEs (Cursor, Zed, Continue), et plus de plusieurs centaines de serveurs MCP communautaires en 2025, il introduit aussi une nouvelle surface d'attaque distincte des audits agent connectés génériques. Cet article structure l'audit en couvrant l'architecture host/client/server, les classes de vulnérabilités MCP documentées en 2024-2025, et les patterns de défense effectifs.

1. MCP en 2025, pourquoi c'est une nouvelle surface d'attaque

Trois facteurs expliquent l'urgence d'auditer MCP en 2025 :

Adoption massive et rapide, depuis l'annonce d'Anthropic en novembre 2024, des centaines de serveurs MCP ont été publiés sur npm et PyPI, beaucoup par la communauté avec une attention sécurité variable. Anthropic, OpenAI, Microsoft, et de nombreux IDE ont adopté le protocole en 2025.
Surface d'attaque distincte des frameworks agents, MCP n'est ni LangChain ni OpenAI Functions. Il introduit un modèle host/client/server normé, des transports propres (stdio, HTTP+SSE, Streamable HTTP), et des capabilities standardisées (Tools/Resources/Prompts). Les méthodologies d'audit agent générique couvrent partiellement, pas totalement.
Vulnérabilités d'implémentation documentées, plusieurs vulnérabilités sur des serveurs MCP communautaires populaires ont été documentées fin 2025 (sandbox escape, command injection sur tools args, authentification absente). Le protocole lui-même est sain, mais les implémentations en aval portent le risque réel.

L'audit MCP couvre un sous-ensemble des audits agent IA connecté (article dédié), avec des spécificités propres au protocole.

2. Architecture MCP : host, client, server, transports

Comprendre les composants est un prérequis à l'audit. La spec MCP définit quatre éléments structurants.

Composant	Rôle	Exemples 2025
Host	Application qui utilise le LLM, embarque le client MCP	Claude Desktop, Cursor, Zed, Continue, applications custom
Client	Composant dans le host qui parle au serveur MCP via un transport	SDK officiels Anthropic (Python, TypeScript, Go, Rust)
Server	Process séparé qui expose des capabilities (Tools, Resources, Prompts)	filesystem-mcp, github-mcp, postgres-mcp, hundreds of community servers
Transport	Canal de communication entre client et server	stdio (local), HTTP+SSE (réseau), Streamable HTTP (introduit mars 2025)

Capabilities exposées par un serveur MCP

Tools, fonctions exécutables par le LLM. La capability la plus sensible (équivalent function calling).
Resources, données accessibles en lecture (fichiers, base de données, API). Risques de fuite si scope mal défini.
Prompts, templates de prompts partageables. Risque de prompt injection si templates partagés non auditiés.

Transports et garanties

Transport	Auth par défaut	Filesystem access	Réseau exposé	Risque dominant
stdio	Aucune (process local)	Complet sauf sandboxing explicite	Non	Sandbox escape
HTTP+SSE	Optionnel (souvent absent en communautaire)	Aucun (process séparé)	Oui	Auth bypass + supply chain
Streamable HTTP	Optionnel	Aucun	Oui	Auth bypass + supply chain

L'audit doit identifier précisément quel transport est utilisé et appliquer les contrôles correspondants.

3. Classes de vulnérabilités MCP documentées 2024-2025

Sept classes de vulnérabilités émergent des audits 2024-2025 sur des serveurs MCP réels. Mapping OWASP LLM Top 10 v2 2025 quand applicable.

Classe	Description	OWASP LLM mapping	Sévérité typique
Authentification absente	Serveur HTTP/SSE accessible sans credential	LLM06	Critique
Sandbox escape	Serveur stdio accède au filesystem hors mount autorisé	LLM06	Critique
Command injection (tool args)	Args non sanitisés passés à shell ou eval côté server	LLM05 + LLM06	Critique
Supply chain	MCP server compromis installé depuis npm/pypi	LLM03	High → Critique
Capability escalation	Serveur expose plus que ce qu'il déclare dans manifest	LLM06 + LLM07	High
Cross-server confusion	Un serveur influence un autre via prompts injectés	LLM01	High
Token exfiltration	Credentials du host fuités via tool call output	LLM02	High → Critique

Détail : authentification absente

Le transport stdio n'a pas d'authentification par construction (process local, communication via stdin/stdout). Pour HTTP+SSE et Streamable HTTP, la spec MCP ne mandate pas d'authentification, c'est laissé à l'implémentation. Résultat constaté en 2025 : une part significative des serveurs MCP communautaires HTTP n'imposent aucune authentification, laissant le serveur accessible à tout client réseau qui connaît l'endpoint.

Détail : sandbox escape

Un serveur MCP stdio non sandboxé hérite des permissions du process host. Si le host tourne avec les droits utilisateur normaux et accède au filesystem complet, le serveur MCP aussi. Un serveur compromis ou mal conçu peut alors lire ~/.ssh/, ~/.aws/credentials, ou tout autre fichier sensible.

4. Méthodologie d'audit d'un MCP server custom

Pour un serveur MCP développé en interne ou utilisé en production, méthodologie d'audit en cinq phases.

Phase 1, Inventaire des capabilities

Lister toutes les Tools, Resources et Prompts exposées par le serveur. La spec MCP fournit un endpoint tools/list (et équivalents pour resources/prompts) qui dresse la liste officielle déclarée :

# Audit MCP server, inventaire des capabilities exposées
# Hypothèse : MCP server HTTP exposé sur localhost:8765
import requests
 
MCP_BASE = "http://localhost:8765"
HEADERS = {"Authorization": "Bearer <audit_token>"}  # vide si pas d'auth
 
def list_capabilities(method):
    """Récupère la liste des capabilities (tools, resources, prompts)."""
    payload = {
        "jsonrpc": "2.0",
        "id": 1,
        "method": method,
        "params": {},
    }
    response = requests.post(f"{MCP_BASE}/", json=payload, headers=HEADERS)
    return response.json().get("result", {})
 
tools = list_capabilities("tools/list")
resources = list_capabilities("resources/list")
prompts = list_capabilities("prompts/list")
 
print(f"Tools exposed : {len(tools.get('tools', []))}")
for t in tools.get("tools", []):
    print(f"  - {t['name']} : {t.get('description', '')[:80]}")
    print(f"    schema : {t.get('inputSchema', {}).get('properties', {})}")
 
print(f"\nResources : {len(resources.get('resources', []))}")
print(f"Prompts : {len(prompts.get('prompts', []))}")

Phase 2, Test d'authentification

Tenter chaque méthode (tools/list, tools/call, resources/read, etc.) sans token, avec un token invalide, et avec un token expiré. Tout accès accordé sans authentification valide est un finding Critique.

Phase 3, Tests d'injection sur les tool args

Pour chaque tool exposé, tester avec arguments malicieux selon le type :

Path traversal (../../etc/passwd)
Command injection (; rm -rf /tmp/audit-test, $(whoami))
SQL injection si tool DB
LDAP injection si tool annuaire
XSS si tool retourne du HTML rendu

Mesurer la réponse du serveur (erreur structurée vs leak vs exécution réussie).

Phase 4, Tests de sandbox escape (stdio uniquement)

Pour un serveur stdio, vérifier l'accès filesystem effectif depuis le serveur. Tester si le serveur peut :

Lire ~/.ssh/id_rsa, ~/.aws/credentials
Écrire dans des dossiers hors mount autorisé
Exécuter des binaires arbitraires
Accéder au réseau (DNS, HTTP sortant)

Phase 5, Audit du manifest et de la conformité spec

Comparer le manifest déclaré (capabilities, version protocol) avec le comportement effectif. Tout écart est un finding (capability escalation potentielle).

5. Méthodologie d'audit d'une intégration MCP côté host

Côté host (Claude Desktop, IDE, application custom), l'audit cible la configuration MCP et la posture défensive.

Six points de contrôle côté host

Inventaire des serveurs MCP configurés, fichier de configuration (typiquement claude_desktop_config.json, .cursor/mcp.json, équivalent), liste complète des serveurs activés.
Origine des serveurs, chaque serveur vient-il d'une source officielle (Anthropic, vendor reconnu) ou communautaire ? Hash et signature vérifiés ?
Permissions accordées, quel scope filesystem, quelle config réseau, quels secrets dans les variables d'environnement ?
Sandboxing du host, le host lui-même est-il confiné (Docker, sandbox-exec, AppContainer) ?
Audit log des invocations, les tool calls sont-ils loggés et exploitables ?
Politique de mise à jour, les serveurs MCP sont-ils mis à jour automatiquement ou manuellement ? Risque supply chain inverse (rollback sur version compromise).

Tests offensifs côté host

Cross-server confusion, installer deux serveurs MCP d'audit, vérifier si l'un peut influencer l'autre via des prompts injectés depuis ses outputs.
Token exfiltration, placer un secret dans une resource MCP, vérifier qu'un tool call malveillant ne peut pas l'exfiltrer via output ou via stack trace.
Privilege escalation host → server, un serveur MCP peut-il accéder aux secrets du host (cookies, tokens stockés) ?

6. Patterns de défense MCP

Cinq patterns structurent la défense d'une intégration MCP. L'audit valide leur présence et efficacité.

Pattern	Description	Niveau de protection
Auth obligatoire HTTP/SSE	Bearer token, mTLS, ou OAuth sur tout transport réseau	Élevé
Sandboxing process	Container, bubblewrap, sandbox-exec, AppContainer	Élevé
Allowlist filesystem	Mount restreint au strict nécessaire (pas `$HOME` complet)	Élevé
Validation arguments serveur	Le serveur valide ses inputs côté server, pas seulement via le schéma JSON	Élevé
Audit log + monitoring	Tool calls loggés avec arguments + alerting sur patterns anormaux	Moyen

Recommandations pratiques 2025

Utiliser les serveurs officiels Anthropic quand disponibles (filesystem-mcp, github-mcp, postgres-mcp). Plus matures, plus auditiés.
Auditer en interne tout serveur communautaire avant production. Revue de code obligatoire pour les serveurs en écriture.
Ne jamais lancer un serveur MCP via npx depuis un package non vérifié (risque supply chain). Préférer installation explicite + lock file + audit dépendances.
Sandboxer systématiquement les serveurs stdio via Docker, bubblewrap (Linux), sandbox-exec (macOS), ou AppContainer (Windows).
Activer l'authentification sur tout serveur HTTP/SSE, même en local (pas de "trust by default" sur localhost).

Points clés à retenir

MCP est une nouvelle surface d'attaque distincte des audits agent générique, adoption massive en 2025, modèle host/client/server normé, transports propres (stdio, HTTP+SSE, Streamable HTTP).
Sept classes de vulnérabilités émergent des audits 2024-2025, auth absente, sandbox escape, command injection, supply chain, capability escalation, cross-server confusion, token exfiltration.
Le transport stdio est le plus risqué par défaut, pas d'authentification, accès filesystem complet du host, sandbox escape immédiat sans confinement explicite.
Les serveurs MCP communautaires varient massivement en qualité sécurité, préférer les serveurs officiels Anthropic, auditer en interne tout serveur tiers avant production.
Cinq patterns de défense couvrent l'essentiel, auth obligatoire HTTP/SSE, sandboxing process, allowlist filesystem, validation arguments serveur, audit log + monitoring.

Pour aller plus loin, voir Auditer un agent IA connecté à des APIs et outils internes pour la méthodologie agent connecté générique dont MCP est une instance, Excessive Agency, définition pour la vulnérabilité dominante des tools, et Audit IA générative : checklist OWASP LLM Top 10 pour le mapping global. Le bootcamp LLM Security inclut un lab dédié à l'audit MCP avec serveurs custom et serveurs communautaires connus.

Questions fréquentes

Qu'est-ce que MCP exactement et pourquoi auditer ?
MCP (Model Context Protocol) est un protocole open-source publié par Anthropic en novembre 2024 pour standardiser l'accès des LLM aux contextes externes (tools, resources, prompts). Pensé comme un USB-C pour les agents IA, il permet à un host (Claude Desktop, IDE, application custom) de se connecter à des serveurs MCP qui exposent des capabilities. L'audit est nécessaire car la spec se déploie rapidement (centaines de MCP servers communautaires en 2025), avec des implémentations parfois insécurisées et des vulnérabilités émergentes documentées en 2025.
Quels sont les transports MCP et leurs implications sécurité ?
Trois transports principaux : (1) stdio, process local communicant via stdin/stdout, pas d'authentification par défaut, le serveur a accès au filesystem du host s'il n'est pas sandboxé ; (2) HTTP+SSE, communication réseau avec server-sent events pour notifications, authentification optionnelle (souvent absente sur les implémentations communautaires) ; (3) Streamable HTTP, transport simplifié introduit en mars 2025. Chaque transport a ses propres garanties d'isolation à valider lors de l'audit.
Quelle différence entre auditer un MCP server et auditer un agent connecté générique ?
L'agent connecté audité de façon générique couvre n'importe quel framework (LangChain, AutoGen, OpenAI Functions). L'audit MCP est spécifique au protocole standardisé d'Anthropic, capabilities Tools/Resources/Prompts définies par la spec, modèle host/client/server, transports normés. Cette spécificité permet des outils d'audit plus systématiques (tests automatisables sur la conformité spec), mais expose à des classes de vulnérabilités propres au protocole (cross-server confusion, capability escalation via spec ambiguities).
Faut-il préférer les MCP servers officiels ou communautaires ?
En 2025, les serveurs officiels Anthropic (filesystem, github, postgres, etc.) ont reçu plus d'attention sécurité que la moyenne des serveurs communautaires. Plusieurs vulnérabilités d'implémentation ont été documentées sur des MCP servers communautaires populaires fin 2025. Recommandation pratique : (1) utiliser les serveurs officiels quand disponibles, (2) auditer en interne tout serveur communautaire avant déploiement, (3) ne jamais installer un MCP server depuis npm/pypi sans revue de code et de la signature.
Comment sandboxer un MCP server local lancé en stdio ?
Le transport stdio expose le serveur au filesystem et aux capacités process du host par défaut. Patterns 2025 : (1) lancer le serveur dans un container Docker avec mount limité au strict nécessaire, (2) utiliser systemd-nspawn ou bubblewrap sur Linux pour isolation process, (3) sur macOS, utiliser sandbox-exec avec profil restrictif, (4) Windows : AppContainer ou Sandbox. Les hosts MCP modernes (Claude Desktop) commencent à proposer du sandboxing natif mais la couverture reste partielle, l'audit doit valider la configuration concrète.

Découvrir la formation LLM Security

Écrit par

Naim Aouaichia

Cyber Security Engineer et fondateur de Zeroday Cyber Academy

Ingénieur cybersécurité avec un parcours hybride : développement, DevOps Capgemini, DevSecOps IN Groupe (sécurité des documents d'identité régaliens), audits CAC 40. Fondateur de Hash24Security et Zeroday Cyber Academy. Présence LinkedIn 43 000 abonnés, Substack Zeroday Notes 23 000 abonnés.

Audit de sécurité des intégrations MCP (Model Context Protocol)

1. MCP en 2025, pourquoi c'est une nouvelle surface d'attaque

2. Architecture MCP : host, client, server, transports

Capabilities exposées par un serveur MCP

Transports et garanties

3. Classes de vulnérabilités MCP documentées 2024-2025

Détail : authentification absente

Détail : sandbox escape

4. Méthodologie d'audit d'un MCP server custom

Phase 1, Inventaire des capabilities

Phase 2, Test d'authentification

Phase 3, Tests d'injection sur les tool args

Phase 4, Tests de sandbox escape (stdio uniquement)

Phase 5, Audit du manifest et de la conformité spec

5. Méthodologie d'audit d'une intégration MCP côté host

Six points de contrôle côté host

Tests offensifs côté host

6. Patterns de défense MCP

Recommandations pratiques 2025

Points clés à retenir

Questions fréquentes

Naim Aouaichia

Auditer un agent IA connecté à des APIs et outils internes

Excessive agency : définition - LLM06 OWASP expliqué

Comment tester les vulnérabilités d'un agent IA autonome

Pentest ChatGPT, Claude, Gemini intégrés en entreprise

Audit IA générative : checklist OWASP LLM Top 10 (v2 2025)

Red teaming LLM : guide pratique pour pentesters francophones

Questions fréquentes

Naim Aouaichia

À lire également

Auditer un agent IA connecté à des APIs et outils internes

Excessive agency : définition - LLM06 OWASP expliqué

Comment tester les vulnérabilités d'un agent IA autonome

Pentest ChatGPT, Claude, Gemini intégrés en entreprise

Audit IA générative : checklist OWASP LLM Top 10 (v2 2025)

Red teaming LLM : guide pratique pour pentesters francophones