Google vient de dévoiler une innovation majeure pour les développeurs : l’API Interactions, une interface révolutionnaire qui simplifie l’interaction avec les modèles d’intelligence artificielle comme Gemini 3 Pro et les agents spécialisés comme Gemini Deep Research. Cette nouveauté est désormais disponible en version bêta publique via l’API Gemini dans Google AI Studio.
Qu’est-ce que l’API Interactions exactement ?
Imaginez un chef d’orchestre numérique capable de coordonner différents musiciens (les modèles IA) et solistes (les agents spécialisés) avec une seule baguette. C’est exactement ce que fait cette nouvelle API : elle unifie l’accès à tous les outils d’intelligence artificielle de Google sous une seule interface.
L’API introduit une interface native spécialement conçue pour gérer des interactions complexes lors de la création d’applications « agentiques » – des logiciels capables d’agir de manière autonome et intelligente.
Gemini Deep Research : votre assistant de recherche personnel
Avec cette API, vous avez accès au premier agent intégré de Google : Gemini Deep Research. Cet agent de pointe peut :
- Mener des recherches approfondies sur des sujets complexes
- Synthétiser ses découvertes dans des rapports complets
- Travailler en arrière-plan sans nécessiter votre supervision constante
Ce n’est que le début ! Google prévoit d’élargir sa gamme d’agents intégrés et d’introduire la possibilité de créer vos propres agents personnalisés.
Comment fonctionne cette API en pratique ?
L’API Interactions propose un point d’accès unique (/interactions) pour interagir avec les modèles et agents spécialisés.
Pour interagir avec les modèles :
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3-pro-preview",
input="Qui a gagné le dernier euro ?",
tools=[{"type": "google_search"}],
)
Pour interagir avec les agents :
from google import genai
client = genai.Client()
interaction = client.interactions.create(
agent="deep-research-pro-preview-12-2025",
input="Recherche l'histoire des TPU de Google.",
background=True
)
Les avantages révolutionnaires de cette approche
Cette nouvelle API apporte plusieurs améliorations majeures :
- Gestion d’état côté serveur : Plus besoin de gérer manuellement l’historique des conversations
- Modèle de données composable : Une architecture claire pour déboguer et manipuler les interactions complexes
- Exécution en arrière-plan : Possibilité de déléguer des tâches longues au serveur
- Support d’outils distants MCP : Les modèles peuvent directement appeler des serveurs du protocole Model Context Protocol
Pourquoi une nouvelle API ?
Selon les équipes de Google, « les modèles deviennent des systèmes et pourraient même devenir des agents à part entière ». L’ancienne API generateContent était parfaite pour les chatbots simples et les tâches de complétion de texte, mais le paysage technologique a évolué.
Avec l’émergence de nouvelles capacités comme la « réflexion » des modèles et l’utilisation avancée d’outils, il fallait une interface native conçue spécifiquement pour ces interactions complexes.
Comment commencer dès aujourd’hui ?
Vous pouvez commencer à utiliser l’API Interactions dès maintenant en suivant ces étapes :
- Obtenez votre clé API Gemini depuis Google AI Studio
- Consultez la documentation API
- Explorez les spécifications OpenAPI ici
- Testez et partagez vos retours sur le forum de discussion
L’avenir de l’écosystème IA
Google s’engage à rendre ces capacités accessibles à l’ensemble de l’écosystème open source. En première étape, l’Agent Development Kit (ADK) et le protocole Agent2Agent (A2A) supportent déjà l’API Interactions.
Un support plus large à travers d’autres outils est prévu dans les mois à venir, et l’API Interactions ainsi que Gemini Deep Research arriveront bientôt sur Vertex AI.
Cette nouvelle API marque une étape importante dans l’évolution de l’intelligence artificielle, rendant plus accessible que jamais la création d’applications intelligentes et autonomes.
Source de cette information : Blog Google