Google ha presentado Géminis cliun agente AI de línea de comandos de código abierto que integra el modelo Gemini 2.5 Pro directamente en el terminal. Diseñado para desarrolladores y usuarios de avances técnicos, Gemini CLI permite a los usuarios interactuar con Gemini utilizando lenguaje natural directamente desde la línea de comandos, apoyando flujos de trabajo, como explicación del código, depuración, generación de documentación, manipulación de archivos e incluso investigaciones fundamentadas.
Gemini CLI se basa en la infraestructura de backend de Gemini Code Assist y ofrece una capa de inteligencia similar a los desarrolladores que prefieren interfaces basadas en terminal. Admite secuencias de comandos, interacciones rápidas y extensiones de agentes, lo que brinda a los desarrolladores la flexibilidad de integrarlo en tuberías de CI/CD, scripts de automatización o trabajo de desarrollo diario. Al combinar la accesibilidad terminal con la plena potencia del razonamiento multimodal de Gemini, Google está posicionando esta herramienta como un complemento ligero pero poderoso para los asistentes unidos a IDE.
Una característica destacada de Gemini CLI es su integración con Géminis 2.5 Proun frontier LLM que admite hasta 1 millón de tokens en contexto. Los desarrolladores pueden acceder al modelo de forma gratuita utilizando una cuenta personal de Google, con cuotas de uso generosas, hasta 60 solicitudes por minuto y 1,000 por día. La herramienta está construida para ser liviana e inmediatamente utilizable; La instalación es tan simple como ejecutar npx o usar npm install -g. Una vez instalados, los usuarios pueden autenticarse y comenzar a emitir indicaciones en idioma natural desde su terminal.
Lo que hace que Gemini CLI sea particularmente atractivo para los desarrolladores es su Licencia de código abierto (Apache 2.0). Los desarrolladores pueden inspeccionar, modificar y extender la base de código alojada en Githubconstruir sus propios agentes o modificar indicaciones para adaptarse a requisitos específicos del proyecto. Esta flexibilidad fomenta tanto la transparencia como la innovación comunitaria, lo que permite que las capacidades de IA se ajusten a los flujos de trabajo de desarrolladores del mundo real.
La CLI admite sesiones interactivas y secuencias de comandos no interactivos. Por ejemplo, un usuario puede ejecutar gemini y escriba “Explique los cambios en esta base de código desde ayer” o úselo en un script con --prompt Para automatizar la generación de documentación. También es extensible a través de archivos de configuración como GEMINI.mdpermitiendo a los desarrolladores precargar el contexto, personalizar las indicaciones del sistema o definir los flujos de trabajo específicos de la herramienta.
Gemini CLI va más allá del modelado de idiomas básicos. Incorpora Protocolo de contexto modelo (MCP) extensiones y Grounding de Google Searchpermitiéndole razonar en función de la información en tiempo real. Los desarrolladores también pueden integrar herramientas multimodales como VEO (para la generación de videos) e Imagen (para la generación de imágenes), ampliando el alcance de lo que se puede hacer desde el terminal. Ya se trate de prototipos de imágenes, código de andamio o resumiendo la investigación, Gemini CLI está diseñado para acomodar una amplia gama de casos de uso técnico.
La adopción temprana ha sido prometedora. Los desarrolladores aprecian la flexibilidad del lenguaje natural, la compatibilidad de las secuencias de comandos y el rendimiento del modelo, especialmente dado el acceso de nivel libre. La comunidad ya está presentando solicitudes de extracción y contribuyendo a la base de código, y Google parece estar activamente participando en mejoras adicionales basadas en la retroalimentación de GitHub. También es digno de mención que la Gemini CLI Backend comparte infraestructura con asistencia en código Gemini, asegurando la consistencia en los entornos terminales e IDE.
Desde una perspectiva más amplia, Gemini CLI ingresa a un panorama competitivo de herramientas de desarrollo de IA que incluye Copilot GitHub, OpenAI Codex CLI y otros agentes propulsados por LLM. Sin embargo, la decisión de Google de hacer que Gemini CLI abierta, combinada con una cuota gratuita generosa y una interfaz nativa de terminal, lo distingue. Apela directamente a los desarrolladores de backend, los ingenieros de DevOps y los equipos técnicos que buscan herramientas de IA flexibles e integradas sin ser bloqueados en IDES o plataformas pagas de propiedad.
Para comenzar, los usuarios pueden instalar Gemini CLI con una línea de una sola, autenticarse a través de su cuenta de Google y comenzar a experimentar con comandos de lenguaje natural. La configuración es mínima, y la curva de aprendizaje es superficial, especialmente para los usuarios que ya están familiarizados con las herramientas de línea de comandos. Para aquellos que buscan profundizar, el repositorio de GitHub del proyecto ofrece ejemplos detallados, instrucciones para contribuir e información sobre la extensión de las capacidades del agente.
En conclusión, Gemini CLI es el impulso de Google para acercar las capacidades de IA avanzadas a donde muchos desarrolladores pasan la mayor parte de su tiempo: la terminal. Al combinar la transparencia de código abierto, el poderoso acceso al modelo, la extensibilidad y la base en el tiempo real, Gemini CLI se presenta como una herramienta convincente para los desarrolladores que desean más de sus asistentes de IA. No solo agiliza los flujos de trabajo de desarrollo, sino que también abre nuevas vías para la automatización, la interacción multimodal y el razonamiento inteligente, todo sin dejar la línea de comando.
TLDR: Google AI ha lanzado Géminis cliuna interfaz de línea de comandos de código abierto que integra Gemini 2.5 Pro directamente en el terminal. Permite a los desarrolladores ejecutar comandos en idioma natural para la generación de códigos, depuración, operaciones de archivos y más, sin dejar el shell. Construido con extensibilidad en mente, Gemini CLI admite secuencias de comandos, herramientas multimodales como Veo e Imagen, y en la web en tiempo real. Con un generoso backend compartido de nivel libre con asistencia en código Gemini y soporte para el Protocolo de contexto modelo (MCP), ofrece una poderosa experiencia de IA adaptada para desarrolladores y flujos de trabajo de automatización.
Mira el Papel y Página de Github. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.
Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.