Gemini y gemini-cli para crear herramientas de escritorio
Que las máquinas nos entiendan, en ese proceso estadístico simulado. Es uno de los cambios más relevantes de toda esta movida de la IA. Sin entrar en discusiones políticas. ¿Se puede usar la capacidad de este entendimiento de la máquina para imaginar otras formas de uso?
Esta exploración es eso. Hacer apps en el SO como herramientas de utilidad, es algo que hasta la fecha, para mí, no era accesible. En OSX usar Xcode y Swift es algo tedioso, por la complejidad de su API y su profundidad. Usar entornos como Electron/React, toca hackear.
Pero ahora la máquina entiende y si lo que buscas es crearte tus propias herramientas, como los útiles que se crean los torneros/fresadores para sujetar sus piezas. Esa posibilidad ahora es posible.
Resumen
Este proyecto nace de la necesidad de agilizar la corrección de textos en cualquier aplicación de macOS. La idea es simple, una pequeña utilidad que vive en la barra de menús, siempre accesible. El flujo de trabajo consiste en seleccionar y copiar un texto, presionar un atajo de teclado global (como ⌘+⇧+C), y dejar que la aplicación envíe el contenido a la API de Gemini para su corrección. El texto mejorado reemplaza automáticamente el contenido del portapapeles, listo para ser pegado en cualquier lugar.
El núcleo de la aplicación ese está construyendo en Swift y SwiftUI, buscando una integración nativa y un consumo de recursos mínimo. La lógica se separa en gestores claros: uno para el portapapeles, otro para la comunicación segura con la API de Gemini (almacenando la clave en el Keychain del sistema), y un tercero para las notificaciones al usuario. Es un ejemplo práctico de cómo una herramienta de IA puede integrarse de forma casi invisible en el flujo de trabajo diario, eliminando la fricción de tener que abrir una web o una aplicación específica para una tarea recurrente.
Notas
- El prompt enviado a Gemini será crucial para asegurar que la respuesta sea únicamente el texto corregido, sin añadidos.
- Se ha implementado un sistema básico de estadísticas para llevar la cuenta de las correcciones.
- El manejo de errores (sin conexión, API key inválida) es una prioridad.
Siguientes Pasos
- Implementar el monitor de eventos para el atajo de teclado global.
- Diseñar y finalizar la ventana de configuración para la API Key.
- Realizar pruebas con diferentes tipos de texto y en distintas aplicaciones.
Este borrador se creó el 6 de julio de 2025 como punto de partida para un ensayo mayor. Actualiza tu propia copia y alimenta la conversación en el canal Procesos.