home›Sistemi Agentici›

Come Science Superpowers trasforma gli agenti AI in collaboratori scientifici

Guida pratica all'implementazione di un rigoroso workflow di ricerca per agenti AI, con enfasi su preregistrazione e riproducibilità.

6 giugno 2026

#Accademico #Agenti #Automazione #Framework #Open Source

Science Superpowers converte un agente AI in un collaboratore scientifico disciplinato, implementando un workflow rigoroso e preregistrato. Questo sistema previene p-hacking e HARKing, garantisce riproducibilità e verifica i risultati. Adattato dalla metodologia Superpowers per lo sviluppo software, si concentra sulla preregistrazione. Funziona senza dipendenze di terze parti e si integra con vari harness AI come Cursor, Claude Code e Gemini CLI.

Cosa fa Science Superpowers

Science Superpowers trasforma un agente AI capace di fare ricerca in un collaboratore scientifico disciplinato. Invece di lasciare che l'agente si lanci subito a eseguire codice sui tuoi dati, impone un rigoroso flusso di lavoro pre‑registrato.

La sua disciplina centrale è la preregistration — l'equivalente dello sviluppo guidato dai test nel coding. Un interesse vago diventa una domanda falsificabile, con ipotesi chiare e regole decisionali prima ancora di toccare i dati. Questo protegge da p‑hacking e HARKing, separa le analisi confermative da quelle esplorative e blocca in anticipo le previsioni.

Ogni analisi viene eseguita in uno spazio di lavoro isolato e riproducibile (ambiente bloccato, semi fissi, dati grezzi immutabili). I risultati sono verificati confrontandoli con output appena rigenerati, sottoposti a una revisione red‑team e le anomalie vengono analizzate alla radice anziché essere silenziosamente scartate.

Il ciclo di ricerca in dieci fasi

Quando inizi un compito di ricerca, l'agente segue automaticamente questi passaggi, attivati da file di competenze:

Inquadramento — trasformare un interesse in una domanda falsificabile.
Esame della letteratura precedente — ancorare la domanda alle conoscenze esistenti.
Progettazione dell'analisi — suddividere il lavoro in passi concreti e dimensionati.
Preregistrazione — bloccare ipotesi e regole decisionali prima di vedere i risultati.
Configurazione di uno spazio di lavoro riproducibile — isolato, bloccato, con semi fissi.
Esecuzione del piano — tramite subagente o batch, con checkpoint.
Indagine sulle anomalie — un processo in quattro fasi per risalire alla causa principale.
Verifica dei risultati — rieseguire, verificare le assunzioni, riprodurre le evidenze.
Revisione red‑team — revisione scettica e risposta rigorosa.
Report e archiviazione — decidere se preprint, accantonare o scartare; archiviare tutto.

Questo flusso di lavoro di ricerca strutturato garantisce che le affermazioni confermative restino protette, le anomalie vengano spiegate e ogni numero sia riproducibile — senza dover gestire tu i passaggi.

Installazione: una configurazione per harness

Science Superpowers è un insieme di file di competenze (SKILL.md) e hook di bootstrap con zero dipendenze di terze parti — solo un harness per agenti AI e una shell POSIX.

L'installazione è specifica per l'harness. Per Cursor, utilizza il marketplace dei plugin o punta Cursor al repository; l'hook sessionStart carica automaticamente il bootstrap. Per Claude Code, registra il repository come marketplace e installa il plugin science-superpowers; l'hook SessionStart gestisce l'avvio. Codex utilizza il manifest .codex-plugin/plugin.json, Gemini CLI installa un'estensione che punta a GEMINI.md, OpenCode segue .opencode/INSTALL.md e Google Antigravity legge GEMINI.md/AGENTS.md come regole sempre attive.

Dopo l'installazione, l'agente carica automaticamente le competenze all'inizio di ogni sessione. Non sono necessari file di configurazione o messa a punto.

Uso quotidiano: basta parlare, niente comandi

Non invochi mai una competenza per nome. Parli normalmente con il tuo agente e le competenze si attivano da sole.

Ad esempio, chiedere informazioni sui dati di abbandono (churn) attiva la preregistration prima ancora di toccare il CSV. L'agente fa un passo indietro, inquadra una domanda falsificabile, esamina le analisi precedenti, progetta lo studio e preregistra ipotesi e regole decisionali. Poi esegue il piano in uno spazio di lavoro riproducibile, risale alla causa principale di eventuali anomalie (come una lacuna nei log), verifica i risultati e sottopone a revisione red‑team le proprie conclusioni.

Il risultato è un'affermazione confermativa protetta, anomalie spiegate e piena riproducibilità — il tutto senza dover gestire un flusso di lavoro. Basta fare una domanda.

Configurazione, limiti e best practices

Science Superpowers non utilizza nessuna variabile d'ambiente o file di configurazione. I file hook (ad esempio hooks/hooks-cursor.json) sono l'unico meccanismo di bootstrap, configurato una volta sola.

Limitazioni: Il README non elenca bug espliciti o scenari non supportati. La metodologia si basa sulla capacità dell'agente di eseguire codice in un ambiente POSIX e di comprendere SKILL.md. Se l'agente non può eseguire codice arbitrario o il formato, l'attivazione automatica non funzionerà.

Best practices codificate nella filosofia:

pre‑register sempre — dichiarare le previsioni prima di vedere i risultati (la Legge Ferrea).
Etichettare ogni analisi come confermativa o esplorativa.
Rendere lo spazio di lavoro riproducibile — pacchetti bloccati, semi fissi, dati immutabili.
Verificare prima di affermare; risalire alla causa principale delle anomalie; sottoporre a red‑team le proprie conclusioni.
Estendere il sistema creando nuove competenze seguendo la disciplina writing-science-skills.

Estensione e Manutenzione

Se hai bisogno di una funzionalità non inclusa, usa la meta‑skill writing-science-skills per creare un nuovo file SKILL.md che segua la stessa metodologia di test. Le linee guida per i contributori sono in AGENTS.md/CLAUDE.md.

Il repository supporta più agent harness in modo indipendente; non esiste un programma di installazione unificato. Se utilizzi sia Cursor che Claude Code, installa Science Superpowers in ciascuno. I file delle skill sono identici — varia solo il bootstrap loading.

Non è documentato alcun percorso di aggiornamento formale. Il progetto è rilasciato sotto la licenza MIT; per ottenere i file più recenti, clona nuovamente il repository.

GitHub