Note tecniche dal lavoro reale di costruzione — risultati misurati, costi onesti, zero growth-hacking.
Il revisore non deve essere amico dell'autore
Perché ho costruito un gate di code-review avversariale in cui ogni critico gira come istanza AI fresca che condivide meno contesto possibile con quella che ha scritto il codice — e perché «chiedi al modello di controllarsi da solo» è peggio che inutile.
Leggi →2026-07-04Cosa mi hanno insegnato mesi passati a misurare confabulazione e allucinazione negli agenti LLM
Cinque lezioni dai benchmark sulla memoria contro l'allucinazione — inclusa la volta in cui il mio stesso metro mi ha mentito di 4×, e l'attacco a falsa memoria che inganna ogni giudice di entailment.
Leggi →2026-07-04La tassa del difensore: un argomento di sicurezza a favore dell'AI aperta
La safety dei modelli di frontiera tassa il difensore molto più dell'attaccante. Una critica strutturale — senza bisogno di complotti — e perché la sicurezza, in particolare, ha bisogno di un'AI capace e aperta.
Leggi →2026-07-04Perché ho costruito Verimem — un memory layer con un notaio alla porta
Esistevano già cinque memory layer diffusi per agenti AI. Ne ho costruito un sesto lo stesso, perché tutti e cinque condividono la stessa assenza: nessuno controlla se una memoria è vera prima di salvarla.
Leggi →