Vai al contenuto
§ 04 | JOURNAL
AI Automation Architect specializzato in ecosistemi di automazione per il B2B. Trasformo processi manuali in vantaggi competitivi scalabili con Claude + Python + Google Cloud.
ACCEPTING NEW CLIENTS
Come Funziona la Memoria di Claude (e Come Non Sprecarla)
claude-guide

Come Funziona la Memoria di Claude (e Come Non Sprecarla)

27 aprile 2026|11 min di lettura|Giovanni Liguori

TL;DR

La memoria di Claude su 3 layer: context window, Projects e CLAUDE.md. Come strutturare il contesto per output consistenti.

Aggiornato 27 aprile 2026: dal 21 aprile Anthropic ha rimosso Claude Code dal piano Pro ($20/mese). Il Layer 3 (Claude Code Memory) ora richiede almeno Max 5x ($100/mese). Layer 1 (Chat Memory globale) e Layer 2 (Project Memory) restano disponibili su tutti i piani, incluso Free. — La memoria persistente di Claude è attiva su tutti gli account da inizio marzo 2026. Non è una funzione beta. Non richiede configurazione tecnica. È lì, e probabilmente non la stai sfruttando.

Il rischio non è non usarla. Il rischio è usarla male: salvare tutto, trasformarla in un cassetto disordinato, e ritrovarsi con un assistente che sa troppe cose irrilevanti e dimentica quelle importanti.

In questo articolo: come funziona l'architettura a tre layer, cosa salvare nella memoria globale rispetto a quella di progetto, e un workflow concreto per freelancer e PMI che gestiscono più clienti in parallelo.

L'architettura a tre strati: non tutta la memoria è uguale

Claude non ha una sola memoria. Ne ha tre, con scopi distinti e uno stack preciso su cui appoggiarsi.

Layer 1: Chat Memory globale. Si attiva in tutte le conversazioni, indipendentemente dal progetto. Qui Claude salva preferenze di stile, ruolo professionale, lingua preferita, contesti ricorrenti. Tutto ciò che scrivi nei tuoi messaggi viene analizzato: se menzioni il tuo settore, il tuo stack o come vuoi ricevere le risposte, Claude lo archivia e lo riusa nelle sessioni successive.

Layer 2: Project Memory. Ogni Progetto ha il proprio spazio di memoria isolato. Le istruzioni e il contesto salvati in un progetto non contaminano le conversazioni in altri progetti. Utile quando hai clienti o workflow con requisiti radicalmente diversi tra loro.

Layer 3: Claude Code Memory. Specifico per Claude Code: due sistemi complementari. I file CLAUDE.md contengono istruzioni persistenti scritte da te. L'auto-memory accumula automaticamente apprendimenti tecnici, build commands, pattern di codice e decisioni architetturali senza che tu debba scrivere nulla. Vincolo dal 21 aprile 2026: Claude Code è disponibile solo dal piano Max 5x in su, quindi anche il Layer 3 di memoria è accessibile solo a chi paga almeno $100/mese.

La distinzione tra layer 1 e layer 2 è la chiave che la maggior parte degli utenti manca. Salvare tutto nel layer globale produce un assistente confuso: porta contesto del cliente A nella conversazione con il cliente B, mescola obiettivi di progetto con preferenze personali, genera rumore invece di segnale.

Chat Memory globale: cosa vale davvero la pena salvare

La memoria globale dovrebbe contenere solo ciò che è sempre vero, indipendentemente dal cliente o dal progetto su cui stai lavorando.

Cosa salvare:

  • Ruolo professionale e settore (es. 'AI Growth Architect B2B, lavoro con PMI italiane')
  • Stile di comunicazione preferito (es. 'risposte dirette, dati prima delle opinioni, niente preamboli')
  • Lingua e registro (italiano, tono professionale asciutto)
  • Vincoli tecnici ricorrenti (es. stack: Next.js, Python, n8n, Google Cloud)

Cosa non salvare nella memoria globale:

  • Dettagli specifici di un cliente (vanno nel Project Memory)
  • Obiettivi di un progetto temporaneo
  • Scadenze o task in corso

Regola operativa: se tra sei mesi quella informazione sarà ancora vera, va nella memoria globale. Se no, appartiene al Project Memory o non va salvata affatto.

Dato misurabile: un utente medio spiega il proprio contesto professionale nelle prime 3-5 battute di ogni nuova conversazione. Con una Chat Memory configurata in 5 minuti, si elimina quella frizione su ogni singola sessione futura.

Project Memory: un contesto separato per ogni cliente

Se gestisci più clienti o workflow in parallelo, il Project Memory è l'architettura giusta. Non perché sia la più semplice, ma perché è l'unica che mantiene il contesto isolato e il segnale pulito.

Crea un Progetto Claude per ogni cliente o dominio di lavoro. All'interno di ogni progetto:

  • Configura le istruzioni di progetto come sistema prompt fisso: chi è il cliente, settore, obiettivi attivi, vincoli tecnici specifici
  • Carica i documenti rilevanti nella Knowledge Base: brief, specifiche tecniche, contratti, FAQ, workflow già in produzione
  • Tutte le conversazioni in quel progetto accedono a quel contesto, senza doverlo riscrivere ogni volta

Il vantaggio non è solo la comodità. È la separazione del contesto: quando lavori sul cliente A, Claude non porta con sé nulla del cliente B. Questo elimina un layer di rumore cognitivo che, su sessioni lunghe, produce risposte ibride o fuori target.

Dato concreto: un Project con Knowledge Base ben configurata riduce sensibilmente le risposte fuori contesto rispetto a conversazioni senza struttura di progetto. Anthropic non pubblica metriche ufficiali sul punto, ma il pattern è osservabile in qualsiasi workflow B2B con clienti multipli: il rumore cala, la coerenza delle risposte sale [osservazione su 5 progetti attivi, periodo: 8 settimane].

Un workflow reale: come lo uso con 5 clienti B2B

Nella pratica, la mia architettura di memoria funziona su due livelli distinti.

Chat Memory globale: ruolo, stack tecnico, preferenze di output, lingua. Non cambia mai tra un cliente e l'altro. È il substrato comune su cui si appoggiano tutti i progetti.

5 Progetti separati, uno per cliente. Ogni progetto ha istruzioni personalizzate (chi è il cliente, settore, obiettivi attivi, vincoli tecnici) e una Knowledge Base con documentazione del sistema in costruzione, log delle decisioni architetturali, workflow già in produzione.

Risultato pratico: passo da un cliente all'altro aprendo un progetto diverso. Zero ri-spiegazioni. Zero contaminazione di contesto. Il segnale resta alto, il rumore resta fuori.

Il setup iniziale richiede circa 2 ore: un'ora per scrivere le istruzioni di ogni progetto, un'ora per caricare i documenti rilevanti. Il ROI si misura in tempo risparmiato a ogni sessione, ma soprattutto in qualità delle risposte: un Claude con contesto è un layer di intelligenza operativa, non un assistente generico da riprogrammare ogni volta.

Il collo di bottiglia che nessuno menziona

C'è un problema che emerge dopo 2-3 settimane di uso intenso: la memoria globale si riempie di informazioni obsolete.

Claude salva automaticamente preferenze e contesti mentre conversa. Se hai cambiato stack, cambiato ruolo, o lavorato su un progetto temporaneo, quella memoria sporca si accumula in background senza che tu lo veda. Il risultato è un assistente che ricorda cose non più vere.

La soluzione è una pulizia periodica: ogni 30 giorni, apri Settings > Memory e revisiona cosa è ancora attuale. Cancella tutto ciò che non è più vero. Mantieni la memoria snella, non esaustiva.

Il principio è lo stesso della context window: più informazione irrilevante hai nel contesto, più degrada la qualità delle risposte. Vale per le conversazioni in tempo reale, vale per la memoria persistente.

Un sistema di memoria efficace non è quello con più dati. È quello con il segnale più puro.

Da dove iniziare

La memoria persistente di Claude è uno degli upgrade più sottovalutati del 2026. Non perché sia tecnicamente complessa, ma perché richiede 30 minuti di configurazione intenzionale che la maggior parte degli utenti salta.

Il workflow minimo per cominciare:

  • Apri Claude.ai, vai su Settings > Memory
  • Scrivi 5-7 righe di contesto globale: ruolo, stack, stile di output preferito
  • Crea un Progetto per il tuo cliente o workflow più importante
  • Aggiungi istruzioni e carica 2-3 documenti chiave nella Knowledge Base
  • Usa solo quello per una settimana: misura la differenza in qualità delle risposte

Se vuoi costruire un sistema completo, con Projects strutturati, workflow automatizzati e integrazione con il resto del tuo stack, trovi i dettagli in Claude Mastery.

Il sistema di memoria a 3 layer è parte dell'architettura Claude che ho documentato nella guida completa a Claude AI. Per vedere come queste funzionalità si traducono in automazioni concrete, esplora il case study del mio ecosistema di 21 automazioni Claude.

Memory vs Skills: la confusione che genera errori operativi

Da inizio 2026 Anthropic ha introdotto le Skills, contenitori di competenze specifiche che Claude carica al bisogno. Molti utenti le confondono con la memoria. Sono cose diverse: la memoria è il contesto persistente su chi sei e su cosa stai lavorando, le skill sono moduli di capacità che Claude attiva quando serve (es. lettura PDF, generazione xlsx, design). Confonderle produce architetture sporche: si finisce per scrivere skill come fossero promemoria personali, o si infila in memory globale informazione che dovrebbe essere caricata in una skill condivisa.

Regola pratica: la memoria descrive contesto stabile (chi, cosa, perché). La skill descrive procedure (come). Se ti ritrovi a scrivere step-by-step in memory globale, quello è materiale per una skill o per un Project con istruzioni dedicate, non per la Chat Memory.

Memory e GDPR: cosa puoi salvare quando lavori con clienti europei

Se gestisci progetti per clienti UE, il Project Memory diventa anche un nodo di compliance. Il piano Pro standard di Claude usa i contenuti delle conversazioni per il training dei modelli salvo opt-out esplicito. I piani Team ed Enterprise garantiscono per default che il contenuto non venga usato per training. Per chi tratta dati personali di clienti o utenti finali, questa distinzione è rilevante: salvare nome, email, dati anagrafici di contatti reali nel Project Memory di un piano Pro standard espone a rischi di non conformità GDPR.

Approccio pratico: nei Project Memory salvo contesto di processo (settore del cliente, obiettivi, vincoli tecnici) ma mai dati personali identificabili. I dati sensibili restano nei sistemi del cliente o in storage controllato. Claude vede la struttura, non i dati.

Audit della memoria: cadenza mensile, 10 minuti

Una volta al mese apri Settings > Memory e fai tre passaggi. Primo: leggi la Chat Memory globale come se la vedessi per la prima volta. Se ci sono righe che non rappresentano più il tuo lavoro o il tuo stack, cancellale. Secondo: per ogni Project attivo, verifica che le istruzioni siano ancora coerenti con lo stato del cliente. I clienti cambiano obiettivo, scadenze, requisiti tecnici. Le istruzioni devono seguirli. Terzo: archivia i Project di clienti chiusi spostandoli in una cartella 'archivio' o cancellandoli del tutto. Non lasciarli vuoti come zombie nel sidebar.

Per chi vuole vedere come questa architettura di memoria si traduce in produzione, ho documentato il pattern ibrido (Cowork locale per memoria contestuale + Routines cloud per esecuzione automatizzata) nel case study sull'architettura ibrida con Claude Code Routines. È il framework con cui orchestro 21 automazioni in produzione tra Cowork e cloud.

Condividi

— Newsletter LinkedIn

Ogni settimana condivido workflow, errori e numeri reali

21 automazioni in produzione, zero dipendenti. Su LinkedIn documento il dietro le quinte: cosa funziona, cosa no, e i dati che nessuno mostra.