La maggior parte di quello che leggi sulla Generative Engine Optimization è marketing per vendor che vendono soluzioni inutili. Questa guida prova a fare il contrario: dichiarare apertamente cosa è dimostrato dai dati, cosa non lo è, e cosa l’industria ripete per inerzia anche quando le evidenze dicono il contrario.

Nel 2026 la GEO non è più una nicchia. Gartner ha pubblicato la CMO Spend Survey 2026 e il dato è chiaro: i CMO allocano il 15,3% del budget marketing all’AI, ma solo il 30% delle organizzazioni dichiara di essere pronta a scalare queste capacità. Lo scarto è il terreno operativo della GEO. Chi sa cosa funziona davvero costruisce un vantaggio difendibile prima che il resto del mercato si organizzi.

Questa guida è la sintesi operativa di quello che funziona. Tre principi la attraversano: rigore sulle evidenze, onestà sui limiti, taglio applicativo. Niente liste di buone pratiche prese per buone, niente promesse non verificabili, niente tattiche che richiedono software proprietario per essere implementate.

Definizione di Generative Engine Optimization

La Generative Engine Optimization (GEO) è la disciplina che aumenta la probabilità che un brand venga citato e raccomandato all’interno delle risposte generate da motori AI come ChatGPT, Gemini, Perplexity, Claude e Google AI Overviews. La differenza rispetto alla SEO classica è strutturale, non terminologica.

Il framework è stato formalizzato per la prima volta in GEO: Generative Engine Optimization, un paper presentato a SIGKDD 2024 da ricercatori di Princeton, Georgia Tech, Allen AI e IIT Delhi. Gli autori hanno introdotto GEO-bench, un dataset di diecimila query, e dimostrato che ottimizzazioni mirate sui contenuti possono aumentare la visibilità nelle citazioni AI fino al 40%. Da allora il filone si è ampliato. Il paper GEO: How to Dominate AI Search di Chen et al., pubblicato a settembre 2025, ha mostrato che i sistemi di AI Search favoriscono sistematicamente la earned media rispetto ai contenuti owned dai brand. Un dato che da solo riscrive la strategia di molte aziende.

Per chi vuole partire dalle basi concettuali, abbiamo pubblicato un approfondimento dedicato a cosa è la Generative Engine Optimization e alle differenze tra GEO e SEO tradizionale.

Lo stato del mercato italiano nel 2026

L’Italia non è in ritardo. Secondo i dati Comscore aggregati a ottobre 2025, circa sedici milioni di italiani usano applicazioni AI ogni mese. ChatGPT da solo ne intercetta quasi quindici milioni. Perplexity è cresciuta del 2.351% anno su anno, il dato di crescita più alto registrato dalla categoria nel Paese (Orizzonte Scuola, 2025).

L’Osservatorio Artificial Intelligence del Politecnico di Milano stima che il mercato AI italiano sia cresciuto del 50% nel 2025, raggiungendo 1,8 miliardi di euro. L’84% delle grandi imprese ha già attivato licenze GenAI (Osservatorio Polimi, 2025). Questi numeri rendono evidente perché il mercato italiano abbia bisogno di standard di misurazione propri. Per questa ragione abbiamo lanciato Refinea Analysis, l’osservatorio pubblico dell’AI Visibility Index per industry italiane.

Come funzionano gli AI engine, davvero

Capire cosa ottimizzare richiede prima capire come gli engine costruiscono le risposte. La meccanica è cambiata significativamente tra il 2024 e il 2026.

ChatGPT

ChatGPT Search si appoggia a fornitori di ricerca terzi, tra cui Microsoft Bing, e a contenuti di partner editoriali (documentazione ufficiale OpenAI). Il bot dedicato si chiama OAI-SearchBot e va distinto da GPTBot, che invece raccoglie dati per il training.

Claude

Anthropic ha pubblicato un post di engineering sul sistema multi-agente in cui descrive l’architettura lead agent più subagent, che secondo i benchmark interni Anthropic supera del 90,2% il pattern single-agent. La conseguenza pratica per la GEO è che Claude esegue ricerche più approfondite e meno superficiali rispetto a un’iterazione singola. Contenuti densi e ben strutturati hanno più chance di essere citati.

Perplexity

Perplexity usa il proprio sistema Sonar, integrato con multiple fonti web. Il pattern di citazione è il più trasparente di tutti gli engine perché Perplexity mostra esplicitamente le fonti utilizzate per generare ogni risposta. Questo lo rende anche il banco di prova più rigoroso per validare strategie GEO.

Google AI Overviews

Disponibile in Italia dal marzo 2025 nel rollout EU. Google non ha pubblicato fattori di ranking ufficiali per AI Overviews. Tutte le indicazioni che leggi in giro su “il fattore X conta il Y%” provengono da studi correlazionali di vendor, mai da fonti Google. Vale la regola di sempre: tratta queste affermazioni come ipotesi operative, non come fatti.

Le sette evidenze che cambiano la strategia 2026

Qui entriamo nel terreno operativo. Sette evidenze, ciascuna fondata su dati pubblici, ciascuna con implicazione tattica diretta.

1. La earned media batte la owned media

Il paper di Chen et al. citato sopra ha dimostrato che gli AI Search systems privilegiano sistematicamente la copertura editoriale di terze parti rispetto ai contenuti pubblicati sul sito del brand. La cifra non è marginale: in alcune categorie il rapporto supera i tre a uno a favore della earned media.

L’implicazione operativa cambia il piano editoriale. Investire dieci ore a settimana per scrivere sul proprio blog produce meno citation rate dell’investire le stesse dieci ore per posizionare il brand in pubblicazioni di settore, podcast, ricerche citate da analisti. Non significa che il blog non serva. Significa che il blog è infrastruttura difensiva, mentre l’offensiva si gioca fuori dal proprio dominio.

2. Reddit, Wikipedia e YouTube dominano le citazioni

L’analisi di Similarweb sulle citazioni ChatGPT negli Stati Uniti ha trovato che Wikipedia (13,15%) e Reddit (11,97%) insieme generano oltre il 25% di tutte le citazioni. Pubblicazioni considerate ai vertici dell’editoria tradizionale come Wall Street Journal, New York Times e Bloomberg non compaiono nella top 20.

Su Perplexity la concentrazione è ancora più estrema: Reddit copre il 46,7% delle top-10 fonti citate secondo l’analisi di Profound. I dati di Search Engine Land confermano che Reddit, YouTube e LinkedIn sono le tre fonti più citate aggregate sui principali AI engine.

La conseguenza è semplice e scomoda per molti brand B2B. Una strategia GEO che ignora la presenza su Reddit, su YouTube e su Wikipedia parte già perdente. Non è opzionale, è il terreno principale dove si gioca la partita.

3. La schema.org non sposta le citazioni AI

Questa è l’evidenza più contrarian del 2026. Ahrefs ha pubblicato a maggio 2026 uno studio rigoroso su 1.885 pagine con un gruppo di controllo di 4.000, misurando le citazioni AI prima e dopo l’aggiunta di schema markup. Il risultato è stato nullo. Anzi, su Google AI Overviews lo studio ha registrato un calo del 4,6% nelle citazioni delle pagine con schema rispetto al periodo precedente. Una nota: lo studio analizzava pagine già fortemente citate, quindi il risultato vale soprattutto per chi ha già visibilità AI consolidata.

L’industria della GEO ha venduto schema markup come prima leva di ottimizzazione per due anni. I dati dicono che non sposta l’ago. Search Engine Land ha sintetizzato il risultato con il titolo “no hype”. Continuiamo comunque a raccomandare schema per il vantaggio sui rich result tradizionali di Google, ma non lo presentiamo più come leva GEO.

4. llms.txt è marketing per vendor

Sull’onda dell’enthusiasm 2024, l’industria ha annunciato che llms.txt sarebbe diventato lo standard per indicare ai crawler AI quali contenuti privilegiare. Due anni dopo, i dati raccolti dimostrano il contrario. Uno studio recente su 500 milioni di visite di bot AI in 90 giorni ha trovato solo 408 fetch reali del file llms.txt. Praticamente zero.

L’adozione tra i domini si è fermata intorno al 10%. La nostra raccomandazione operativa è: pubblicalo perché costa zero e serve come polizza di insurance, ma non includerlo nei deliverable della strategia GEO con qualcuno che ti paga.

5. La struttura passage-level conta più della lunghezza totale

Discovered Labs ha analizzato due milioni di citazioni AI su diecimila pagine e ha trovato pattern strutturali ricorrenti nei passaggi citati. Studi correlati su Google AI Overviews (Wellows, 2026) indicano che i passaggi citati tendono ad avere lunghezza media tra 134 e 167 parole e a rispondere in modo autosufficiente a una domanda. Un articolo da 3.000 parole strutturato come monolite produce meno citazioni di un articolo da 1.500 parole strutturato come dieci unità da 150 parole ciascuna, ciascuna risposta a una sotto-domanda.

La conseguenza è il pattern BLUF: il primo paragrafo deve rispondere alla domanda principale dell’articolo in modo autosufficiente. Tutto quello che segue è espansione, non premessa.

6. La recency è un fattore reale

Seer Interactive ha studiato i pattern di crawl AI trovando che il 65% degli hit dei bot AI cade su contenuti pubblicati nell’ultimo anno e il 79% su contenuti degli ultimi due anni. Lo studio è single-source e va trattato con cautela metodologica, ma il pattern è coerente con quello che osserviamo nei dati Refinea.

L’implicazione operativa non è “pubblicare di più”. È “tenere fresco quello che già hai”. Aggiornare un articolo evergreen sostanziale ogni sei mesi produce più valore GEO che scrivere due articoli nuovi nello stesso tempo.

7. La consistenza cross-source supera la citation singola

McKinsey ha pubblicato a fine 2025 un report che stima 750 miliardi di dollari di spesa B2B incanalata attraverso AI search entro il 2028. Nel report McKinsey osserva che i contenuti brand-owned rappresentano solo il 5-10% delle fonti usate dagli AI engine per generare risposte. Il restante 90-95% è composto da terze parti.

La conseguenza strategica è che la GEO non è ottimizzazione di una singola asset. È coordinamento della narrativa del brand attraverso decine di fonti esterne che gli AI engine consultano in parallelo. Brand che dicono cose diverse su Wikipedia, su Reddit e sul proprio sito producono retrieval inconsistente. La coerenza narrativa cross-source è una delle leve operative più sottovalutate del 2026.

Il framework operativo Refinea

Sulla base delle sette evidenze sopra, abbiamo costruito un framework operativo in quattro fasi. È quello che applichiamo internamente e quello su cui poggia il prodotto.

Fase 1: misurazione baseline

Prima di ottimizzare bisogna sapere da dove si parte. La misurazione baseline include tre componenti.

L’AI Visibility Index del brand sui prompt che riflettono la categoria commerciale di interesse. La distribuzione delle citation source che gli engine usano quando parlano del brand. Lo scarto tra la narrativa che il brand pubblica sul proprio sito e quella che emerge dalle risposte AI. La piattaforma Refinea automatizza queste tre rilevazioni, ma il principio vale anche per chi misura manualmente.

Fase 2: prompt intelligence

Una strategia GEO basata su prompt inventati è una strategia che ottimizza per scenari ipotetici. La maggior parte dei tool sul mercato funziona così. Il problema è che gli AI engine vengono interrogati da utenti reali con linguaggio reale, non con prompt costruiti a tavolino. La misurazione su prompt inventati produce dati che sembrano azionabili e che invece non descrivono il comportamento del mercato.

Il pattern corretto è partire dalle query reali. Refinea estrae la domanda di ricerca aggregata da provider premium, applica clustering semantico, simula gli intent corrispondenti e valida l’output su un database di oltre un milione di prompt reali. La piattaforma poi incrocia questi prompt con i dati di Google Search Console del cliente per pesare l’importanza relativa di ogni cluster sulla base del traffico reale che il brand già attrae.

Fase 3: ottimizzazione cross-source

L’ottimizzazione opera su tre piani paralleli.

Sul piano editoriale si lavora su contenuti owned per la copertura difensiva. Pattern BLUF, struttura passage-level, aggiornamento ricorrente, alt text sulle immagini, internal linking semantico. Non spostano la citation da soli ma sono prerequisito per non perderla.

Sul piano earned media si coordina presenza in pubblicazioni di settore, podcast, ricerche di analisti, recensioni su comparator G2 o Capterra. È qui che si gioca il grosso del citation gain. Refinea fornisce ai clienti la mappa delle pubblicazioni più citate dagli AI engine nella loro categoria, riducendo il tempo speso a indovinare dove investire.

Sul piano entity graph si costruisce e mantiene presenza coerente su Wikipedia, Reddit, YouTube, LinkedIn e altre fonti ad alta citation density. Questo non significa fare spam: significa essere presenti dove gli AI engine cercano e dare loro materiale di qualità.

Fase 4: Brand Memory

Brand Memory è il modulo Refinea che cataloga i fatti unici dell’azienda cliente sotto forma di Proof Points, Expert Voices e Facts. Serve a due cose. La prima è permettere la generazione di contenuti AI-optimized che rispettano il protocollo EEAT (Experience, Expertise, Authoritativeness, Trustworthiness) di Google, perché ogni claim prodotto è sostanziato da una fonte primaria interna verificabile. La seconda è garantire la coerenza narrativa cross-source di cui parlavamo al punto 7: avere un’unica fonte di verità interna riduce il rischio che il brand dica cose diverse su canali diversi.

Cosa non fare nel 2026

Tre errori sono ancora frequenti e meritano di essere chiamati per nome.

Ottimizzare il sito per ChatGPT direttamente. ChatGPT non crawla in real time durante una conversazione. Usa il proprio indice cui contribuiscono OAI-SearchBot e fonti terze. Ottimizzare il sito è utile, ma il vero terreno di gioco è quello che ChatGPT incontra nelle fonti che cita.

Acquistare visibilità su listing di vendor poco autorevoli. Listing su directory di basso livello producono backlink che non spostano l’AVI. Gli AI engine ignorano queste fonti nel retrieval. Soldi sprecati.

Misurare AI visibility con singoli prompt. Una singola interrogazione di ChatGPT non è una misurazione, è un’aneddoto. Servono campioni multipli, prompt curati, run ripetute. La sezione metodologia di Refinea Analysis descrive il protocollo standard.

Cosa fare la settimana prossima

Per chi vuole tradurre questa guida in azione immediata, tre passi misurabili nei prossimi sette giorni.

Lunedì: identificare i venti prompt commerciali più probabili che un cliente reale userebbe per cercare la tua categoria. Non i prompt che vorresti tu, quelli che userebbe l’utente. Se hai accesso a Google Search Console, parti dalle query con il volume più alto.

Mercoledì: sottoporre quei venti prompt a ChatGPT, Perplexity, Gemini, Claude e Google AI Overviews. Annotare quante volte il brand viene citato, quali competitor vengono citati al suo posto, quali fonti gli engine usano.

Venerdì: la lista delle fonti che gli engine citano è il tuo piano editoriale del trimestre successivo. Sapere quali pubblicazioni, quali subreddit, quali pagine Wikipedia influenzano davvero le risposte sulla tua categoria vale più di qualsiasi tool.

Se questo esercizio richiede troppo tempo o vuoi farlo a scala, Refinea automatizza ognuno di questi passaggi. Ma il valore non è nel tool, è nel framework. Il framework funziona anche manualmente per chi ha pazienza.

Generative Engine Optimization: la guida operativa per il 2026