Forum che vietano i contenuti generati dall'IA… Come sta andando?

one1 · 19 Giugno 2026, 3:00am

Mi piacerebbe conoscere le esperienze dei gestori di forum che non consentono contenuti generati da AI/LLM. Come avete fatto a comunicare questa policy agli utenti? Come rilevate questi contenuti? Come vi comportate con gli utenti che li pubblicano comunque?

Accogliamo con favore qualsiasi contributo.

Nota: personalmente, mi interessa solo l’aspetto umano delle interazioni front-end sul sito. Presumo che bloccare i crawler sia una battaglia persa.

Il nostro forum è dedicato a discussioni di natura spirituale e religiosa. Bandiamo qualsiasi contenuto generato da IA.

darkpixlz · 19 Giugno 2026, 4:43am

La maggior parte, se non tutta, del testo generato dall’IA può essere facilmente rilevata semplicemente leggendolo. La tecnologia SynthID di Google è interessante per il rilevamento di immagini generate dall’IA e sostiene di essere in grado di rilevare anche il testo, probabilmente scritto solo da Gemini, ma anche OpenAI supporta lo standard. Essere in grado di rilevare personalmente il testo è probabilmente una competenza acquisita, ma apprezzo il lavoro svolto per rispondere alla crisi attuale che abbiamo riguardo alla mancata capacità di rilevare immagini o testo generati dall’IA.

Il silenziamento o le sospensioni sono ancora, secondo me, la strada giusta da seguire, soprattutto se l’account è nuovo. Se un nuovo account a caso si iscrive al tuo sito e pubblica immediatamente un argomento generato dall’IA, non vedo motivo per cui non dovresti semplicemente sospendere l’account e bloccarlo.

Per quanto riguarda il dilemma dello scraping: il mio sito è attualmente utilizzato per la comunicazione interna e la documentazione all’interno di una piccola azienda e ho intenzione di usarlo come backend per il blogging in futuro. Non è stato difficile configurare un honeypot per scoraggiare i crawler che scelgono di ignorare i file robots.txt sui miei domini.

Solo questa tattica ha portato a circa 6 MILIONI di richieste nell’arco di due settimane (circa 6 richieste al secondo verso il dominio):

Ogni volta che un crawler dell’IA visita detto sito, viene guidato in un labirinto infinito di spam utilizzando il progetto iocaine self-hosted con un dataset di circa 7000 parole inventate, alcuni HTML spazzatura, parole casuali e notizie false generate da Llama 8B.

Ovviamente questa è una tattica nucleare di “vai via” e non è adatta a tutti, ma è stata ottima per me nel mio obiettivo di impedire che i LLM rubino il mio codice o i miei contenuti testuali. Ricordo di aver letto uno studio di caso condotto da Anthropic sull’avvelenamento dei LLM, ma non riesco più a trovare l’articolo, quindi non lo allego qui, ma sicuramente in qualche momento dovranno bloccare il mio dominio quando si renderanno conto che il bot ha inviato circa 5 milioni di richieste al mio dominio di recente.

Ed_S · 19 Giugno 2026, 8:24am

(Noto che stiamo mettendo da parte la questione del carico sui crawler, dei crawler che prelevano contenuti per l’addestramento e delle conseguenze sociali ed economiche degli attuali rapidi sviluppi. Questo è un bene.)

Per quanto mi riguarda, in un sito hobby a basso traffico,

stiamo cercando di concordare e formulare una politica scritta
gestiamo le cose man mano che si presentano
gli esempi più eclatanti sono essenzialmente spam, quindi li eliminiamo e banniamo
altrimenti, contestiamo, forse pubblicamente e forse privatamente, e potremmo eliminare i post

Una forma suggerita di guida potrebbe assomigliare a questa:

Possedere" i contenuti dei messaggi che pubblichi (cioè leggere e comprendere, e non copiare e incollare acriticamente contenuti, indipendentemente dalla loro origine).
Cercare di rispondere da solo alle tue domande nel miglior modo possibile prima di aprire nuove discussioni (ad esempio cercando nel forum).
Comunicare i dettagli in modo conciso in modo che altri utenti possano leggere e comprendere per aiutare, cioè evitare lunghi muri di testo ripetitivo o irrilevante, o affermazioni troppo generiche senza informazioni sufficienti.
Mantenere le discussioni pertinenti all’argomento, evitare discussioni meta (in particolare sull’uso dell’IA - che si tratti di “migliori pratiche” o “etiche ad esse connesse”).
Mantenere i conversazioni rispettose e ricordare che abbiamo utenti con background, visioni e opinioni diversi.
Divertiti! Questo dovrebbe essere un hobby.

(Nel nostro ambiente hobby, c’è un’ulteriore angolazione, che è l’uso di LLM all’interno dell’hobby, che copre uno spettro di possibilità e ha sia i suoi entusiasti che i suoi detrattori.)

robbie.morrison · 26 Giugno 2026, 9:18am

Questo esempio non riguarda Discourse, ma le questioni di policy e governance si sovrapporrebbero certamente.

Sia la versione inglese che quella tedesca di Wikipedia hanno ora ciò che io definirei politiche estreme di purezza dall’IA. Come editore con 16 anni di esperienza, sono stato ingiustamente accusato di aver aggiunto contenuti generati dall’IA a un articolo che ho scritto prevalentemente io. E il processo per cercare un rimedio è stato logorante. Ciò include la presentazione di reclami formali al comitato ArbCom di Wikipedia EN e al team Trust and Safety della Wikimedia Foundation (WMF TST) – finora respinti sommariamente o rifiutati senza motivazione, rispettivamente.

Non voglio raccontare qui le mie esperienze, anche perché sono in corso. Tuttavia, incoraggerei i lettori qui a leggere questo straordinario scambio riguardante l’articolo di Wikipedia EN su Fern Cave, un sito di significato culturale per il popolo Modoc della California:

https://en.wikipedia.org/wiki/User_talk:Gurkubondinn/Archives/2026#No_LLM_Mark_on_fern_caves.

L’autore in questione ha dovuto negare di aver utilizzato l’IA quattro volte. Le sue conoscenze indigene sono state anch’esse sminuite nel processo. L’editore che applica le regole conclude con un commento che assomiglia a una preoccupazione, ma che può essere letto altrettanto bene come una minaccia velata di sanzione se non si cede.

Tattiche psicologiche come queste vengono regolarmente impiegate dagli editori che applicano le regole e ho prove di altri esempi.

Se osservate il markup sorgente in quello stesso scambio, troverete una trappola honeypot con font-size: 0pt impostata per tentare di rilevare l’uso dell’IA da parte dell’autore accusato durante la formulazione delle risposte. Questa trappola non è scattata.

Ci sono resoconti credibili di diversi editori che hanno abbandonato Wikipedia DE dopo essere stati «ingiustamente attaccati» per il loro presunto uso di strumenti di IA.

Per rispondere alla domanda originale posta in questo argomento, sostengo che Wikipedia EN e DE stiano fallendo gravemente nella loro governance in molteplici modi nei loro tentativi di gestire i contenuti generati dall’IA. Ho documentato tre studi di caso nel mio recente rapporto di 17 pagine inviato al team WMF TST. Potrei rendere pubblico quel PDF in futuro?

robbie.morrison · 26 Giugno 2026, 9:33am

Sono fermamente in disaccordo, alla luce delle mie esperienze su Wikipedia EN (dettagliate altrove su questo argomento). Suggerisco che questo approccio sia per lo più pseudoscienza mescolata a hybris. Ancora più significativo, tale rilevamento non può essere confutato — e infatti gli editori responsabili di Wikipedia, spesso lavorando di concerto, si aggrappano semplicemente alle loro posizioni di fronte alle sfide.

L’editore accusato si trova con un onere della prova invertito e con accuse che semplicemente non sono falsificabili — anche alla luce delle prove più convincenti del contrario. La giustizia naturale svanisce. Non è il tipo di governance comunitaria che di solito funziona.

Lo so. Sono stato soggetto a questo processo in prima persona. È brutto. Deve esserci un modo migliore.

RGJ · 26 Giugno 2026, 9:39am

Lettura interessante, soprattutto il secondo articolo mi ha aperto gli occhi quando l’ho letto per la prima volta. Credo che questo si applichi in parte anche a te, @robbie.morrison. Alcune persone “scrivono semplicemente così”.

E sono giunto a questa tesi: non scrivo come ChatGPT. ChatGPT, nel suo strano modo smaterializzato e basato su fonti globali, scrive come me. O, più precisamente, scrive come milioni di noi che sono stati inseriti in un percorso educativo e sociale molto particolare, un percorso progettato deliberatamente per levigare via l’ambiguità e forgiare i nostri pensieri in una forma molto specifica, molto formale e molto impressionante.

one1 · 26 Giugno 2026, 9:52am

Sì, il pregiudizio contro i non madrelingua inglesi è una delle mie maggiori preoccupazioni.

Anche se non si tratta della community Discourse, questa è una lettura interessante: Rules Roundtable XXI.V: Plagiarism, Integrity, and Generative AI. Proviene dal subreddit AskHistorians. Per chi non lo conoscesse, si tratta probabilmente di una delle community più severamente moderate su Reddit. Fondamentalmente, permettono solo risposte di livello accademico alle domande.

robbie.morrison · 26 Giugno 2026, 10:09am

Il subreddit AskHistorians mantiene ancora un pregiudizio del tipo “sparare per primo”, seguito da un’onere della prova inverso per l’accusato (ma certamente con più garanzie processuali rispetto a Wikipedia/Wikimedia):

Se non dichiari di aver utilizzato l’IA per generare una risposta e sospettiamo che tu possa starla usando in modo violativo delle regole, riceverai un ban. Tuttavia, a tutti coloro che sono stati bannati per uso di IA viene spiegato come presentare un ricorso. Può sembrare severo, ma una parte della nostra giustificazione è portare le persone alla modmail così da poter avere una discussione ed evitare un’esposizione pubblica che può portare a un attacco coordinato.

Forse questa è l’unica strategia praticabile al momento? Ma di certo non è giustizia naturale.

one1 · 26 Giugno 2026, 1:56pm

Sì, immagino che quel subreddit non abbia nulla a che fare con la «comunità». Sono spietati su ciò che accettano, che sia IA o meno.

Ma accusare qualcuno di usare l’IA è pieno di insidie.

chapoi · 26 Giugno 2026, 3:02pm

L’ho usato da sempre, e ora non posso più perché la gente penserà che sia AI. RIP trattino lungo.

one1 · 26 Giugno 2026, 3:47pm

Sì, chiunque sfrutti Markdown e scriva un post ben redatto potrebbe essere sospetto.

awesomerobot · 26 Giugno 2026, 4:39pm

stesso! Mi sono scervellato sull’uso dell’emoji emdash per anni, prima che l’AI arrivasse e se lo rubasse

Canapin · 26 Giugno 2026, 4:41pm

Commetto troppi errori per essere scambiato erroneamente per un’intelligenza artificiale

Stranamente, ho notato di essere più incline di prima a non correggere volontariamente i piccoli errori che rilevo nei miei post (anche in francese, la mia lingua madre). Ho la sensazione che lasciare quelle imperfezioni renda ciò che scrivo più autentico e con più personalità. Le persone potrebbero potenzialmente riconoscere un messaggio come mio proprio a causa di quegli errori o di frasi scritte in modo strano. Inoltre, è meno stancante dal punto di vista mentale non cercare di rendere perfetto tutto ciò che scrivo (qualunque cosa significhi “perfetto”).

stephtara · 11 Luglio 2026, 6:01am

La mia comunità non è ancora molto attiva, ma tengo molto a non permettere alle persone di pubblicare contenuti generati da LLM. Per il momento, non ho problemi con i crawler e vorrei che avessimo un bot LLM o messaggi di sistema LLM, ma non voglio che i membri pubbichino il loro scarto di ChatGPT (abbiamo una grande quantità di documentazione curata a mano che vogliamo le persone utilizzino).

Sarà nelle regole e la « modereremo » quando la vedremo, ma sono interessato al segnalazione automatica e ad altre strategie.

FWIW è una comunità francofona.

eisammy · 11 Luglio 2026, 1:44pm

In linea di massima, preferisco pochi argomenti e post molto più interessanti nel feed globale; anche per il SEO questo è importante, poiché l’indicizzazione di contenuti generati dall’IA viene solitamente penalizzata dai motori di ricerca tradizionali.

Comunque, dato che Discourse ha generalmente natura pubblica, se accedo a un’altra istanza in cui il suo contenuto è prevalente o mescolato con scempiaggini dell’IA, me ne vado naturalmente.

Jagster · 11 Luglio 2026, 1:59pm

Tipo… qui

eisammy · 11 Luglio 2026, 2:06pm

Qual è esattamente il tuo punto? C’è una grande differenza tra l’uso come strumento, come il traduttore automatico di lingue e contenuti tematici, come è il caso della mia istanza, e tra altre cose. Forse sei stato troppo letterale nella lettura del mio commento, no? È una domanda genuina.

Jagster · 11 Luglio 2026, 2:10pm

Il mio punto è che non sei così categorico come dici di essere. Accetti contenuti generati dall’IA, poiché qui ne trovi. Nella maggior parte dei casi nella sezione codice, ma le categorie di ask.discourse.org non sono certo un’eccezione.

Quindi chiedo coerenza

eisammy · 11 Luglio 2026, 2:13pm

Certo, nulla nella vita è assoluto, ma come hai giustamente detto, se il contenuto di un’istanza è composto in modo prevalentemente o misto da contenuti generati dall’IA, naturalmente lo rifiuterò. Di nuovo, sembra che tu abbia l’abitudine di usare la letteralità nelle discussioni, vero? Invece di essere ironico, cerca di essere più chiaro la prossima volta.

merefield · 11 Luglio 2026, 7:06pm

Non sono così sicuro che sia così facile rilevare i contenuti generati dall’IA quando si utilizzano prompt accurati per eliminare i marcatori e i modelli evidenti.

È più probabile che l’intero sito venga segnalato come “creato da bot” tramite un’ispezione manuale.

I motori di ricerca sono pessimi nel coglierlo.

Ecco un caso emblematico:

OpenAI Releases GPT-5.6 Soul, Terra and Luna Models - Geeky Gadgets.

Questo è apparso tra i primi 5 risultati di ricerca, ma l’errore di battitura di “Sol” lo rivela come contenuto di scarsa qualità.

Non è stato nemmeno revisionato dai proprietari di quel sito. Nessun essere umano commetterebbe quell’errore.

Argomento		Risposte	Visualizzazioni
Block Google's "Help Me Write" Feature	19	2430	Aprile 8, 2024
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	1310	Maggio 26, 2025
Are you experiencing AI based spam? Community Building ai	22	2325	Gennaio 19, 2025
What is stopping you from trying out Discourse AI? Community Building ai	35	2151	Agosto 23, 2025
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	5204	Luglio 16, 2023

Forum che vietano i contenuti generati dall'IA… Come sta andando?

Argomenti correlati