Secondo le attuali normative GDPR, includere testo citato nei download delle attività degli utenti potrebbe rappresentare un problema per alcune persone. In particolare, se il testo citato contiene dati personali sensibili (PIA) di un altro individuo.
I dati personali sensibili di altre persone potrebbero essere (e probabilmente sono) inclusi nel testo citato, specialmente poiché i tag di citazione fanno riferimento all’autore originale. Inoltre, il testo citato potrebbe provenire da forum privati in cui gli utenti si aspettavano un certo livello di riservatezza riguardo ai loro post.
Non credo che sia attualmente possibile implementare un’opzione per rimuovere il testo citato da tali download, ma vorrei suggerirlo nel caso in cui qualcuno abbia la capacità e l’interesse di realizzarlo. Personalmente, vorrei vederlo integrato nel core, ma capisco che non tutti lo considerino essenziale.
Oppure il problema riguarda la necessità di conservare ulteriore potenza di calcolo per farlo? Anche in tal caso, che ne dite dell’opzione (con un costo aggiuntivo in termini di archiviazione, ovviamente) di aggiungere una colonna “pulita” alle colonne raw e cooked già esistenti? Se esistessero dati nella colonna pulita per un determinato post, quello sarebbe ciò che verrebbe scaricato quando l’opzione “Non includere testo citato” nelle richieste di download dell’archivio utente è abilitata; in caso contrario, verrebbe utilizzata la versione normale.
E, naturalmente, eliminando il testo citato si perderebbe il contesto del post, ma chi scarica esclusivamente i propri post è già consapevole che il contesto andrà perso.
Ritengo che la perdita di contesto nei propri post archiviati da parte degli utenti sia meno prioritaria rispetto alla facilità di conservare registri che probabilmente includono dati personali sensibili di altre persone.