De acordo com as atuais leis do GDPR, incluir texto citado em downloads de atividades de usuários pode ser um problema para algumas pessoas. Especialmente se esse texto citado contiver Dados Pessoais Identificáveis (PIA) de outra pessoa.
O PIA de outras pessoas pode ser (e provavelmente é) incluído em textos citados, especialmente porque as tags de citação referenciam o autor original. O texto citado também pode ser extraído de fóruns privados, onde os usuários tinham a expectativa de certo nível de privacidade sobre o que postaram.
Não acho que algo como a opção de remover texto citado desses downloads seja possível atualmente, mas gostaria de sugerir isso caso alguém tenha a capacidade e o interesse de criá-lo. Pessoalmente, gostaria de ver isso no núcleo do sistema, mas entendo que nem todos acharão isso crítico.
Ou é uma questão de preservar o poder de computação adicional necessário para fazer isso? Mesmo assim, e quanto à opção (com um custo adicional de armazenamento, obviamente) de adicionar uma coluna limpa às colunas “raw” e “cooked” já existentes? Se houvesse dados na coluna limpa para uma determinada postagem, seria isso que seria baixado quando a opção “Não incluir texto citado” nas solicitações de download de arquivo do usuário estiver ativada; caso contrário, a versão normal seria chamada.
E, claro, ao podar o texto citado, o contexto da postagem seria perdido, mas alguém que está baixando exclusivamente apenas suas próprias postagens já está ciente de que o contexto será perdido.
Mantenho que a perda de contexto pelos usuários em suas próprias postagens arquivadas é menos prioritária do que facilitar o armazenamento de registros que provavelmente incluem PIA de outras pessoas.