Según las actuales leyes del RGPD, incluir texto citado en las descargas de actividad de los usuarios podría ser un problema para algunas personas. Especialmente si ese texto citado contiene información personal identificable (PIA) de otra persona.
La PIA de otras personas podría estar (y probablemente está) incluida en el texto citado, especialmente porque las etiquetas de cita hacen referencia al autor original. Además, el texto citado podría provenir de foros privados donde los usuarios tenían la expectativa de cierta privacidad sobre lo que publicaron.
No creo que actualmente sea posible implementar algo como la opción de eliminar el texto citado de dichas descargas, pero me gustaría sugerirlo por si alguien tiene la capacidad y el interés de crearlo. Personalmente, me gustaría ver esto integrado en el núcleo del sistema, aunque entiendo que no todos considerarán esto crítico.
¿O el problema radica en preservar la potencia de cálculo adicional necesaria para hacerlo? Aun así, ¿qué tal la opción (a un costo de almacenamiento, obviamente) de añadir una columna “limpia” a las columnas “raw” y “cooked” que ya existen? Si existieran datos en la columna limpia para una publicación en particular, esa sería la versión que se descargaría cuando se active la opción “No incluir texto citado” en las solicitudes de descarga de archivo de usuario; si no, se llamaría a la versión normal.
Y, por supuesto, al recortar el texto citado se perdería el contexto de la publicación, pero alguien que descarga exclusivamente sus propias publicaciones desde el principio ya sabe que se perderá el contexto.
Sostengo que la pérdida de contexto por parte de los usuarios en sus propias publicaciones archivadas es menos prioritaria que facilitar el almacenamiento de registros que probablemente incluyan la PIA de otras personas.