用户存档下载中提供擦除引用文本的选项

根据现行的 GDPR 法规,在用户活动下载中包含引用文本可能会对某些人造成问题。特别是当这些引用文本包含其他个人的个人身份信息(PIA)时。

他人的 PIA 可能(且很可能)被包含在引用文本中,尤其是因为引用标签会指向原始发帖人。此外,引用文本也可能来自私密论坛,用户在这些论坛发帖时曾期望其内容具有一定的隐私性。

我认为目前可能无法实现“在导出时清除引用文本”这样的选项,但我仍提出此建议,以防有人具备相关能力和兴趣去开发它。我个人希望将其作为核心功能,但也理解并非所有人都认为这至关重要。

或者问题在于需要额外的计算资源来执行此操作?即便如此,是否可以考虑(当然会增加存储成本)在现有的原始内容和已渲染内容列之外,增加一个“已清理”列?如果某条帖子在“已清理”列中存在数据,那么当启用用户归档下载请求中的“不包含引用文本”选项时,将下载该数据;否则则下载正常版本。

当然,在修剪引用文本时,帖子的上下文将会丢失。但那些从一开始就仅下载自己帖子的用户,本就清楚上下文会丢失。

我坚持认为,相比于让用户轻松存储可能包含他人个人身份信息(PIA)的记录,用户在自己的归档帖子中丢失上下文是次要的。

1 个赞

这一点

与此无关。人们可能会有顾虑,但这与法律无关。

GDPR 与合理使用毫无关系。在互联网上对以讨论为目的的社区进行评论需要引用。包含摘录(如引文)的回复被视为转换性作品。此处不存在与 GDPR 相关的问题。

2 个赞