能否为主题添加隐藏的元数据,例如单词同义词,以便更容易找到它们?

将同一个想法用不同的方式表达有很多种方法。有没有一种方法,我可以添加与帖子相关的同义词,以便那些寻找相同内容但没用我的确切措辞的人更容易找到,同时又不会用可见的词语把帖子弄乱,也不需要添加全局标签?

例如,我曾在 Sublime Text 论坛上询问 Sublime Text 中上下文感知的自动补全是如何工作的。然而,我注意到有些人将其拼写为“auto complete”,而另一些人则拼写为“autocomplete”。包含“auto complete”的帖子不会被搜索“autocomplete”的人找到。此外,许多人使用“smart”一词来代替“context-aware”。有没有一种方法可以将这些其他相关词汇添加到我的帖子中,而又不让它们直接可见?我发现了一个回复,似乎暗示这是不可能的:

我觉得在帖子底部添加一个词列表(如下所示,仅作演示)并不是一个好的解决方案。

-----begin tags-----
search, tags, metadata, meta data, seo
-----end tags-----

2 个赞

……这更像是搜索中的词干提取问题。搜索存在拼写变异的单词;搜索复数形式并匹配单数形式……

如果能有一个针对特定站点的搜索同义词管理后台界面就太好了。这样对普通用户来说就完全无感(It Just Works™)。

3 个赞

我同意。我认为在高级搜索页面添加“包含小词变体”选项会很有帮助。不过,如果在搜索时为每个帖子包含每个单词的所有同义词,可能会给结果带来大量干扰,因此我仍然觉得让用户为特定帖子自定义关键词会更好。这或许可以通过插件来实现。

1 个赞

这正是标签的用途所在,而且标签支持同义词。

你也可以对拼写错误提出同样的观点——即搜索“guidence”应该能匹配到“guidance”。 不过,要实现这一点需要非常高级的搜索引擎技术。目前,我们依赖的是 Postgres 数据库引擎内置的搜索功能。

实际上,我认为最好的解决方案是人工整理——由工作人员或 TL4 用户编辑,将所有必要的术语添加进去,以便在帖子的正文或标题中生成良好的搜索结果。这也是为什么 TL2 用户可以编辑所有帖子的标题和类别的原因——因为标题、类别(以及标签)对于准确匹配至关重要,所以我们尽可能将这项职责分享给更多值得信赖的社区成员!

此外,存在多个涵盖相同结果的帖子也是完全可以接受的,因为人类拥有一种非凡的先天能力,可以用……_完全_不同的词汇来描述同一个话题,彼此之间几乎没有任何共同点。我几年前曾写过一篇文章探讨这一点:

其核心要点是:

我们希望的是大约有 4 到 5 个相似但不完全相同的重复帖子,以覆盖所有可能的搜索词和问题表述的常见变体。这些重复帖子拥有各自的答案也是可以的,这样找到它们的人就不必再次点击才能获取到优质的答案。

3 个赞

嗯,是的,这确实是一个非常棒的观点,而且很有见地。谢谢 :slight_smile:

2 个赞