Comportement de recherche inattendu : lorsque 'commands' ne trouve pas '/commands'

MarcP · Juillet 6, 2024, 4:27

Dans ma documentation, j’ai documenté /commands formaté en code avec des backticks. Cependant, si je recherche « commands », aucun résultat n’apparaît. La recherche doit être /commands pour que le sujet apparaisse.

Est-ce un comportement intentionnel ? Je ne m’attends pas à ce que les utilisateurs recherchent une commande spécifique en préfixant le / - les deux devraient trouver le sujet, à mon avis.

Edit ; le formatage du code n’est pas pertinent, car simplement « /commands » aboutit au même problème.

Edit 2 ; je ne peux pas reproduire cela avec, par exemple, « .command », rechercher « command » donne le résultat souhaité dans ce cas.

MarcP · Août 12, 2024, 7:19

Remontée d’espoir.

j.jaffeux · Août 12, 2024, 9:09

Je ne reproduis pas cela lorsque je recherche /commands :

Nous n’avons tout simplement pas trouvé commands, ce que l’on pourrait débattre qu’il devrait trouver, mais ce n’est pas un bug en soi.

MarcP · Août 12, 2024, 9:10

J’ai cherché des paramètres liés à la « recherche », mais je n’ai rien trouvé d’évident. Avez-vous une idée de ce que je devrais chercher ?

j.jaffeux · Août 12, 2024, 9:10

Non, je pense que le comportement est attendu

MarcP · Août 12, 2024, 9:17

C’est exact, je ne m’attends pas à ce que mes utilisateurs sachent à l’avance qu’ils doivent inclure “/” pour le trouver. Y a-t-il une raison pour laquelle ce comportement est attendu ou une solution de contournement possible ? Parce que cela affecte sérieusement la capacité de recherche de ma documentation.

j.jaffeux · Août 12, 2024, 9:30

La recherche est une affaire compliquée Vous voulez que cela apparaisse, mais que se passerait-il si vous aviez d’autres documents différents avec des « commandes » et que vous ne vouliez pas que les documents avec « /commandes » apparaissent dans ce cas ?

Une astuce que vous pouvez utiliser est d’avoir des mots-clés dans votre publication :

<small>Mots-clés : commandes</small>

MarcP · Août 12, 2024, 9:40

Je suis tout à fait d’accord, c’est compliqué ! Bien que /commands soit un exemple, j’ai probablement plus de 100 commandes documentées. Donc, bien que l’utilisation de mots-clés puisse être une alternative, ce n’est pas idéal.

Si le mot est trouvé quelque part, il devrait apparaître dans la recherche, c’est ce que je comprends. Par exemple :

/testcommand > query: testcommand >

betacommand ! > query: betacommand >

!betacommand > query: betacommand >

Qu’est-ce qui rend le / différent du ! ici ?

j.jaffeux · Août 12, 2024, 9:49

Ceci est dû à la façon dont nous indexons les données :

« test /command » → « ‘/command’:11 ‘test’:8A,10 ‘titl’:4A ‘uncategor’:9B »
« test !command » → « ‘command’:11 ‘test’:8A,10 ‘titl’:4A ‘uncategor’:9B »

Notez que nous avons perdu le ! dans le second cas. Nous avons décidé de ne pas conserver le ! ; je soupçonne que le caractère de ponctuation n’est pas considéré comme pertinent dans la recherche.

MarcP · Août 12, 2024, 10:00

Je vois, à mon avis, / ne devrait pas être pertinent non plus ? Je ne suis pas sûr du fonctionnement de l’indexation, mais un paramètre pour changer cela m’aiderait beaucoup.

J’ai remarqué que « somequery » dans une URL renvoie le résultat https://domain.com/somequery-article-today si cette URL se trouve quelque part sur le forum. C’est un comportement attendu - je ne sais pas à quel point ils sont liés, mais j’ai trouvé intéressant que dans ce cas, le / ne soit pas pertinent.

Autre chose que j’ai remarqué après avoir examiné cela un peu plus en profondeur : nous avons une chaîne séparée par des barres obliques : query1/query2.

query1 renvoie un résultat, query2 ne renvoie aucun résultat, diriez-vous que c’est aussi attendu, car cela ressemble plus à un bug si vous me demandez…

MarcP · Octobre 20, 2024, 4:03

Je remonte ce sujet car je pense toujours que cela affecte beaucoup la recherche… quelques-unes des contrariétés que j’ai rencontrées récemment :

Liens Github > ni le nom d’utilisateur ni le nom du dépôt ne sont recherchables..
Liens X > les noms d’utilisateur ne sont pas recherchables

Il y a beaucoup d’autres exemples, si vous ne comptez pas beaucoup sur la recherche, ces choses peuvent passer inaperçues, car cela n’affecte pas vraiment ce que vous voyez dans la recherche, mais ce que vous ne voyez pas. Nous ne sommes pas censés réfléchir constamment à savoir si un sujet a besoin d’un mot-clé pour être trouvable.

Ceci est particulièrement vrai pour les brouillons/sections du personnel, où les publications ne sont tout simplement pas terminées, y restent parfois pendant des années, ou la communication est sous un format plus court/interne. Ce post ne serait pas trouvable pour les mots-clés “personnel” et “interne” si je n’ajoutais pas ceci… parce que Discourse a simplement décidé qu’ils n’étaient pas pertinents ? Pourquoi ?

J’ai du mal à admettre que ce n’est pas un bug, mais plutôt une approche très inhabituelle pour une décision d’index de recherche.

MarcP · Décembre 29, 2024, 10:27

D’après quelques tests que j’ai effectués aujourd’hui, il semble que cela ait été corrigé ? Je ne sais pas si c’est intentionnel, mais merci !

Edit ; oubliez ça… le comportement est toujours le même.

sam · Février 6, 2025, 4:10

Notez que c’est en fait ainsi que fonctionne le stemmer / tokenizer de postgres sql, nous avons mis en place des solutions de contournement pour les cas limites comme les URL où cela peut prêter à confusion, mais dans l’ensemble, nous externalisons une grande partie de ces choses à pg.

Il est intéressant de noter que nous avions une astuce en place il y a quelques années pour “l’indexation supplémentaire dans les URL” que @tgxworld a supprimée en raison de l’encombrement de l’index.

Je suppose que ce que je peux dire, c’est que oui, nous pensons à ce genre de cas limites dans la recherche, mais il faut beaucoup d’efforts pour que nous poussions à contourner le framework existant dans pg fulltext.

MarcP · Février 6, 2025, 8:58

J’apprécie votre réponse Sam !

Je comprends que c’est une pièce technologique complexe, j’espère que vous trouverez un bon contournement - en attendant, je me suis adapté et j’essaie d’utiliser des mots-clés cachés et des moyens créatifs pour contourner cette limitation !

sam · Février 6, 2025, 9:22

Je pense que les mots-clés cachés en tant que premières classes sont intéressants

MarcP · Février 6, 2025, 9:27

Il a été suggéré dans ce sujet, en fait ; Unexpected Search Behavior: When 'commands' Doesn't Find '/commands' - #7 by j.jaffeux

Sujet		Réponses	Vues
Discourse's internal search does not find the phrase «PagedownCustom», but Google does Bug search	5	2220	Juillet 25, 2016
Escaping the "#" character in search Bug	6	1094	Août 3, 2017
Searching results not displaying expected topics Bug	7	2035	Juillet 25, 2016
Search using an acronym as a prefix and other inconsistencies in searches Feature	5	478	Août 14, 2022
Starting search with `/` (slash) puts a `/` in the search box Bug	5	597	Janvier 9, 2019

Comportement de recherche inattendu : lorsque 'commands' ne trouve pas '/commands'

Sujets connexes