Discourse a besoin d'une meilleure recherche

Une approche possible @Falco pourrait être une approche inversée de ce que fait notre approche actuelle.

Pour chaque sujet, essayez d’extraire/créer une vingtaine de mots-clés et superposez-les aux mots-clés existants.

Je me demande si cela aide.

3 « J'aime »

Notre recherche de pertinence ne prend pas en compte les vues ou le pagerank. Et pour ajouter de la complexité, les vues sur toute la durée peuvent être très élevées, faussant les résultats, nous aurions donc probablement besoin des vues par an ou quelque chose de similaire pour corriger cela.

Mais… avec le pagerank / la prise en compte du nombre de vues / des likes, il est possible que nous puissions proposer un algorithme de pertinence bien meilleur.

Ce sont des choses complexes, une entreprise de plusieurs billions de dollars a été construite sur ces idées et une autre entreprise de plusieurs billions de dollars n’a aucun moyen facile de rattraper son retard.

10 « J'aime »

Voilà, j’ai corrigé… au #1 maintenant.

J’ai discuté de ce problème avec @tgxworld et @JammyDodger par le passé, nous avons préparé un très mauvais gâteau ici.

La solution de contournement simple est de parcourir chaque sujet de Plugin et d’ajouter « Plugin » à la fin.

Plugin publicitaire Discourse
Plugin de discussion Discourse
Et ainsi de suite…

Le titre correspond à « gagner », donc par exemple

  • Publicité dans la catégorie Plugin perdra face à Question sur le plugin publicitaire Discourse dans la catégorie aléatoire.

Nous pourrions « gonfler » notre index de titres en ajoutant la catégorie et les tags - je pense que c’est ce que Google fait de toute façon.

Donc, au lieu d’indexer :

première priorité « Publicité Discourse »
deuxième « plugin »
troisième priorité « contenu »

Nous pourrions indexer

première priorité « Publicité Discourse - tag de plugin1 tag2 »

Bien sûr, une solution de contournement consiste à rechercher :

#plugin chat

vs


Pour information… autant aller corriger tous les plugins officiels maintenant, cela ne me prendra que quelques minutes.

4 « J'aime »

Et si l’on prenait en compte le nombre de liens vers le sujet ?

2 « J'aime »

Oui, c’est le PageRank, je l’ai mentionné

Tellement de compromis cependant, un titre exact devrait-il perdre face à un PageRank élevé ?

2 « J'aime »

Non. Je dois souvent rechercher des titres exacts, mais je suis assez spécial. Lorsque je recherche un lien « pourquoi n’avez-vous pas effectué de recherche », je recherche principalement des éléments dont je sais qu’ils existent (à une étape de l’installation standard, pendant de nombreux mois, j’ai été bloqué par le fait que « straightforward » ne trouvait plus le Configurer la réception directe des e-mails entrants pour les sites auto-hébergés avec Mail-Receiver, mais je l’ai récemment renommé afin que « mail receiver » fonctionne)

Ah. Je vois maintenant que vous avez dit cela.

Pour les choses que je recherche réellement et que je ne sais pas que je recherche, le plus récent fonctionne généralement le mieux.

Pour information, sur mes propres sites (en grande partie pour moi seul), avec relativement peu de sujets et de publications, je pense que la recherche fonctionne plutôt bien !

4 « J'aime »

C’est la bonne approche, il existe de nombreux outils de recherche à tester avant de gaspiller trop d’efforts sur celui en interne. Je ne connais aucun site avec une recherche interne qui ne reçoive pas cette plainte. Même Reddit, qui est l’un des plus grands sites, est critiqué pour sa recherche.

1 « J'aime »

En corrélant le comportement des utilisateurs lors des recherches et de la lecture (et éventuellement par le biais d’enquêtes, comme le fait Google Maps par exemple), Discourse pourrait générer en interne des connaissances sur les résultats attendus des requêtes.

Je me demande aussi si l’IA pourrait aider à orienter une conversation vers les résultats souhaités. Un tel dialogue pourrait commencer par un bouton disant : « Je ne suis pas satisfait des résultats ». Le rôle de l’IA serait alors de poser des questions dont les réponses permettraient soit de réduire la gamme des résultats, soit de les hiérarchiser de manière appropriée.

Un plugin typesense semble incroyable.

Bon sujet ! La recherche dans les forums est une chose vraiment délicate, et la solution d’utiliser Google a tendance à revenir un peu trop souvent à mon goût.

Je suis d’accord. Vous ne voulez pas que les anciens sujets dominent vos résultats de recherche.
À en juger par mes propres attentes en matière de recherche, je voudrais que les meilleurs résultats soient des fils de discussion à la fois récents et actifs, et qui correspondent bien en termes de titre et de catégorie. Et même après cela, je préférerais que la récence ait un impact notable, car je recherche souvent des choses dont je me souviens vaguement.

Malheureusement, c’est aussi vrai. Personnellement, je ne suis même pas sûr de l’importance des liens pour la pertinence (bien qu’ils soient probablement un facteur), car dans les forums où je suis actif, mais qui ne sont pas des forums de support ou techniques, les liens sont relativement rares.
J’ai donc tendance à considérer la récence et l’activité, c’est-à-dire le nombre de vues, de likes/réactions, de réponses, dans un passé pas trop lointain comme plus importantes (je ne sais pas si cela est également pris en compte dans l’implémentation actuelle de la recherche ou non).

3 « J'aime »

Je pense que cela vaut la peine de regarder l’algorithme que Reddit utilise pour son score « hot » :

math - Where do mathematical algorithms for Reddit’s ranking, as an example, come from? - Stack Overflow

C’est quelque chose comme

image

1 « J'aime »

:sob: :sob: :sob: :sob:

5 « J'aime »

D’accord. Pour information, subscriptions #plugin fait mieux.

Ouais. Ne me faites pas réfléchir.

La requête dans le fil de discussion initial donne les mêmes sujets dans le même ordre qu’il y a un an (à l’exception de ce fil de discussion qui pollue les résultats de recherche…)

Je me demandais, est-ce que cela a porté ses fruits d’une manière ou d’une autre ?

4 « J'aime »

Je commence à trop dépendre de Google quand je ne trouve pas quelque chose ici, et ça ne me plaît pas. :cry: Cela dit, je suis sûr que l’équipe trouvera un moyen d’améliorer la recherche tôt ou tard.

6 « J'aime »

Nous avons beaucoup appris de l’expérience, mais elle prenait beaucoup de temps et nous sommes passés à d’autres priorités.

6 « J'aime »

Puis-je connaître l’état actuel de l’expérience ? Faut-il la poursuivre ou faut-il recommencer à zéro ?

Je n’ai pas beaucoup d’expérience dans l’analyse du code pour identifier les changements majeurs, donc un simple résumé me suffirait pour comprendre :slight_smile:

La centralisation des recherches devrait permettre à Discourse d’être plus visible sur les blogs et sites similaires proposant davantage de services en ligne.

C’est notre cas d’utilisation initial ; je pense que cela pourrait apporter de la valeur d’offrir une porte d’entrée pour discuter des articles de blog directement sur la barre de recherche.

1 « J'aime »

L’expérience a été abandonnée, elle pourrait réapparaître, nous sommes certainement toujours intéressés à améliorer la recherche

1 « J'aime »

C’est bon à savoir, merci !

Je comprends qu’offrir une recherche simplifiée à travers plusieurs applications (wikis, blogs, documents, forums) est obligatoire pour réaliser le plein potentiel de la nouvelle technologie et des changements radicaux que nous vivons.

Nous prenons en charge Algolia dans un plugin Algolia, vous pourriez donc vous appuyer sur cela.

1 « J'aime »