AI Search pour trouver des correspondances non exactes

Nous utilisons notre site comme une base de connaissances et un forum de discussion pour un département universitaire. Ainsi, par exemple, je peux imaginer des gens voulant poser des questions comme :

  • quand les notes de MSc seront-elles disponibles ?
  • quel est le seuil de réussite pour les étudiants en MPsych ?
  • combien de semaines de congé puis-je réserver en une seule fois ?
  • que se passe-t-il si mon tuteur échoue à un module de première année ?
  • que demande l’université si mon tuteur a des pensées suicidaires ?
  • combien payons-nous les participants à la recherche ?
  • comment obtenir une promotion ?
  • quelles sont les sources de financement de doctorat disponibles ? ou quand les bourses de doctorat de l’école sont-elles publiées ?
  • où dans le programme les étudiants apprennent-ils l’ANOVA à mesures répétées ?

Dans chacun de ces cas, nous avons des informations assez bonnes, mais la recherche traditionnelle ne trouve pas les bons résultats à résumer. Parfois, elle ne trouve rien, mais d’autres fois, elle trouve de vieilles discussions qui ne sont pas la réponse « correcte ».

5 « J'aime »

Merci pour vos commentaires Ben

Consultez la file d’attente des PR sur laquelle @falco travaille sur la recherche sémantique basée sur Hyde, une fois prête, j’essaierai d’y ajouter une commande.

2 « J'aime »

Pour information

Je sais que beaucoup d’entre vous ici ne sont pas programmeurs et que les différences entre la recherche par mots-clés et la recherche sémantique peuvent sembler confuses, ou que vous pourriez vouloir en savoir plus sur son fonctionnement. Bien que ce qui suit soit destiné aux programmeurs, il est suffisamment basique pour que vous puissiez en apprendre quelques concepts clés sur les différences entre les deux méthodes de recherche sans être programmeur.

DeepLearning.AI a récemment (14/08/2023) ajouté ce cours basique gratuit sur

Grands modèles de langage avec recherche sémantique (ref)

qui se trouve sur la page des cours intensifs.


Pour ceux qui prêtent attention aux personnalités dans le monde de l’IA, ils devraient reconnaître quelques-uns des intervenants.

1 « J'aime »

Pour ceux qui, comme moi, aiment les articles de recherche et, comme moi, ne connaissaient pas HyDE, voici l’article.

« Precise Zero-Shot Dense Retrieval without Relevance Labels » par Luyu Gao, Xueguang Ma, Jimmy Lin et Jamie Callan (pdf)

1 « J'aime »

Pouvez-vous fournir un lien ? (Répondu ci-dessous)

Désolé de demander, je ne l’ai tout simplement pas trouvé. J’ai appris les commandes de bot par contre. (ref)

@EricGT merci pour le lien. Ce document est assez dense pour ceux qui ne comprennent pas déjà grand-chose au ML.

Je pense que l’idée principale est que, tel qu’appliqué ici, HyDE utiliserait un LLM pour créer d’abord une réponse « inventée » basée sur la question. Cette réponse aura la forme d’un véritable article de forum (par exemple), mais peut contenir des hallucinations et être factuellement incorrecte car le contenu provient du LLM et non d’un ensemble de documents canoniques. Ce document n’est jamais montré à l’utilisateur, mais l’astuce est que ce document sera sémantiquement similaire aux documents/sujets réels de votre site. La recherche renvoie les documents réels les plus similaires au document « inventé », et empiriquement, cela semble mieux fonctionner que de simplement faire correspondre le terme de recherche brut à des documents sémantiquement similaires dans la base de données d’embeddings.

@sam Hyde la recherche basée sur son semble intéressante et j’ai hâte de l’essayer. Envisagez-vous des réglages modifiables pour certaines de ces fonctionnalités d’IA ? Par exemple, j’imagine qu’il pourrait être agréable de modifier les invites utilisées à la fois pour générer le document hypothétique et pour contrôler le résumé/la réponse. Par exemple, le chatbot actuel est assez verbeux lorsqu’il trouve des réponses. Il serait agréable de pouvoir ajouter « de manière concise » ou « brièvement » comme préfixe à l’invite (comme je le fais souvent lorsque j’utilise moi-même chatgpt).

4 « J'aime »
4 « J'aime »

Bonne remarque !


Je sais que beaucoup ne prêteront pas attention à cette déclaration, mais si vous payez de l’argent réel pour exécuter des invites, c’est l’une des déclarations les plus précieuses que vous devez comprendre.

Voir :

Invites

40-90 % : Montant économisé en ajoutant « Soyez concis » à votre invite

Il est important de se rappeler que vous payez par jeton pour les réponses. Cela signifie que demander à un LLM d’être concis peut vous faire économiser beaucoup d’argent [1]. Cela peut être élargi au-delà de la simple ajout de « soyez concis » à votre invite : si vous utilisez GPT-4 pour trouver 10 alternatives, demandez-lui peut-être 5 et conservez l’autre moitié de l’argent.

1 « J'aime »

Nous avons le backend prêt pour cela, mais il nous faudra un certain temps pour l’intégrer correctement à la page de résultats de recherche de Discourse, car l’interface utilisateur est un peu délicate.

Aujourd’hui, nous n’offrons aucun contrôle sur les invites, mais nous le ferons pour les rendre personnalisables à l’avenir, une fois que nous aurons bien fait fonctionner la fonctionnalité.

3 « J'aime »

Vous pouvez l’essayer ici sur Meta, allez simplement sur la page de recherche et essayez quelques questions. Dites-moi comment cela se passe pour vous.

2 « J'aime »

C’est génial ! Surtout quand j’entre une phrase de recherche qui renvoie “Aucun résultat trouvé” pour la recherche par correspondance exacte.

J’obtiens pas mal de correspondances sémantiquement correctes pour les sujets Marketplace fermés. Il est peut-être utile de les renvoyer, mais peut-être devraient-elles apparaître en bas de la liste.

Peut-être que certaines recherches pourraient être limitées à des catégories ou des étiquettes spécifiques. Par exemple :

  • En recherchant “Comment puis-je empêcher l’envoi d’e-mails d’activation lorsque les utilisateurs se connectent depuis WordPress ?”, les meilleurs résultats se trouveront dans Documentation ou Support > WordPress.

  • En recherchant “Comment écrire une requête Data Explorer qui renvoie les sujets les plus appréciés ?”, les meilleurs résultats se trouveront dans les catégories Data & reporting et Documentation.

Si c’était possible, la recherche initiale pourrait renvoyer des résultats des catégories les plus probables et une suggestion pourrait être donnée pour essayer d’élargir la recherche à d’autres catégories.

En pensant à la recherche sémantique comme premier point d’entrée pour utiliser Discourse comme forum de support client, il serait agréable de pouvoir prioriser des catégories ou des étiquettes spécifiques. Par exemple, sur Meta, la recherche initiale pourrait prioriser la recherche dans la catégorie Documentation.

4 « J'aime »

C’est exactement l’un des problèmes que je voulais résoudre avec cette nouvelle fonctionnalité. La recherche sémantique trouvera toujours quelque chose.

Pour le moment, la recherche sémantique est assez rudimentaire. Elle se compose de quelques lignes de code dans le backend et renvoie ce qui est sémantiquement le plus proche. Il lui manque certaines des fonctionnalités de recherche que nous avons ajoutées à la recherche standard au cours de la dernière décennie, comme Améliorations de la recherche dans 2.3 et bien d’autres. Pour cette raison, elle est actuellement proposée comme un ensemble de résultats complémentaires.

Si la fonctionnalité est bien accueillie et que nous parvenons à perfectionner l’interface utilisateur dans le produit, nous tenterons d’intégrer les parties spécifiques à Discourse aux résultats de la recherche sémantique.

5 « J'aime »

Oui, c’est vraiment incroyable pour les requêtes complexes.

Même si elle n’a pas trouvé de message pour cette requête, elle a pu trouver suffisamment de sujets qui pointent dans la bonne direction !

5 « J'aime »