Add search synonyms

En Discourse-AI comenzamos a experimentar con la búsqueda semántica. Todavía estamos en las primeras etapas y explorando estos sistemas.

Usar LLMs para mejorar el prompt de búsqueda también es un enfoque posible (aunque lento hoy en día):

Esta técnica se menciona aquí: GitHub - texttron/hyde: HyDE: Precise Zero-Shot Dense Retrieval without Relevance Labels


Además de los enfoques 100% automatizados

Nuestra estrategia general aquí es iterar. Ya tenemos “palabras vigiladas” en el producto, no me importaría una función que agregue “Sinónimos de búsqueda” donde especifiques errores tipográficos comunes y frases comunes que desees “rellenar”. No es un trabajo programado, pero ciertamente es algo que podrías considerar patrocinar.

Existe un precedente para esta función exacta en Postgres según: https://www.postgresql.org/docs/current/textsearch-dictionaries.html#TEXTSEARCH-SYNONYM-DICTIONARY

La otra área que estoy abierto a explorar (aunque solo estoy tibio en esto) es permitir un lugar de “metadatos” oculto en las publicaciones, donde los administradores puedan rellenar términos de búsqueda. Es muy, muy invisible y, en general, recomiendo simplemente “rellenar” las obras adecuadamente para que las cosas no queden ocultas, por ejemplo:

SEO

semántica, relacionada, mejorando

2 Me gusta