Uma abordagem possível @Falco poderia ser uma abordagem inversa do que nosso icurrent faz
Para cada tópico, tente extrair/criar cerca de 20 palavras-chave e sobreponha-as às palavras-chave existentes
Será que isso ajuda?
Uma abordagem possível @Falco poderia ser uma abordagem inversa do que nosso icurrent faz
Para cada tópico, tente extrair/criar cerca de 20 palavras-chave e sobreponha-as às palavras-chave existentes
Será que isso ajuda?
Nossa busca de relevância não leva em conta visualizações ou pagerank. E para adicionar complicação, visualizações de todos os tempos podem distorcer muito as coisas, então provavelmente precisaríamos de visualizações por ano ou algo assim para corrigir isso.
Mas… com pagerank / contabilizando contagens de visualizações / curtidas, é possível que possamos criar um algoritmo de relevância muito melhor.
Isso é coisa complexa, uma empresa de trilhões de dólares foi construída sobre essas ideias e outra empresa de trilhões de dólares não tem uma maneira fácil de alcançá-la.
Aí eu consertei … no #1 agora.
Discuti essa questão com @tgxworld e @JammyDodger no passado, assamos um bolo muito ruim aqui.
A solução simples é
Passar por cada tópico de Plugin e adicionar “Plugin” no final.
Plugin de Publicidade Discourse
Plugin de Chat Discourse
e assim por diante…
O título corresponde a “ganhar”, então, por exemplo
Publicidade na categoria Plugin perderá para Pergunta sobre o Plugin de Publicidade Discourse na categoria aleatória.Poderíamos “inchar” nosso índice de títulos adicionando categoria e tags - acho que é o que o Google faz de qualquer maneira.
Então, em vez de indexar:
primeira prioridade “Discourse Publicidade”
segunda “plugin”
terceira prioridade “conteúdo”
Poderíamos indexar
primeira prioridade “Discourse Publicidade - tag de plugin1 tag2”
Claro, uma solução alternativa é pesquisar por:
#plugin chat…
vs
Para constar … também posso consertar todos os plugins oficiais agora, levará apenas alguns minutos.
E quanto a levar em conta o número de links para o tópico?
Sim, essa é a classificação da página, eu mencionei isso
Tantas compensações, no entanto, uma correspondência exata de título deveria perder para uma classificação de página alta?
Não. Títulos exatos são o que muitas vezes preciso procurar, mas sou bastante especial. Quando procuro um link “por que você não fez uma busca”, estou principalmente procurando por coisas que sei que existem (um passo além da instalação padrão, por muitos meses fiquei perplexo que “direto” não encontraria mais o Configurar e-mail de entrada de entrega direta para sites auto-hospedados com Mail-Receiver, mas recentemente ele foi renomeado, então “receptor de e-mail” funciona)
Ah. Agora vejo que você disse isso.
Para as coisas que realmente procuro e não sei o que estou procurando, o mais recente geralmente funciona melhor.
Para constar, nos meus próprios sites (em grande parte apenas para mim), com relativamente poucos tópicos e postagens, acho que a busca funciona muito bem!
Este é o caminho, existem muitas ferramentas de busca para testar antes de desperdiçar muito esforço na interna. Não conheço nenhum site com busca interna que não receba essa reclamação. Até o Reddit, que é um dos maiores sites existentes, é criticado por sua busca.
Ao correlacionar o comportamento do usuário durante buscas e leituras (e possivelmente por meio de inquéritos, como o Google Maps faz, por exemplo), o Discourse poderia gerar internamente conhecimento sobre resultados antecipados de consultas.
Também me pergunto se a IA poderia ajudar a direcionar uma conversa para os resultados desejados. Tal diálogo poderia começar com um botão que diz: “Estou insatisfeito com os resultados”. O papel da IA seria então fazer perguntas cujas respostas restrinjam o intervalo de resultados ou os priorizem adequadamente.
Um plugin do Typesense parece incrível.
Ótimo tópico! A busca em fóruns é algo realmente complicado, e a solução de usar o Google tende a aparecer com muita frequência para o meu gosto.
Concordaria aqui. Você não quer que tópicos antigos dominem seus resultados de busca.
A julgar pelas minhas próprias expectativas de busca, eu gostaria que os melhores resultados fossem tópicos que fossem recentes e ativos, e que fossem uma boa correspondência em termos de título e categoria. E mesmo depois disso, eu preferiria que a recência tivesse um impacto notável, porque muitas vezes procuro coisas que me lembro vagamente.
Infelizmente, também é verdade. Pessoalmente, nem tenho certeza de quanto os links realmente contribuiriam para a relevância (embora provavelmente fossem um fator), porque nos fóruns em que sou ativo, mas que não são fóruns de suporte ou técnicos de algum tipo, os links são relativamente raros.
Portanto, tendo a considerar a recência e a atividade, ou seja, o número de visualizações, curtidas/reações, respostas, em um passado não muito distante, mais importantes (não sei se isso também é levado em consideração na implementação atual da busca ou não).
Acho que vale a pena dar uma olhada no algoritmo que o reddit usa para sua pontuação “hot”:
Isso é algo como

Concordo. Para informação, subscriptions #plugin funciona melhor.
Sim. Não me faça pensar.
A consulta no OP retorna os mesmos tópicos na mesma ordem de um ano atrás (com exceção deste tópico poluindo os resultados da pesquisa…)
Eu estava me perguntando, isso acabou dando algum resultado?
Comecei a depender demais do Google quando não consigo encontrar algo aqui, e não gosto disso.
Dito isso. Tenho certeza de que a equipe encontrará uma maneira de melhorar a pesquisa mais cedo ou mais tarde.
Aprendemos bastante com o experimento, mas ele estava consumindo muito tempo e mudamos para outras prioridades.
Posso saber o estado atual do experimento? Ele deve ser continuado ou precisa ser reiniciado do zero?
Eu não tenho muita experiência em analisar o código para identificar alterações que quebram a compatibilidade, então um resumo simples seria suficiente para eu entender ![]()
Centralizar buscas deve dar ao Discourse mais exposição em blogs e sites semelhantes com mais serviços online.
Esse é o nosso caso de uso inicial; acho que poderia agregar valor oferecer uma porta de entrada para discutir artigos de blog diretamente na barra de pesquisa.
O experimento foi desativado, ele pode reaparecer, certamente ainda estamos interessados em melhorar a busca
É bom saber, obrigado!
Entendo que oferecer uma busca simplificada em múltiplos aplicativos (wikis, blogs, docs, fóruns) é obrigatório para realizar o potencial total da nova tecnologia e as mudanças radicais que estamos vivenciando.
Nós apoiamos a algolia em um plugin da algolia, então você pode contar com isso.