Discourse necessita di una ricerca migliore

Un possibile approccio @Falco potrebbe essere un approccio inverso rispetto a quello attuale\n\nPer ogni argomento prova a estrarre/creare circa 20 parole chiave e sovrapponile alle parole chiave esistenti\n\nMi chiedo se questo aiuti\n\n[Untitled AI bot PM] - AI Conversation - Discourse Meta

3 Mi Piace

La nostra ricerca di pertinenza non tiene conto delle visualizzazioni o del pagerank. E per aggiungere complicazioni, le visualizzazioni di tutti i tempi possono distorcere molto le cose, quindi probabilmente avremmo bisogno delle visualizzazioni per anno o qualcosa di simile per correggerle.

Ma… con il pagerank / la contabilità dei conteggi di visualizzazione / i like è possibile che possiamo ideare un algoritmo di pertinenza di gran lunga migliore.

Questa è roba complessa, un’azienda da trilioni di dollari è stata costruita su queste idee e un’altra azienda da trilioni di dollari non ha modo facile di recuperare.

10 Mi Piace

L’ho sistemato… al numero 1 ora.

Ho discusso questo problema con @tgxworld e @JammyDodger in passato, ci siamo preparati una torta molto cattiva qui.

La semplice soluzione è

Scorrere ogni singolo argomento Plugin e aggiungere “Plugin” alla fine.

Plugin pubblicitario Discourse
Plugin chat Discourse
e così via…

Il titolo corrisponde a “vincere”, quindi ad esempio

  • Pubblicità nella categoria Plugin perderà contro Domanda sul plugin pubblicitario Discourse nella categoria casuale.

Potremmo “gonfiare” il nostro indice di titoli aggiungendo la categoria e i tag - penso che sia quello che fa comunque Google.

Quindi invece di indicizzare:

prima priorità “Pubblicità Discourse”
seconda “plugin”
terza priorità “contenuto”

Potremmo indicizzare

prima priorità “Pubblicità Discourse - tag plugin1 tag2”

Ovviamente una soluzione è cercare:

#plugin chat

vs


Per quanto ne so… tanto vale sistemare anche tutti i plugin ufficiali ora, mi ci vorranno solo pochi minuti.

4 Mi Piace

Che ne dici di tenere conto del numero di link all’argomento?

2 Mi Piace

Sì, quello è il PageRank, l’ho menzionato

Tanti compromessi però, un titolo esatto dovrebbe perdere rispetto a un PageRank elevato?

2 Mi Piace

No. Devo spesso cercare titoli esatti, ma sono piuttosto speciale. Quando cerco un link “perché non hai effettuato una ricerca”, cerco principalmente cose che so esistere (un passo avanti rispetto all’installazione standard, per molti mesi sono rimasto bloccato dal fatto che “straightforward” non trovasse più Configure direct-delivery incoming email for self-hosted sites with Mail-Receiver, ma di recente è stato rinominato in modo che “mail receiver” funzioni)

Ah. Ora vedo che l’hai detto.

Per le cose che cerco effettivamente e che non so di cercare, il più recente di solito funziona meglio.

A titolo informativo, sui miei siti (in gran parte solo per me), con relativamente pochi argomenti e post, penso che la ricerca funzioni abbastanza bene!

4 Mi Piace

Questo è il modo, ci sono molti strumenti di ricerca da testare prima di sprecare troppi sforzi su quello interno. Non conosco alcun sito con una ricerca interna che non riceva questa lamentela. Persino Reddit, che è uno dei siti più grandi in circolazione, viene criticato per la sua ricerca.

1 Mi Piace

Correlando il comportamento dell’utente durante la ricerca e la lettura (e possibilmente attraverso richieste, come fa ad esempio Google Maps), Discourse potrebbe generare internamente conoscenza sui risultati attesi delle query.

Mi chiedo anche se l’IA possa aiutare a indirizzare una conversazione verso i risultati desiderati. Tale dialogo potrebbe iniziare con un pulsante che dice: “Sono insoddisfatto dei risultati”. Il ruolo dell’IA sarebbe quindi quello di porre domande le cui risposte restringono l’intervallo dei risultati o li danno la priorità in modo appropriato.

Un plugin di typesense sembra fantastico.

Ottimo argomento! La ricerca nei forum è una cosa davvero complicata, e la soluzione di usare Google tende a saltar fuori un po’ troppo spesso per i miei gusti.

Sarei d’accordo qui. Non vuoi che vecchi argomenti dominino i tuoi risultati di ricerca.
A giudicare dalle mie aspettative di ricerca, vorrei che i migliori risultati fossero thread recenti e attivi, e che corrispondessero bene in termini di titolo e categoria. E anche dopo questo, preferirei che la recenza avesse un impatto notevole, perché spesso cerco cose che ricordo vagamente.

Purtroppo anche vero. Personalmente, non sono nemmeno sicuro di quanto i link contribuiscano davvero alla pertinenza (anche se probabilmente sarebbero un fattore), perché nei forum in cui sono attivo, ma che non sono forum di supporto o tecnici di qualche tipo, il linking è relativamente raro.
Quindi tendo a considerare la recenza e l’attività, cioè il numero di visualizzazioni, like/reazioni, risposte, nel passato non troppo lontano più importanti (non so se questo sia anche considerato nell’attuale implementazione della ricerca o meno).

3 Mi Piace

Penso che valga la pena esaminare l’algoritmo che reddit utilizza per il suo punteggio “hot”:

math - Where do mathematical algorithms for Reddit’s ranking, as an example, come from? - Stack Overflow

È qualcosa del tipo

image

1 Mi Piace

:sob: :sob: :sob: :sob:

5 Mi Piace

Concordo. Per quanto possa valere, subscriptions #plugin fa meglio.

Sì. Non farmi pensare.

La query nell’OP restituisce gli stessi argomenti nello stesso ordine di un anno fa (con l’eccezione di questo stesso argomento che inquina i risultati della ricerca…)

Mi stavo chiedendo, questo ha dato qualche frutto in qualche modo?

4 Mi Piace

Ho iniziato a fare troppo affidamento su Google quando non riesco a trovare qualcosa qui, e non mi piace. :cry: Detto questo. Sono sicuro che il team troverà un modo per migliorare la ricerca prima o poi.

6 Mi Piace

Abbiamo imparato molto dall’esperimento, ma stava consumando molto tempo e siamo passati ad altre priorità.

6 Mi Piace

Posso conoscere lo stato attuale dell’esperimento? Dovrebbe essere continuato o deve essere ricominciato da capo?

Non ho molta esperienza nell’analizzare il codice per identificare modifiche che introducono incompatibilità, quindi un semplice riassunto mi basterebbe per capire :slight_smile:

Centralizzare le ricerche dovrebbe dare a Discourse maggiore visibilità su blog e siti simili con più servizi online.

Questo è il nostro caso d’uso iniziale; penso che potrebbe aggiungere valore offrire una porta d’accesso per discutere articoli di blog direttamente nella barra di ricerca.

L’esperimento è stato ritirato, potrebbe riapparire, siamo sicuramente ancora interessati a migliorare la ricerca.

1 Mi Piace

È bello saperlo, grazie!

Capisco che offrire una ricerca semplificata su più app (wiki, blog, documenti, forum) sia obbligatorio per realizzare il pieno potenziale della nuova tecnologia e dei cambiamenti radicali che stiamo vivendo.

Supportiamo Algolia in un plugin Algolia, quindi potresti fare affidamento su quello.

1 Mi Piace