I risultati della ricerca dovrebbero privilegiare il primo post del topic quando il titolo corrisponde al termine di ricerca

Quindi non esiste assolutamente alcun modo per indicare nell’indice di ricerca se un post è il primo post?

E che ne dici di questa modifica:

Quando più post in un argomento corrispondono a un determinato termine di ricerca, E SE UNO DI QUESTI È IL PRIMO POST, assegna a quel post specifico, ovvero il primo post, un enorme aumento nel ranking della ricerca.

In questo modo eviti un comportamento acritico di “ordinamento per numero di post”, dando comunque la priorità al primo post?

2 Mi Piace

Al momento no, ma non sarebbe difficile da aggiungere, dato che è simile a un’ottimizzazione che ho realizzato lo scorso anno per permetterci di filtrare il PostSearchIndex in base al fatto che sia un messaggio privato o meno.

2 Mi Piace

La mia opinione è che il beneficio teorico di una classificazione accurata dei duplicati per argomento abbia troppi svantaggi.

  • Le persone potrebbero utilizzare la ricerca come un segnalibro e rimanere confuse quando una ricerca che le portava sempre al post #77 ora le porta al post #892.

  • Per peggiorare le cose, non abbiamo un meccanismo per “andare al primo messaggio non letto in un argomento”, quindi dare priorità ai post successivi comporta un grande svantaggio: è più probabile che si creino lacune nella lettura (ad esempio, leggi 1, 2, 3 ma non leggi da 4 a 88… ora arrivi al 89).

Preferisco di gran lunga dare priorità incondizionatamente al primo risultato in un argomento: è più semplice da spiegare e molto più stabile.

5 Mi Piace

Sono d’accordo e quella soluzione va bene per me :+1:

4 Mi Piace

Usiamo il punteggio di ranking del primo risultato o quello del miglior post nell’argomento? In precedenza facevamo quest’ultimo, il che sembra errato, poiché stavamo considerando il ranking di un post che non apparirà nei risultati di ricerca per confrontarlo con i post di altri argomenti.

3 Mi Piace

Direi che linkiamo a MIN(post_number) e classifichiamo in base a MAX(rank) quando si eseguono le operazioni di aggregazione.

3 Mi Piace

Il nuovo comportamento è stato annullato in

5 Mi Piace

Questo argomento è stato automaticamente chiuso dopo 6 giorni. Non sono più consentite nuove risposte.

Grazie per aver riaperto l’argomento. Penso che ci sia ancora un problema correlato. Su https://community.wanikani.com, esiste un argomento intitolato “General Anime Thread”. Se cerco “general anime”, ottengo questo argomento come primo risultato, ma mi porta al post 511. Ciò che è particolarmente strano è che questo post non contiene nemmeno le parole “general” o “anime”. Quindi, in qualche modo, questo sembra essere anche peggio del problema inizialmente segnalato. https://community.wanikani.com dovrebbe essere su una versione successiva all’unione di questa correzione, per quanto ne so.

Per fare un secondo esempio, se cerco “japanese book club”, ottengo il post 925 di quell’argomento, anche se il termine di ricerca è presente nel titolo dell’argomento.

Ho provato a riprodurlo su meta, ma non ci sono riuscito. Potrebbe dipendere semplicemente dai termini specifici che ho provato a cercare.

4 Mi Piace

Hai controllato la versione visualizzando il codice sorgente? Se non riesci a riprodurre il problema qui, è probabile che si tratti di una discrepanza tra le versioni.

1 Mi Piace

Questo proviene dal codice sorgente della pagina:

Discourse 2.7.0.beta4 - https://github.com/discourse/discourse versione 47835ade9a3dcebb14bdd744e92d93b9c9199b90

Quel commit è di due giorni fa e riesco ancora a riprodurre questo problema con gli esempi nel mio ultimo messaggio.

3 Mi Piace

Grazie per il rapporto molto dettagliato, @tgxworld darà un’occhiata veloce!

4 Mi Piace

@sam So di cosa si tratta. Abbiamo un’ottimizzazione delle prestazioni di ricerca per i siti di grandi dimensioni in cui cerchiamo solo all’interno di un indice parziale. Dato che il primo post è molto vecchio, viene escluso dall’indice parziale, ed è per questo che non stiamo creando un link al primo post. Dovrò riflettere sulla soluzione per questo problema, perché le soluzioni che ho in mente attualmente comportano un compromesso tra prestazioni e accuratezza o tra accuratezza e prestazioni.

3 Mi Piace

Sarebbe ragionevole (in termini di compromesso sulle prestazioni) includere nel indice il primo post di ogni argomento? O forse solo il primo post di ogni argomento se l’argomento contiene un post all’interno dell’intervallo di tempo ottimizzato? Supponendo che quest’ultima opzione sia persino fattibile dal punto di vista del database.

3 Mi Piace

Questo è tecnicamente fattibile, ma è un problema enorme.

Temo che il compromesso di dedicare, diciamo, una settimana a un attento rimescolamento dell’indice potrebbe non valere la pena quando si tratta di correggere questo problema.

Posso anche pensare a molte situazioni eccezionali che complicano le cose (come un forum con montagne di argomenti brevi).

Aspettiamo un po’ prima di procedere e vediamo quanto spesso si presenta.

Un cambiamento temporaneo che probabilmente possiamo permetterci sul tuo forum è raddoppiare la dimensione del tuo indice recente; questo è configurabile (@tgxworld, forse potresti impostarlo così).

4 Mi Piace

Grazie! Se pensi che sia sicuro farlo, sarebbe fantastico!

3 Mi Piace

È mai stato fatto questo? La ricerca per l’argomento precedentemente menzionato ora porta al post 523 invece che al 511, il che sembra indicare che sempre più post escono dal raggio dell’indice.

2 Mi Piace

Ciao Sean, scusa, non è stato segnalato.

Ho appena modificato (SiteSetting.search_recent_posts_size) in 250k, hai solo 163k discussioni. Ci vorranno un paio di giorni perché la modifica abbia effetto, deve essere eseguita un’attività pianificata.

4 Mi Piace

Credo che le modifiche siano già state applicate. In precedenza l’avevo impostato a 1 milione, ma ho dimenticato di pubblicare un aggiornamento qui.

@sam Abbiamo intenzione di affrontare questo problema in futuro? Includere tutti i primi post nell’indice parziale non sembra uno scambio negativo. So dalle discussioni precedenti che @codinghorror ritiene che la ricerca dovrebbe dare priorità ai topic prima di mostrare i post all’interno di un topic.

3 Mi Piace