Suchergebnisse sollten dem ersten Beitrag im Thema Vorrang geben, wenn der Titel mit dem Suchbegriff übereinstimmt.

Gibt es also absolut keine Möglichkeit, im Suchindex zu erkennen, ob ein Beitrag der erste Beitrag ist?

Wie wäre es mit einer solchen Anpassung:

Wenn mehrere Beiträge in einem Thema einen bestimmten Suchbegriff erfüllen, UND EINER DER BEITRÄGE DER ERSTE BEITRAG IST, gib diesem spezifischen Beitrag, dem ersten Beitrag, einen enormen Boost im Suchranking.

Dadurch vermeidest du ein gedankenloses „nach Beitragsnummer sortieren“-Verhalten und gibst gleichzeitig dem ersten Beitrag die richtige Priorität?

2 „Gefällt mir“

Derzeit nicht, aber es wäre nicht schwer hinzuzufügen, da es einer Optimierung ähnelt, die ich letztes Jahr durchgeführt habe, um uns zu ermöglichen, den PostSearchIndex nach PM oder Nicht-PM zu filtern.

2 „Gefällt mir“

Mein Vorschlag hier ist, dass der theoretische Vorteil einer genauen Rangfolge von Duplikaten innerhalb eines Themas bei weitem zu viele Nachteile mit sich bringt.

  • Nutzer könnten die Suche wie ein Lesezeichen verwenden und verwirrt sein, wenn eine Suche, die sie bisher immer zu Beitrag #77 führte, sie nun zu #892 führt.

  • Als Öl ins Feuer gießen: Wir haben keinen Mechanismus, um zum „ersten ungelesenen Beitrag in einem Thema“ zu springen. Daher bringt die Priorisierung späterer Beiträge den großen Nachteil mit sich, dass die Wahrscheinlichkeit höher ist, dass Lücken beim Lesen entstehen (z. B. Sie lesen 1, 2, 3, aber nicht 4–88 … und stoßen nun auf 89).

Ich bevorzuge es sehr, den ersten Treffer in einem Thema bedingungslos zu priorisieren. Das ist einfacher zu erklären und deutlich stabiler.

5 „Gefällt mir“

Ich stimme zu, und diese Lösung funktioniert für mich :+1:

4 „Gefällt mir“

Verwenden wir das Ranking des ersten Treffers oder das Ranking des besten Beitrags im Thema? Wir haben bisher Letzteres verwendet, was falsch erscheint, da wir das Ranking eines Beitrags heranziehen, der nicht in den Suchergebnissen erscheint, um ihn gegen Beiträge anderer Themen zu bewerten.

3 „Gefällt mir“

Ich würde sagen, wir verlinken auf MIN(post_number) und werten bei der Aggregation MAX(rank) aus.

3 „Gefällt mir“

Das neue Verhalten wurde in

rückgängig gemacht.

5 „Gefällt mir“

Dieses Thema wurde automatisch nach 6 Tagen geschlossen. Neue Antworten sind nicht mehr erlaubt.

Danke, dass du das Thema wiedereröffnet hast. Ich denke, es gibt immer noch ein Problem in diesem Zusammenhang. Auf https://community.wanikani.com gibt es ein Thema mit dem Titel „General Anime Thread“. Wenn ich nach „general anime“ suche, erscheint dieses Thema als erstes Ergebnis, aber es führt zu Post 511. Besonders seltsam ist, dass dieser Beitrag nicht einmal die Wörter „general“ oder „anime“ enthält. Das scheint also sogar noch schlimmer zu sein als das ursprünglich gemeldete Problem. Soweit ich sehe, sollte https://community.wanikani.com eine Version nach dem Zusammenführen dieser Korrektur haben.

Als zweites Beispiel: Wenn ich nach „japanese book club“ suche, erhalte ich Post 925 dieses Themas, obwohl der Suchbegriff im Titel des Themas steht.

Ich habe versucht, das Problem auf Meta nachzustellen, bin aber nicht fündig geworden. Es könnte jedoch einfach an den spezifischen Begriffen liegen, nach denen ich gesucht habe.

4 „Gefällt mir“

Haben Sie die Version über die Quelltextansicht überprüft? Wenn Sie den Fehler hier nicht reproduzieren können, liegt es wahrscheinlich an einer Versionsinkonsistenz.

1 „Gefällt mir“

Das stammt aus der Seitenquelle:

Discourse 2.7.0.beta4 - https://github.com/discourse/discourse version 47835ade9a3dcebb14bdd744e92d93b9c9199b90

Dieser Commit ist von vor zwei Tagen, und ich kann das Problem mit den Beispielen aus meinem letzten Beitrag immer noch reproduzieren.

3 „Gefällt mir“

Vielen Dank für den sehr detaillierten Bericht, @tgxworld wird sich das kurz ansehen!

4 „Gefällt mir“

@sam Ich weiß, worum es hier geht. Wir haben bei großen Seiten eine Suchleistungsoptimierung, bei der wir nur einen Teilindex durchsuchen. Da der erste Beitrag sehr alt ist, wird er aus dem Teilindex ausgeschlossen, weshalb wir nicht auf den ersten Beitrag verlinken. Ich muss mir noch überlegen, wie wir das beheben, da die mir derzeit einfallenden Lösungen entweder Leistung zugunsten der Genauigkeit oder Genauigkeit zugunsten der Leistung opfern.

3 „Gefällt mir“

Wäre es vertretbar (unter Abwägung der Leistungseinschränkungen), wenn der erste Beitrag jedes Themas in den Index aufgenommen würde? Oder vielleicht nur der erste Beitrag jedes Themas, falls das Thema einen Beitrag innerhalb des optimierten Zeitraums hat? Unter der Annahme, dass Letzteres aus Datenbanksicht überhaupt machbar ist.

3 „Gefällt mir“

Das ist technisch machbar, aber ein Riesenproblem.

Ich befürchte, dass der Aufwand von etwa einer Woche sorgfältigem Neuordnen des Indexes im Verhältnis zum Nutzen bei der Korrektur dieses Problems nicht gerechtfertigt ist.

Mir fallen auch zahlreiche Ausnahmesituationen ein, die das komplizieren (z. B. ein Forum mit vielen kurzen Themen).

Lassen wir das erst einmal eine Weile ruhen und schauen, wie oft es auftritt.

Eine vorübergehende Änderung, die wir für dein Forum wahrscheinlich verkraften können, ist die Verdopplung der Größe deines aktuellen Index. Das ist konfigurierbar (@tgxworld, mach das vielleicht so).

4 „Gefällt mir“

Danke! Wenn du denkst, dass es sicher ist, das zu tun, wäre das großartig!

3 „Gefällt mir“

Ist das jemals umgesetzt worden? Die Suche nach dem zuvor erwähnten Thema führt jetzt zu Beitrag 523 statt zu 511, was darauf hindeutet, dass immer mehr Beiträge außerhalb des Indexbereichs liegen.

2 „Gefällt mir“

Hallo Sean, entschuldige, dass es nicht angesprochen wurde.

Ich habe es gerade auf 250k geändert (SiteSetting.search_recent_posts_size), du hast nur 163k Themen. Es wird ein paar Tage dauern, bis die Änderung wirksam wird, da ein geplanter Job ausgeführt werden muss.

4 „Gefällt mir“

Ich glaube, die Änderungen sind bereits in Kraft getreten. Ich habe es zuvor auf 1 Million geändert, habe aber vergessen, hier ein Update zu posten.

@sam: Planen wir, dieses Problem irgendwann anzugehen? Die Einbeziehung aller ersten Beiträge in den partiellen Index klingt nach einem vernünftigen Kompromiss. Mir ist aus früheren Diskussionen bekannt, dass @codinghorror der Meinung ist, dass die Suche Themen stark priorisieren sollte, bevor Beiträge innerhalb eines Themas angezeigt werden.

3 „Gefällt mir“