Gibt es also absolut keine Möglichkeit, im Suchindex zu erkennen, ob ein Beitrag der erste Beitrag ist?
Wie wäre es mit einer solchen Anpassung:
Wenn mehrere Beiträge in einem Thema einen bestimmten Suchbegriff erfüllen, UND EINER DER BEITRÄGE DER ERSTE BEITRAG IST, gib diesem spezifischen Beitrag, dem ersten Beitrag, einen enormen Boost im Suchranking.
Dadurch vermeidest du ein gedankenloses „nach Beitragsnummer sortieren“-Verhalten und gibst gleichzeitig dem ersten Beitrag die richtige Priorität?
Derzeit nicht, aber es wäre nicht schwer hinzuzufügen, da es einer Optimierung ähnelt, die ich letztes Jahr durchgeführt habe, um uns zu ermöglichen, den PostSearchIndex nach PM oder Nicht-PM zu filtern.
Mein Vorschlag hier ist, dass der theoretische Vorteil einer genauen Rangfolge von Duplikaten innerhalb eines Themas bei weitem zu viele Nachteile mit sich bringt.
Nutzer könnten die Suche wie ein Lesezeichen verwenden und verwirrt sein, wenn eine Suche, die sie bisher immer zu Beitrag #77 führte, sie nun zu #892 führt.
Als Öl ins Feuer gießen: Wir haben keinen Mechanismus, um zum „ersten ungelesenen Beitrag in einem Thema“ zu springen. Daher bringt die Priorisierung späterer Beiträge den großen Nachteil mit sich, dass die Wahrscheinlichkeit höher ist, dass Lücken beim Lesen entstehen (z. B. Sie lesen 1, 2, 3, aber nicht 4–88 … und stoßen nun auf 89).
Ich bevorzuge es sehr, den ersten Treffer in einem Thema bedingungslos zu priorisieren. Das ist einfacher zu erklären und deutlich stabiler.
Verwenden wir das Ranking des ersten Treffers oder das Ranking des besten Beitrags im Thema? Wir haben bisher Letzteres verwendet, was falsch erscheint, da wir das Ranking eines Beitrags heranziehen, der nicht in den Suchergebnissen erscheint, um ihn gegen Beiträge anderer Themen zu bewerten.
Danke, dass du das Thema wiedereröffnet hast. Ich denke, es gibt immer noch ein Problem in diesem Zusammenhang. Auf https://community.wanikani.com gibt es ein Thema mit dem Titel „General Anime Thread“. Wenn ich nach „general anime“ suche, erscheint dieses Thema als erstes Ergebnis, aber es führt zu Post 511. Besonders seltsam ist, dass dieser Beitrag nicht einmal die Wörter „general“ oder „anime“ enthält. Das scheint also sogar noch schlimmer zu sein als das ursprünglich gemeldete Problem. Soweit ich sehe, sollte https://community.wanikani.com eine Version nach dem Zusammenführen dieser Korrektur haben.
Als zweites Beispiel: Wenn ich nach „japanese book club“ suche, erhalte ich Post 925 dieses Themas, obwohl der Suchbegriff im Titel des Themas steht.
Ich habe versucht, das Problem auf Meta nachzustellen, bin aber nicht fündig geworden. Es könnte jedoch einfach an den spezifischen Begriffen liegen, nach denen ich gesucht habe.
Haben Sie die Version über die Quelltextansicht überprüft? Wenn Sie den Fehler hier nicht reproduzieren können, liegt es wahrscheinlich an einer Versionsinkonsistenz.
@sam Ich weiß, worum es hier geht. Wir haben bei großen Seiten eine Suchleistungsoptimierung, bei der wir nur einen Teilindex durchsuchen. Da der erste Beitrag sehr alt ist, wird er aus dem Teilindex ausgeschlossen, weshalb wir nicht auf den ersten Beitrag verlinken. Ich muss mir noch überlegen, wie wir das beheben, da die mir derzeit einfallenden Lösungen entweder Leistung zugunsten der Genauigkeit oder Genauigkeit zugunsten der Leistung opfern.
Wäre es vertretbar (unter Abwägung der Leistungseinschränkungen), wenn der erste Beitrag jedes Themas in den Index aufgenommen würde? Oder vielleicht nur der erste Beitrag jedes Themas, falls das Thema einen Beitrag innerhalb des optimierten Zeitraums hat? Unter der Annahme, dass Letzteres aus Datenbanksicht überhaupt machbar ist.
Das ist technisch machbar, aber ein Riesenproblem.
Ich befürchte, dass der Aufwand von etwa einer Woche sorgfältigem Neuordnen des Indexes im Verhältnis zum Nutzen bei der Korrektur dieses Problems nicht gerechtfertigt ist.
Mir fallen auch zahlreiche Ausnahmesituationen ein, die das komplizieren (z. B. ein Forum mit vielen kurzen Themen).
Lassen wir das erst einmal eine Weile ruhen und schauen, wie oft es auftritt.
Eine vorübergehende Änderung, die wir für dein Forum wahrscheinlich verkraften können, ist die Verdopplung der Größe deines aktuellen Index. Das ist konfigurierbar (@tgxworld, mach das vielleicht so).
Ist das jemals umgesetzt worden? Die Suche nach dem zuvor erwähnten Thema führt jetzt zu Beitrag 523 statt zu 511, was darauf hindeutet, dass immer mehr Beiträge außerhalb des Indexbereichs liegen.
Hallo Sean, entschuldige, dass es nicht angesprochen wurde.
Ich habe es gerade auf 250k geändert (SiteSetting.search_recent_posts_size), du hast nur 163k Themen. Es wird ein paar Tage dauern, bis die Änderung wirksam wird, da ein geplanter Job ausgeführt werden muss.
Ich glaube, die Änderungen sind bereits in Kraft getreten. Ich habe es zuvor auf 1 Million geändert, habe aber vergessen, hier ein Update zu posten.
@sam: Planen wir, dieses Problem irgendwann anzugehen? Die Einbeziehung aller ersten Beiträge in den partiellen Index klingt nach einem vernünftigen Kompromiss. Mir ist aus früheren Diskussionen bekannt, dass @codinghorror der Meinung ist, dass die Suche Themen stark priorisieren sollte, bevor Beiträge innerhalb eines Themas angezeigt werden.