Entmagnetisieren Sie Ihre Bildschirme, Discourse Rewind 2025 ist da 💾

Wie wird die Wortverwendung berechnet? Soweit ich von unseren Benutzern sehe, scheint sie Folgendes einzuschließen:

  • Titel von Themen und Kategorien für jeden Beitrag, auch wenn der Benutzer das Thema nicht erstellt hat. Einige Benutzer haben „shenanigans“, „Dice“ und „Mongerer“ in ihren Top 5. Dies sind Kategorien oder Threads mit vielen Beiträgen, aber die Wörter werden im Inhalt der Threads oder anderswo nicht wirklich so oft verwendet.
  • Emoji-Titel – Benutzer fügt :musical_keyboard: zu allen seinen Beiträgen hinzu. Musical und Keyboard waren in ihren Top 5 der Wörter.
2 „Gefällt mir“

Wir verwenden unsere Suchdaten, um die Beiträge eines Benutzers zu finden, und diese Daten erhalten am Ende den Titel und die Kategorie hinzugefügt … und das Emoji wird wahrscheinlich von :musical_keyboard: (seine Markdown-Referenz) in „musical“ und „keyboard“ umgewandelt.

Ich denke, wir müssten zusätzliche Verarbeitungsschritte durchführen oder eine andere Quelle für die Beitragsdaten verwenden, um dies zu vermeiden … der Fall mit der Kategorie tritt wahrscheinlich eher auf Websites auf, auf denen Benutzer viele kurze Beiträge (oder nur Bildbeiträge) in derselben Kategorie erstellen, da in diesem Fall die Kategorie im Verhältnis zu anderem Beitragsinhalt sehr häufig vorkommt.

1 „Gefällt mir“

Ja, mit diesen Worthäufigkeitsergebnissen stimmt etwas ganz und gar nicht. Für mich ist „nützlich“ (useful) eines der Top 5 ungewöhnlichen Wörter. Aber es scheint, dass ich dieses Wort nie verwendet habe: Ich habe gesucht, viele „Ergebnisse“ erhalten, von denen die obersten drei das Wort nicht einmal enthalten, und die Seitenleiste von discobot merkt an:

Es scheint keine direkte Übereinstimmung für „@Ed_S nützlich“ (useful) in der Suche zu geben.

Findet hier eine übermäßig aggressive Stammwortbildung (stemming) oder eine unscharfe Suche (fuzzy matching) statt?

1 „Gefällt mir“