/polls/voters.json gibt doppelte Benutzer über seitenweise Anfragen zurück

robmackenzie · 30. Juli 2025 um 23:06

Wenn der Endpunkt /polls/voters.json mit Paginierung aufgerufen wird, haben wir festgestellt, dass der erste Aufruf wie erwartet 25 Benutzer zurückgibt, die 2. Seite jedoch 26 Benutzer zurückgibt, von denen einer im ersten Aufruf zurückgegeben wurde. Dies ist konsistent, wenn es über 25 Benutzer gibt.

Das Problem liegt hier im Poll-Plugin für Discourse:

github.com/discourse/discourse

plugins/poll/lib/poll.rb

main


      
          end
          
          def self.preload_serialized_voters!(polls, opts = {})
            # This method is used in order to avoid N+1s and preloads serialized voters
            # for multiple polls from a topic view. After the first call, the serialized
            # voters are cached in the Poll object and returned from there for future
            # calls.
          
            page = [1, (opts["page"] || 1).to_i].max
            limit = (opts["limit"] || 25).to_i.clamp(1, 50)
            offset = (page - 1) * limit
          
            params = {
              offset: offset + 1,
              offset_plus_limit: offset + limit,
              option_digest: opts[:option_id].presence,
            }
          
            result = {}
          
            uncached_poll_ids = []

Der Offset wird unter der Annahme berechnet, dass PostgreSQL exklusiv mit einer Grenze der Zeile mittels BETWEEN ist, wenn es inklusiv ist.

Die erste Abfrage gibt tatsächlich 25 zurück, da die berechneten Zeilen bei 1 und nicht bei 0 beginnen.

Mein vorgeschlagener Fix ist so einfach wie:

   params = {
      offset: offset + 1,
      offset_plus_limit: offset + limit,
      option_digest: opts[:option_id].presence,
    }

Oder eine elegantere Lösung könnte die Verwendung von PostgreSQL LIMIT und OFFSET sein:

    params = {
      limit: limit,
      offset: offset,
      option_digest: opts[:option_id].presence,
    }

          WHERE pv.poll_id IN (:poll_ids)
                /* where */
        ) v
        ORDER BY digest, CASE WHEN rank = 'Abstain' THEN 1 ELSE CAST(rank AS integer) END, username
        LIMIT :limit OFFSET :offset
      SQL

sam · 30. Juli 2025 um 23:32

Guter Fang, ich füge hier einen pr-welcome hinzu, falls jemand versuchen möchte, dies zu beheben.

Wir müssen bestätigen, dass wir bestehende Dinge in Umfragen nicht kaputt machen, falls das Frontend fälschlicherweise von falschen Annahmen hier ausgeht.

robmackenzie · 30. Juli 2025 um 23:48

Danke für die schnelle Antwort!
Ich werde versuchen, eine Umgebung einzurichten, ich wollte keinen PR ohne Tests erstellen. Jeder kann mich gerne überholen. Ich bin überhaupt kein Ruby-Entwickler. Ich weiß auch nichts über das Ändern von Spezifikationen oder Tests.

Komischerweise gibt es in der Benutzeroberfläche Code, der die Ergebnisse in ein Set ausgibt, um diesen Fehler zu umgehen.

github.com/discourse/discourse

plugins/poll/assets/javascripts/discourse/components/poll.gjs

99abfb21f


      
              page: Math.floor(votersCount / FETCH_VOTERS_COUNT) + 1,
              limit: FETCH_VOTERS_COUNT,
            },
          })
            .then((result) => {
              this.voterListExpanded = true;
              const newVoters = optionId ? result.voters[optionId] : result.voters;
              let votersSet = new Set([]);
          
              if (this.isRankedChoice) {
                votersSet = new Set(voters.map((voter) => voter.user.username));
                newVoters.forEach((voter) => {
                  if (!votersSet.has(voter.user.username)) {
                    votersSet.add(voter.user.username);
                    voters.push(voter);
                  }
                });
              } else {
                votersSet = new Set(voters.map((voter) => voter.username));
                newVoters.forEach((voter) => {
                  if (!votersSet.has(voter.username)) {

robmackenzie · 31. Juli 2025 um 00:08

Für alle anderen, die dies sehen: Wir haben eine ähnliche UI-Korrektur für unsere Verlosungssoftware hier vorgenommen.

github.com/vhs/raffle

Same winner(s) listed twice consecutively

opened 05:32AM - 21 Jan 25 UTC

closed 05:20PM - 30 Jul 25 UTC

adheeshparelkar

Since the last few raffles, raffle bot has been randomly posting the same name t…wice. **Example 1: https://talk.vanhack.ca/t/welcome-to-2025-raffle-2/16006/11** dbynoe has been listed twice as number 9 and 10 for 21x Koonie Air Duster. Goatwind has been listed twice as number 8 and 9 for ~10x Onevan Chainsaws **Example 2: https://talk.vanhack.ca/t/welcome-to-2025-raffle/15977/6** Eviickaaaa has been listed twice for 23 and 24 for 1 x IPEVO V4K Ultra High Definition USB Camera

Ein Hoch auf @lukecyca von VHS für die Identifizierung des Problembereichs.

Moin · 31. Juli 2025 um 05:26

Es gibt auch einen verwandten Bericht über das Laden weiterer Wähler in Umfragen vom Januar.

merefield · 31. Juli 2025 um 07:08

Guter Fang.

Es ist sogar noch lustiger. Ich habe vor einiger Zeit ein paar sehr große PRs eingereicht, um das Frontend zu modernisieren und Ranked Choice hinzuzufügen.

Der riesige Umfang dieser PRs hat definitiv dazu beigetragen, dass ich das übersehen habe, und Backend-Korrekturen waren nicht wirklich im Geltungsbereich (obwohl ich bei der Durchführung dieser PRs tatsächlich viele Probleme gelöst habe, die nicht streng genommen für diese PRs bestimmt waren).

Ich gebe zu, dass ich diesem Frontend-Präzedenzfall der 2018 aufgestellt wurde für Ranked Choice gefolgt bin, ohne wirklich darüber nachzudenken . (Was ihr übrigens auch gerade befolgt habt, wenn auch wissentlich )

Erstaunlich, wie Workarounds bestehen bleiben können, ohne dass das zugrunde liegende Problem identifiziert wird.

clechasseur · 17. August 2025 um 22:21

Ich dachte, ich versuche mich mal an meinem ersten Beitrag, aber es scheint, als wäre es doch etwas komplizierter als erwartet.

Ich habe einen Draft-PR hochgeladen: FIX: do not return duplicates from /polls/voters.json by clechasseur · Pull Request #1 · clechasseur/discourse · GitHub

In diesem PR habe ich zuerst Tests hinzugefügt, die das Problem reproduzieren, dann habe ich Robs einfache Lösung angewendet und die Tests haben bestanden.

Ich habe auch die elegantere Lösung ausprobiert (die, die ich bevorzugt hätte), aber obwohl sie doppelte Wähler verhindert, ändert sie auch, welcher Wähler auf welcher Seite zurückgegeben wird, einschließlich der ersten, was potenziell als Breaking Change angesehen werden könnte (abhängig davon, wie das Frontend damit umgeht - ich habe es noch nicht nachgesehen).

Wenn ich jedoch einen Schritt zurücktrete, frage ich mich, was die wahre Bedeutung des limit-Parameters ist, wenn man diesen Endpunkt aufruft - er begrenzt nicht wirklich die Anzahl der insgesamt zurückgegebenen Wähler, sondern nur die Anzahl der Wähler, die für jede Umfrageoption zurückgegeben werden. Diesen Effekt sehen Sie in dem Test, den ich für die Multiple-Choice-Umfrage hinzugefügt habe hier - die erste Seite ist tatsächlich auf 2 Wähler pro Option begrenzt, aber insgesamt werden drei verschiedene Wähler zurückgegeben (verteilt auf die Optionen). Wenn man zur eleganten Lösung wechselt (d. h. LIMIT :limit OFFSET :offset verwendet), wird das limit auf die Gesamtzahl der Stimmen und nicht der Wähler angewendet. Ich bin mir nicht zu 100 % sicher, ob das besser oder intuitiver ist.

Wie auch immer, ich bin neu hier und vielleicht denke ich zu viel nach. Die einfache Lösung entfernt doppelte Wähler und richtet nicht zu viel Schaden an, daher könnte sie der richtige Weg sein. Ich warte auf Input, bevor ich einen PR an das Haupt-Repository sende.

–

Nebenbei bemerkt, glaube ich, dass es in diesem Teil des Codes einen weiteren Fehler gibt. Die Abfrage zum Laden der Wähler ist nach Digest, Rang und Benutzername sortiert - aber beim Sortieren nach Rang wird diese Bedingung verwendet:

CASE WHEN rank = 'Abstain' THEN 1 ELSE CAST(rank AS integer) END

Allerdings entspricht 'Abstain' tatsächlich Rang 0 und nicht 1 - Rang 1 kann auch als '1' zurückgegeben werden. Dies macht die Sortierung potenziell nicht deterministisch über Abfragen hinweg, was bedeutet, dass es je nach Anzahl der Wähler und dem verwendeten limit-Wert möglich sein könnte, Wähler bei paginierten Abfragen tatsächlich zu übersehen. In meinen neuen Tests musste ich die zurückgegebenen Wähler sortieren, um die nicht-deterministische Natur zu umgehen. (Da sie nicht deterministisch ist, gehe ich davon aus, dass sie in einem Test nicht leicht reproduzierbar ist, aber ich kann es versuchen…)

clechasseur · 19. August 2025 um 01:12

Ich habe dem obigen Link zu einem früheren Bericht gefolgt, der einen Link zu einem früheren noch früheren Bericht enthält, der etwas enthält, das ebenfalls auf diese Möglichkeit hindeutet:

Das ist jedoch schon lange her, daher könnte der Code damals völlig anders gewesen sein. (Ich habe versucht, mit Git in der Zeit zurückzugehen, aber die Historie endete 2021, daher gehe ich davon aus, dass der Code irgendwann verschoben wurde.)

clechasseur · 20. August 2025 um 06:18

Nach einiger Experimentiererei konnte ich keinen Test erstellen, der die nicht-deterministische Reihenfolge zu einem Problem mit zurückgegebenen Wählern führte. Ich denke, das liegt an der Art und Weise, wie die Abfrage erstellt wird und wie die Umfragestimmen erzeugt werden, aber ich bin mir nicht zu 100 % sicher.

Ich habe einen PR mit meinem Test und den von mir vorgeschlagenen Korrekturen erstellt: FIX: Vermeiden Sie die Rückgabe doppelter Wähler vom Endpunkt /polls/voters.json von clechasseur · Pull Request #34433 · discourse/discourse

nat · 30. September 2025 um 07:06

Vielen Dank für die Korrektur und Ihre Geduld bei unserer Überprüfung.

Ich habe sie genehmigt und zusammengeführt.

nat · 4. Oktober 2025 um 00:00

Dieses Thema wurde nach 3 Tagen automatisch geschlossen. Neue Antworten sind nicht mehr möglich.

Thema		Antworten	Aufrufe
Polls don't show additional results when you click the arrow Bug	4	559	6. Juli 2021
Polls showing duplicate voters Bug	8	1021	20. Dezember 2018
Button to reveal more votes appends the same voters repeatedly Bug polls	0	61	1. Januar 2025
Migration Issue Around De-duping Poll Votes Bug polls	8	748	18. Juli 2023
Poll results page produces error messages Bug polls	8	1368	31. Januar 2017

/polls/voters.json gibt doppelte Benutzer über seitenweise Anfragen zurück

Verwandte Themen