Fehler bei der Verwendung von Claude 3.7 Sonnet mit Discourse AI-Plugin

emansilla · 26. Februar 2025 um 13:46

Hallo,

Ich versuche, Claude 3.7 Sonnet mit der Forum-Helfer-Persona und mit benutzerdefinierten Personas zu verwenden, und erhalte die untenstehende Fehlermeldung. Ich habe die neueste Version von Discourse und das neueste Plugin für Discourse AI. Die Schritte zur Reproduktion sind einfach: Stellen Sie dem Bot eine Frage, und er wird eine Tool-Nutzung wie Suche, Kategorie oder Lesen durchführen, danach erhalte ich den Fehler. Das LLM ist mit aktiviertem Reasoning und 1024 Tokens für Reasoning konfiguriert. Können Sie bitte bestätigen, ob dies ein Fehler ist oder ob in meiner Konfiguration etwas fehlt? Vielen Dank!

{“type”:“error”,“error”:{“type”:“invalid_request_error”,“message”:“messages.1.content.0.type: Erwartet thinkingoderredacted_thinking, aber tool_usegefunden. Wennthinkingaktiviert ist, muss eine letzteassistant-Nachricht mit einem Denkblock beginnen (vor den letzten tool_use- und tool_result-Blöcken). Wir empfehlen, Denkblöcke aus früheren Turns einzuschließen. Um diese Anforderung zu umgehen, deaktivieren Sie thinking. Bitte konsultieren Sie unsere Dokumentation unter [Building with extended thinking - Anthropic](https://docs.anthropic.com/en/docs/build-with-claude/extended-thinking)”}}

Falco · 26. Februar 2025 um 13:48

Haben Sie Discourse in den letzten 24 Stunden aktualisiert? Wenn nicht, müssen Sie aktualisieren, um Unterstützung für dieses neue Modell zu erhalten.

emansilla · 26. Februar 2025 um 13:50

Ja, ich habe gestern Nachmittag ein Update durchgeführt. Ich habe das Update über die vollständige Unterstützung für Claude Sonnet 3.7 gesehen.

Falco · 26. Februar 2025 um 14:05

Ich habe den KI-Bot gerade mit dieser Konfiguration getestet und er funktioniert einwandfrei

emansilla · 26. Februar 2025 um 14:27

Vielen Dank für Ihre Hilfe. Ich habe dieselben Einstellungen verwendet, und der Fehler besteht weiterhin.

Nachfolgend sind meine Einstellungen:

Ich habe die neueste Version von allem:

Nachfolgend sind die Debug-Eingabe und -Ausgabe (leicht redigiert zum Schutz der Privatsphäre):

EINGABE (Seite 1):

Anfragetokens: 1482
Antworttokens: 202
Modell: claude-3-7-sonnet-20250219
max_tokens: 38192
denken:
typ: aktiviert
budget_tokens: 8192
Nachrichten:
0:
Rolle: Benutzer
Inhalt: XXXXX: Prüfen Sie, ob diese Anzeige alle Richtlinien von XXXXX erfüllt.

XXXXX

System: Sie sind ein hilfreicher Discourse-Assistent.
Sie _verstehen_ und **generieren** Discourse-Markdown.
Sie leben in einer Discourse-Forum-Nachricht.

Sie leben im Forum mit der URL: https://XXXXX
Der Titel Ihrer Site: XXXXX
Die Beschreibung lautet: XXXXX
Die Teilnehmer an diesem Gespräch sind: XXXXX, XXXXX
Das aktuelle Datum ist: 2025-02-26 14:08:13 UTC, seit Ihrem Training hat sich viel geändert.

Sie wurden mit ALTEN Daten trainiert; verlassen Sie sich bei der Suche auf aktuelle Informationen über dieses Forum.
Versuchen Sie bei der Suche, Suchbegriffe zu VEREINFACHEN.
Die Discourse-Suche verknüpft alle Begriffe mit AND. Reduzieren und vereinfachen Sie Begriffe, um mehr Ergebnisse zu finden.
stream: true
Werkzeuge:
0:
Name: Kategorien
Beschreibung: Listet die Kategorien der aktuellen Discourse-Instanz auf; formatieren Sie sie bevorzugt mit einem # vor dem Kategoriennamen.
input_schema:
typ: Objekt
eigenschaften:
erforderlich:
1:
Name: Suche
Beschreibung: Sucht nach Themen in der aktuellen Discourse-Instanz; verlinken Sie bei der Darstellung bevorzugt auf die gefundenen Themen.
input_schema:
typ: Objekt
eigenschaften:
search_query:
typ: String
Beschreibung: Spezifische Schlüsselwörter, nach denen gesucht werden soll, durch Leerzeichen getrennt (falsche Rechtschreibung korrigieren, Verbindungswörter entfernen).
Benutzer:
typ: String
Beschreibung: Suchergebnisse auf diesen Benutzernamen filtern (nur einschließen, wenn der Benutzer ausdrücklich nach Benutzer filtern möchte).
Reihenfolge:
typ: String
Beschreibung: Reihenfolge der Suchergebnisse
Enum:
0: Neueste
1: Neuestes Thema
2: Älteste
3: Aufrufe
4: Gefällt-mir
Limit:
typ: Integer
Beschreibung: Anzahl der zurückgegebenen Ergebnisse begrenzen (im Allgemeinen besser beim Standardwert bleiben).
max_posts:
typ: Integer
Beschreibung: Maximale Anzahl von Beiträgen in den Themen (Themen, bei denen viele Leute gepostet haben).
Tags:
typ: String
Beschreibung: Liste der zu durchsuchenden Tags. Verwenden Sie + für ODER und , für UND.
Kategorie:
typ: String
Beschreibung: Kategoriename zum Filtern.
Vorher:
typ: String
Beschreibung: Nur Themen, die vor einem bestimmten Datum YYYY-MM-DD erstellt wurden.
Nachher:
typ: String
Beschreibung: Nur Themen, die nach einem bestimmten Datum YYYY-MM-DD erstellt wurden.
Status:
typ: String
Beschreibung: Suche nach Themen in einem bestimmten Zustand.
Enum:
0: Offen
1: Geschlossen
2: Archiviert
3: Keine Antworten
4: Einzelner Benutzer
erforderlich:
2:
Name: Lesen
Beschreibung: Liest ein Thema oder einen Beitrag in dieser Discourse-Instanz.
input_schema:
typ: Objekt
eigenschaften:
topic_id:
typ: Integer
Beschreibung: Die ID des zu lesenden Themas.
post_numbers:
typ: Array
Beschreibung: Die zu lesenden Beitragsnummern (optional).
Items:
typ: Integer
erforderlich:
0: topic_id
3:
Name: Tags
Beschreibung: Listet die 100 beliebtesten Tags der aktuellen Discourse-Instanz auf.
input_schema:
typ: Objekt
eigenschaften:
erforderlich:

EINGABE (Seite 2):

Anfragetokens: 778
Antworttokens: 450
Modell: claude-3-7-sonnet-20250219
max_tokens: 38192
denken:
typ: aktiviert
budget_tokens: 8192
Nachrichten:
0:
Rolle: Benutzer
Inhalt: Gegeben ist das folgende Gespräch:

{{{
Benutzer sagte:
Prüfen Sie, ob diese Anzeige alle Richtlinien von XXXX erfüllt.

XXXX

Modell sagte:
Um zu prüfen, ob diese Anzeige alle Richtlinien von XXXX erfüllt, muss ich die geltenden Richtlinien im System konsultieren. Ich werde nach Informationen zu den Richtlinien für die Veröffentlichung von Stellenanzeigen suchen.

<details>
<summary>Suchen</summary>
<p>Es wurden 53 <a href='/search?q=politicas+publicacion+anuncios+ofertas+laborales'>Ergebnisse</a> für 'politicas publicacion anuncios ofertas laborales' gefunden</p>
</details>
<span></span>



Es tut uns leid, aber unser System ist beim Versuch, zu antworten, auf ein unerwartetes Problem gestoßen.

[details='Fehlerdetails']
{"type":"error","error":{"type":"invalid_request_error","message":"messages.1.content.0.type: Expected `thinking` or `redacted_thinking`, but found `tool_use`. When `thinking` is enabled, a final `assistant` message must start with a thinking block (preceeding the lastmost set of `tool_use` and `tool_result` blocks). We recommend you include thinking blocks from previous turns. To avoid this requirement, disable `thinking`. Please consult our documentation at https://docs.anthropic.com/en/docs/build-with-claude/extended-thinking"}}
[/details]


}}}

Antworten Sie ausschließlich mit einem Titel von maximal 7 Wörtern.
System: Sie sind titlebot. Gegeben ein Gespräch, schlagen Sie einen Titel vor.

- Sie antworten niemals mit etwas anderem als dem vorgeschlagenen Titel.
- Sie passen die Sprache Ihres Titels immer der Gesprächssprache an.
- Der Titel erfasst das Wesentliche des Gesprächs.

EINGABE (Seite 3):

Anfragetokens: 925
Antworttokens: 154
Modell: gpt-4o-mini
Nachrichten:
0:
Rolle: System
Inhalt: Sie sind ein fortschrittlicher Zusammenfassungsbot, der prägnante, kohärente Zusammenfassungen bereitgestellter Texte erstellt.

- Fügen Sie nur die Zusammenfassung hinzu, ohne zusätzliche Kommentare.
- Sie verstehen und generieren Discourse-Forum-Markdown; einschließlich Links, _Kursiv_ und **Fett**.
- Behalten Sie die Originalsprache des zusammenzufassenden Textes bei.
- Streben Sie Zusammenfassungen von maximal 400 Wörtern an.
- Jeder Beitrag ist im Format "<BEITRAGSNUMMER>) <BENUTZERNAME> <NACHRICHT>" formatiert.
- Zitieren Sie spezifische bemerkenswerte Beiträge im Format [BESCHREIBUNG](/t/-/1488/BEITRAGSNUMMER).
- Beispiel: Links zu den 3. und 6. Beiträgen von sam: sam ([#3](/t/-/1488/3), [#6](/t/-/1488/6)).
- Beispiel: Link zum 6. Beitrag von jane: [zugestimmt](/t/-/1488/6).
- Beispiel: Link zum 13. Beitrag von joe: [joe](/t/-/1488/13).
- Formatieren Sie Benutzernamen entweder als @BENUTZERNAME oder [BENUTZERNAME](/t/-/1488/BEITRAGSNUMMER).
1:
Rolle: Benutzer
Inhalt: Hier sind die Beiträge innerhalb der XML-Tags <input></input>:

<input>1) Benutzer1 sagte: Ich liebe Montags 2) Benutzer2 sagte: Ich hasse Montags</input>

Erstellen Sie eine prägnante, kohärente Zusammenfassung des obigen Textes unter Beibehaltung der Originalsprache.
2:
Rolle: Assistent
Inhalt: Zwei Benutzer teilen ihre Gefühle gegenüber Montagen. [Benutzer1](/t/-/1488/1) hasst sie, während [Benutzer2](/t/-/1488/2) sie liebt.
3:
Rolle: Benutzer
Inhalt: Der Titel der Diskussion lautet: Überprüfung einer Stellenanzeige XXXXX.

Hier sind die Beiträge innerhalb der XML-Tags <input></input>:

<input>
(1 XXXXX sagte: XXXXX (2 XXXXX sagte: Um zu prüfen, ob diese Anzeige alle Richtlinien von XXXXX erfüllt, muss ich die geltenden Richtlinien im System konsultieren. Ich werde nach Informationen zu den Richtlinien für die Veröffentlichung von Stellenanzeigen suchen.

<details>
<summary>Suchen</summary>
<p>Es wurden 53 <a href='/search?q=politicas+publicacion+anuncios+ofertas+laborales'>Ergebnisse</a> für 'politicas publicacion anuncios ofertas laborales' gefunden</p>
</details>
<span></span>



Es tut uns leid, aber unser System ist beim Versuch, zu antworten, auf ein unerwartetes Problem gestoßen.

[details='Fehlerdetails']
{"type":"error","error":{"type":"invalid_request_error","message":"messages.1.content.0.type: Expected `thinking` or `redacted_thinking`, but found `tool_use`. When `thinking` is enabled, a final `assistant` message must start with a thinking block (preceeding the lastmost set of `tool_use` and `tool_result` blocks). We recommend you include thinking blocks from previous turns. To avoid this requirement, disable `thinking`. Please consult our documentation at https://docs.anthropic.com/en/docs/build-with-claude/extended-thinking"}}
[/details]
</input>

Erstellen Sie eine prägnante, kohärente Zusammenfassung des obigen Textes unter Beibehaltung der Originalsprache.

AUSGABE:

Anfragetokens: 1482
Antworttokens: 202
event: message_start
data: {"type":"message_start","message":{"id":"msg_017uvsRAvCrkin8deo7KfSJt","type":"message","role":"assistant","model":"claude-3-7-sonnet-20250219","content":[],"stop_reason":null,"stop_sequence":null,"usage":{"input_tokens":1482,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":3} }

event: content_block_start
data: {"type":"content_block_start","index":0,"content_block":{"type":"thinking","thinking":"","signature":""} }

event: ping
data: {"type": "ping"}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":"Ich muss"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":"diese Stellenanzeige überprüfen, um sicherzustellen,"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" dass sie den"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" XXXXX-Richtlinien entspricht,"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" abgesehen von der Anforderung zur Transparenz des Unter"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":"nehmensnamens. Um dies effektiv zu tun"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":", sollte ich zunächst nach Informationen"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" über XXXXX-Richtlinien für"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" Stellenanzeigen suchen."} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":"\n\nLassen Sie mich nach Informationen"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" über die Richtlinien oder Leitlinien für Stellenanzeigen"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":" auf der XXXXX-Plattform"} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"thinking_delta","thinking":"."} }

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"signature_delta","signature":"EuYBCkQYAiJAV6gVRVTK/ffuBAUV445vA+2ceuLiwxoP8zp1cUlPnNePLQ/PPDz25BQ9d0GyvgP2mxXVoibY8Y5fF0Y5ZXaR9BIM6B73OywtDTgvsnqpGgyLjAssqp2Lfyq3ucoiMKGlt32Bdl4/9lUWS3bXwPB2GCUeMUkgbKxJGzUF2CN+oVd/2RSSz5hzJynbKEiUbypQd1OjBx+f5vzMznA6drsgbFxUT3yzYzqBxpIWr8x7O8t8v63gcZw/mo3lIJrMSrAbVWL4bxXKe9cEq8LcG3DxffOSmsowGfeoKnAzkvsJus0="} }

event: content_block_stop
data: {"type":"content_block_stop","index":0 }

event: content_block_start
data: {"type":"content_block_start","index":1,"content_block":{"type":"text","text":""} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":"Um zu prüfen, ob diese Anzeige alle"} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":"Richtlinien von XXXXX "} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":"XXXXX erfüllt, muss ich die"} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":"geltenden Richtlinien im System konsultieren. Ich werde nach"} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":" Informationen über die Richtlinien für die Veröffentlichung"} }

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"text_delta","text":" von Stellenanzeigen suchen."} }

event: content_block_stop
data: {"type":"content_block_stop","index":1}

event: content_block_start
data: {"type":"content_block_start","index":2,"content_block":{"type":"tool_use","id":"toolu_01JwNffkhK6d1LPtcbNHRtry","name":"search","input":{}} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":""} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"{\"search_q"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"uer"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"y\": \"po"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"lit"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"ic"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"as publicac"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"ion anun"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"cios "} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"ofertas labo"} }

event: content_block_delta
data: {"type":"content_block_delta","index":2,"delta":{"type":"input_json_delta","partial_json":"rales\"}"}}

event: content_block_stop
data: {"type":"content_block_stop","index":2 }

event: message_delta
data: {"type":"message_delta","delta":{"stop_reason":"tool_use","stop_sequence":null},"usage":{"output_tokens":202} }

event: message_stop
data: {"type":"message_stop" }

Falco · 26. Februar 2025 um 15:02

Ich verstehe, das Problem ist die Vermischung von Denken und der Nutzung nativer Tools in der offiziellen Anthropic API.

emansilla · 26. Februar 2025 um 19:05

Stimmt, wenn ich die native Tool-Unterstützung in den LLM-Einstellungen deaktiviere, funktioniert es.

sam · 26. Februar 2025 um 19:56

Danke, ich werde es mir ansehen, muss herausfinden, wie man die Denkblöcke spart, wir geben sie im Moment nicht zurück, wir werden einige Änderungen benötigen

Reduzierte Denkblöcke sind extra verwirrend

sam · 4. März 2025 um 02:41

Das Denken ist behoben unter:

github.com/discourse/discourse-ai

FEATURE: implement thinking token support (#1155)

committed 01:22AM - 04 Mar 25 UTC

SamSaffron

+957 -144

adds support for "thinking tokens" - a feature that exposes the model's reasonin…g process before providing the final response. Key improvements include: - Add a new Thinking class to handle thinking content from LLMs - Modify endpoints (Claude, AWS Bedrock) to handle thinking output - Update AI bot to display thinking in collapsible details section - Fix SEARCH/REPLACE blocks to support empty replacement strings and general improvements to artifact editing - Allow configurable temperature in triage and report automations - Various bug fixes and improvements to diff parsing

Es ist eine sehr komplexe Änderung, das Protokoll von Anthropic ist nicht einfach zu befolgen, man muss Denkblöcke mit sich herumtragen.

Lass mich wissen, wie es dir geht.

emansilla · 5. März 2025 um 19:33

Vielen Dank für die Fehlerbehebung. Ich habe ein paar Tests durchgeführt und es funktioniert jetzt. Mir ist aufgefallen, dass die Token-Nutzung mit Claude 3.7 Sonnet viel höher ist und viele Male meine Tier 3-Limits von 80.000 Tokens pro Minute erreicht. Ich stoße selbst mit diesen restriktiven Einstellungen an die Grenze:

{“type”:“error”,“error”:{“type”:“rate_limit_error”,“message”:“Diese Anfrage würde das Ratenlimit für Ihre Organisation (86982fb5-12e6-4c93-be7a-4e51d63d1bf3) von 80.000 Eingabe-Tokens pro Minute überschreiten. Weitere Details finden Sie unter: Ratenlimits - Anthropic. Sie können die Antwort-Header für die aktuelle Nutzung einsehen. Bitte reduzieren Sie die Prompt-Länge oder die maximal angeforderten Tokens oder versuchen Sie es später erneut. Sie können sich auch an den Vertrieb unter https://www.anthropic.com/contact-sales wenden, um Ihre Optionen für eine Erhöhung des Ratenlimits zu besprechen.”}}

sam · 5. März 2025 um 20:37

Ich glaube, Anthropic hat im Moment Skalierungsprobleme mit 3.7, gestern gab es eine Störung und generell kann die API leistungsmäßig ziemlich ungleichmäßig sein.

Ich empfehle, ihnen ein paar Wochen Zeit zu geben, damit sie die Probleme ausbügeln können.

Außerdem denke ich darüber nach, Token-Caching hinzuzufügen, zumindest für den Chat, mal sehen, ob ich das hinbekomme.

sam · 9. März 2025 um 21:00

Dieses Thema wurde nach 5 Tagen automatisch geschlossen. Neue Antworten sind nicht mehr möglich.

Thema		Antworten	Aufrufe
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	616	22. März 2024
Discourse AI: Need to Remove JSON Response to get Antrophic Sonnet 5-working in e.g. semantic search Support ai	3	104	9. Juli 2026
Discourse AI - AI bot Site Management how-to , ai , ai-bot	49	18127	1. März 2026
Claude 3.5 Sonnet in Discourse AI? Support ai	11	643	4. Juli 2024
Support for AI Bot to Configure for a Support the community forum with latest version of Discourse Support ai	19	485	4. Dezember 2025

Fehler bei der Verwendung von Claude 3.7 Sonnet mit Discourse AI-Plugin

Verwandte Themen