Die Einbettung des Beitrags wird im discourse-ai plugin nicht ordnungsgemäß gekürzt

Wenn ich das OpenAI ADA Text Embedding-Modell für die Zuordnung verwandter Beiträge verwende, erhalte ich folgende Fehlermeldung:

OpenAI Embeddings fehlgeschlagen mit Status: 400 Body: { "error": { "message": "Die maximale Kontextlänge dieses Modells beträgt 8191 Token, jedoch haben Sie 19370 Token angefordert (19370 in Ihrer Eingabeaufforderung; 0 für die c
/var/www/discourse/plugins/discourse-ai/lib/shared/inference/openai_embeddings.rb:24:in `perform!'
/var/www/discourse/plugins/discourse-ai/lib/modules/embeddings/models/text_embedding_ada_002.rb:37:in `generate_embeddings'
/var/www/discourse/plugins/discourse-ai/lib/modules/embeddings/manager.rb:22:in `generate!'
/var/www/discourse/plugins/discourse-ai/lib/modules/embeddings/jobs/regular/generate_embeddings.rb:14:in `execute'
/var/www/discourse/app/jobs/base.rb:292:in `block (2 levels) in perform'
/var/www/discourse/lib/rails_multisite/connection_management.rb:82:in `with_connection'
/var/www/discourse/app/jobs/base.rb:279:in `block in perform'
/var/www/discourse/app/jobs/base.rb:275:in `each'
/var/www/discourse/app/jobs/base.rb:275:in `perform'
sidekiq-6.5.9/lib/sidekiq/processor.rb:202:in `execute_job'
sidekiq-6.5.9/lib/sidekiq/processor.rb:170:in `block (2 levels) in process'
sidekiq-6.5.9/lib/sidekiq/middleware/chain.rb:177:in `block in invoke'
/var/www/discourse/lib/sidekiq/pausable.rb:134:in `call'
sidekiq-6.5.9/lib/sidekiq/middleware/chain.rb:179:in `block in invoke'
sidekiq-6.5.9/lib/sidekiq/middleware/chain.rb:182:in `invoke'
sidekiq-6.5.9/lib/sidekiq/processor.rb:169:in `block in process'
sidekiq-6.5.9/lib/sidekiq/processor.rb:136:in `block (6 levels) in dispatch'
sidekiq-6.5.9/lib/sidekiq/job_retry.rb:113:in `local'
sidekiq-6.5.9/lib/sidekiq/processor.rb:135:in `block (5 levels) in dispatch'
sidekiq-6.5.9/lib/sidekiq.rb:44:in `block in <module:Sidekiq>'
sidekiq-6.5.9/lib/sidekiq/processor.rb:131:in `block (4 levels) in dispatch'
sidekiq-6.5.9/lib/sidekiq/processor.rb:263:in `stats'
sidekiq-6.5.9/lib/sidekiq/processor.rb:126:in `block (3 levels) in dispatch'
sidekiq-6.5.9/lib/sidekiq/job_logger.rb:13:in `call'
sidekiq-6.5.9/lib/sidekiq/processor.rb:125:in `block (2 levels) in dispatch'
sidekiq-6.5.9/lib/sidekiq/job_retry.rb:80:in `global'
sidekiq-6.5.9/lib/sidekiq/processor.rb:124:in `block in dispatch'
sidekiq-6.5.9/lib/sidekiq/job_logger.rb:39:in `prepare'
sidekiq-6.5.9/lib/sidekiq/processor.rb:123:in `dispatch'
sidekiq-6.5.9/lib/sidekiq/processor.rb:168:in `process'
sidekiq-6.5.9/lib/sidekiq/processor.rb:78:in `process_one'
sidekiq-6.5.9/lib/sidekiq/processor.rb:68:in `run'
sidekiq-6.5.9/lib/sidekiq/component.rb:8:in `watchdog'
sidekiq-6.5.9/lib/sidekiq/component.rb:17:in `block in safe_thread'

Vielleicht muss der Beitrag gekürzt werden.

4 „Gefällt mir“

Danke für die Meldung, wir werden uns das ansehen.

Glücklicherweise haben wir eine Methode, die eine Sammlung von Wörtern bis zu einer sehr spezifischen Token-Anzahl kürzen kann.

4 „Gefällt mir“

Schön! Danke.

1 „Gefällt mir“

Ich glaube, das ist jetzt behoben gemäß:

6 „Gefällt mir“

Verstanden. :+1: :muscle:

3 „Gefällt mir“

Dieses Thema wurde nach 3 Tagen automatisch geschlossen. Neue Antworten sind nicht mehr möglich.