Aviso de incorporação `input must have less than 8192 tokens` com discourse ai

whitewaterdeu · Novembro 1, 2025, 1:53am

Existe alguma ferramenta para dividir o texto de entrada em pedaços?
ou qual API de embedding suporta mais de 8192 tokens?

Mensagem (15 cópias relatadas)

OpenAI Embeddings falhou com status: 413 body: {"code":20042,"message":"input must have less than 8192 tokens","data":null}

Backtrace

/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:218:in `block in dispatch'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:217:in `map'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:217:in `dispatch'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:129:in `warn'
/var/www/discourse/plugins/discourse-ai/lib/inference/open_ai_embeddings.rb:34:in `perform!'
/var/www/discourse/plugins/discourse-ai/lib/embeddings/vector.rb:45:in `block (2 levels) in gen_bulk_reprensentations'
/var/www/discourse/lib/scheduler/thread_pool.rb:118:in `block (2 levels) in wrap_block'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rails_multisite-7.0.0/lib/rails_multisite/connection_management/null_instance.rb:49:in `with_connection'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rails_multisite-7.0.0/lib/rails_multisite/connection_management.rb:17:in `with_connection'
/var/www/discourse/lib/scheduler/thread_pool.rb:118:in `block in wrap_block'
/var/www/discourse/lib/scheduler/thread_pool.rb:163:in `thread_loop'
/var/www/discourse/lib/scheduler/thread_pool.rb:174:in `block in spawn_thread'

Falco · Novembro 1, 2025, 3:39am

Se você auto-hospedar o mesmo modelo, ele pode consumir até 32 mil tokens.

Se isso estiver fora de questão, você precisará configurar o modelo de embeddings para limitar as entradas ao máximo permitido pelo seu provedor. Dessa forma, nosso AI Bot RAG dividirá os arquivos carregados em blocos, e o Tópico Relacionado / Pesquisa consumirá apenas os primeiros 8192 tokens de cada tópico.

whitewaterdeu · Novembro 2, 2025, 2:56am

como configurar o modelo de incorporação? no discourse? ou provedor de modelo?

whitewaterdeu · Novembro 2, 2025, 12:44pm

Tenho certeza de que Qwen/Qwen3-Embedding-0.6B suporta até 32k tokens
e configurei o comprimento da sequência para 32k

mas ainda há muitos erros de embedding

Falco · Novembro 2, 2025, 5:08pm

Ele suporta se seus provedores de API permitirem.

Se o seu provedor de API o limitar a 8192, você terá que seguir as regras deles.

whitewaterdeu · Novembro 3, 2025, 8:10am

ok, estou perguntando ao provedor da API

Tópico		Respostas	Visualizações
Embedding of post is not being properly truncated in discourse-ai plugin Bug ai	5	407	20 de Agosto de 2023
Ai:embeddings:backfill - Handling OpenAI's 400 Error for Excessive Tokens in Embeddings Bug ai	10	867	15 de Março de 2024
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	191	19 de Março de 2025
Gemini API Embedding Configuration Clarification Support ai	4	114	15 de Novembro de 2025
Something bad with embeddings (related topics getting too costly) Bug ai , related-topics	21	188	5 de Janeiro de 2025

Aviso de incorporação `input must have less than 8192 tokens` com discourse ai

Tópicos relacionados