GPT 3.5 turbo todavía no funciona para informes periódicos de IA

Hola chicos, he actualizado mi plugin, pero GPT 3.5 turbo todavía no funciona

Mensaje (se informaron 3 copias)

Error al ejecutar el informe LLM! : DiscourseAi::Completions::Llm::UNKNOWN_MODEL : DiscourseAi::Completions::Llm::UNKNOWN_MODEL

Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/dialects/dialect.rb:27:in `dialect_for'
/var/www/discourse/plugins/discourse-ai/lib/completions/llm.rb:64:in `proxy'
/var/www/discourse/plugins/discourse-ai/lib/automation/report_runner.rb:67:in `initialize'
/var/www/discourse/plugins/discourse-ai/lib/automation/report_runner.rb:33:in `new'
/var/www/discourse/plugins/discourse-ai/lib/automation/report_runner.rb:33:in `run!'
/var/www/discourse/plugins/discourse-ai/discourse_automation/llm_report.rb:75:in `block (2 levels) in <main>'
/var/www/discourse/plugins/discourse-automation/app/models/discourse_automation/automation.rb:135:in `trigger!'
/var/www/discourse/plugins/discourse-automation/app/jobs/regular/discourse_automation_trigger.rb:13:in `execute'
/var/www/discourse/app/jobs/base.rb:297:in `block (2 levels) in perform'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rails_multisite-5.0.0/lib/rails_multisite/connection_management.rb:82:in `with_connection'
1 me gusta

Hola @whitewaterdeu :wave: - Sospecho que tu script de automatización podría seguir usando el nombre de modelo incorrecto (gpt-3-5-turbo). ¿Te importaría actualizar el nombre del modelo en la configuración del script a gpt-3.5-turbo?

gracias :kissing_heart:, lo he cambiado a gpt-3.5-turbo y funcionó, pero apareció otro error

parece que necesito reducir los tokens enviados a openai, pero no sé cómo hacerlo

Mensaje

DiscourseAi::Completions::Endpoints::OpenAi: estado: 400 - cuerpo: {
  "error": {
    "message": "La longitud máxima de contexto de este modelo es de 4097 tokens. Sin embargo, tus mensajes resultaron en 5605 tokens. Por favor, reduce la longitud de los mensajes.",
    "type": "invalid_request_error",
    "param": "messages",
    "code": "context_length_exceeded"
  }
}


Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:91:in `block (2 levels) in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2353:in `block in transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http/response.rb:320:in `reading_body'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2352:in `transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2306:in `request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.0/lib/patches/net_patches.rb:19:in `block in request_with_mini_profiler'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.0/lib/mini_profiler/profiling_methods.rb:50:in `step'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.0/lib/patches/net_patches.rb:18:in `request_with_mini_profiler'
/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:89:in `block in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:1570:in `start'

No puedes hacer eso. Deberíamos recortar automáticamente el contenido para que quepa en la ventana de contexto. Debe ser un error en nuestro código.

Mientras solucionamos este problema, podrías cambiar a gpt-4, que tiene el doble de ventana de contexto.

3 Me gusta

Cerrando por estar obsoleto, GPT-3.5 ya no debe usarse, la gran mayoría de los modelos ahora se envían con una ventana de contexto muy grande.