Página de configuraciones de Discourse AI - Large Language Model (LLM)

Discourse · 2 Agosto, 2024 21:28

Esta guía cubre la página de configuración de LLM, que forma parte del plugin Discourse AI.

Nivel de usuario requerido: Administrador

La página de configuración dedicada está diseñada para tener todo lo relacionado con los Modelos de Lenguaje Grandes (LLM) utilizados para las funciones de IA de Discourse en un solo lugar.

Dependiendo de la función de IA de Discourse habilitada, se podría necesitar un LLM. Por favor, revise cada función de IA de Discourse para saber si un LLM es un prerrequisito.

CleanShot 2024-08-02 at 15.06.50@2x2532×1686 284 KB

CleanShot 2024-08-02 at 15.07.09@2x1550×1592 176 KB

Funciones

Añadir nuevos modelos, con información prellenada

Añadir modelos personalizados no mencionados

Configurar ajustes de LLM

Permitir el uso específico de LLM para el Bot de IA

Ver el nombre de usuario del Bot de IA

Habilitar el soporte de visión (dependiente del modelo)

Configurar tipos de archivo adjunto permitidos

Configurar cuotas de uso por grupo

Rastrear los costes de tokens de entrada/salida

Probar

Guardar configuraciones

Añadir conexiones de LLM

Ir a Administración → Plugins → IA

Ir a la pestaña LLMs

Añadir una nueva conexión, elegir su modelo

Introducir la clave de API (dependiendo del modelo, puede que tenga más campos para introducir manualmente) y guardar

(Opcional) Probar su conexión para asegurarse de que funciona

LLMs Soportados

Siempre puede añadir una opción personalizada si no ve su modelo listado. Se añaden continuamente modelos soportados. Los modelos preconfigurados son plantillas; siempre puede lograr el mismo resultado usando la “Configuración manual”.

Anthropic

Claude Opus 4.6

Claude Sonnet 4.6

Claude Haiku 4.5

Google

Gemini 3 Pro

Gemini 3 Flash

OpenAI

GPT-5.4

GPT-5 Mini

GPT-5 Nano

Open Router

DeepSeek V3.2

Moonshot Kimi K2.5

xAI Grok 4 Fast

MiniMax M2.5

Z-AI GLM-5

… y muchos más

Además, los clientes alojados pueden usar el LLM Pequeño Alojado de CDCK preconfigurado en la página de configuración. Este es un LLM de pesos abiertos alojado por Discourse, listo para usarse para potenciar las funciones de IA.

Campos de Configuración

Solo verá los campos relevantes para su proveedor de LLM seleccionado. Por favor, verifique dos veces cualquiera de los campos pre-rellenados con el proveedor apropiado, como el Nombre del modelo

Campos principales:

Nombre de visualización — el nombre amigable que se muestra en los menús desplegables

Nombre del modelo — el identificador del modelo enviado a la API (ej. claude-sonnet-4-6, gpt-5.2)

Proveedor — el servicio que aloja el modelo (ej. Anthropic, OpenAI, Google, AWS Bedrock, Azure, Open Router, etc.)

URL — la URL del endpoint de la API (no se muestra para AWS Bedrock)

Clave de API — configurada a través del sistema de Secretos de IA

Tokenizador

Tokens máximos de prompt — controla el recorte del prompt para evitar solicitudes de tamaño excesivo

Tokens máximos de salida

Coste de entrada / Coste de salida — coste por millón de tokens, utilizado para el seguimiento del uso

Coste de entrada en caché / Coste de escritura en caché — para proveedores que soportan el almacenamiento en caché del prompt

Visión habilitada — habilita la comprensión de imágenes (dependiente del modelo)

Tipos de archivo adjunto permitidos — tipos de archivo que el modelo puede procesar

Campos específicos del proveedor (mostrados dinámicamente según el proveedor seleccionado):

AWS Bedrock: ID de clave de acceso, ARN de rol, Región, opciones de razonamiento/pensamiento, Almacenamiento en caché de prompt

Anthropic: opciones de razonamiento, Almacenamiento en caché de prompt

OpenAI: ID de organización, Esfuerzo de razonamiento, Nivel de servicio

Google: Habilitar pensamiento, Nivel de pensamiento

Open Router: Orden del proveedor, Cuantificaciones del proveedor

Cuotas (disponibles después de guardar inicialmente):

Se pueden configurar cuotas de uso por grupo con tokens máximos, usos máximos y duración

Preguntas Frecuentes Técnicas

¿Qué es el tokenizador?

El tokenizador traduce cadenas de texto a tokens, que es lo que un modelo utiliza para comprender la entrada.

¿Qué número debo usar para Tokens máximos de prompt?

Una buena regla general es el 50% de la ventana de contexto del modelo, que es la suma de cuántos tokens envía y cuántos tokens generan. Si el prompt se vuelve demasiado grande, la solicitud fallará. Ese número se utiliza para recortar el prompt y evitar que eso suceda.

Advertencias

A veces es posible que no vea el modelo que quería usar listado. Aunque puede añadirlos manualmente, soportaremos los modelos populares a medida que salgan.

qianping_chen · 30 Septiembre, 2024 17:16

Es demasiado difícil, no sé cómo hacerlo. Espero que actualicen tutoriales específicos sobre varias IA, como la configuración de inicio de sesión de Google.

sam · 1 Octubre, 2024 05:40

Hemos mejorado mucho la interfaz de usuario en la última semana, ¿puedes probarla de nuevo?

hameedacpa · 24 Febrero, 2025 17:08

¿Cuándo será compatible con Gemini 2.0?

sam · 24 Febrero, 2025 21:58

Ha sido apoyado durante bastante tiempo.

Joe_F · 11 Marzo, 2025 13:21

Parece que tengo un problema donde no puedo seleccionar un LLM aunque tengo los configurados en los alojados por CDCK..

¿esto es normal?

sam · 12 Marzo, 2025 00:17

Aquí hay mucho que desempacar, ¿qué LLM intentas elegir y para qué?

Los LLM de CDCK solo están disponibles para características muy específicas; para ver cuáles necesitas, dirígete a /admin/whats-new en tu instancia y haz clic en “mostrar solo características experimentales”, deberás habilitarlas para desbloquear el LLM de CDCK en características específicas.

Cualquier LLM que definas fuera de los LLM de CDCK está disponible para todas las características.

AquaL1te · 12 Marzo, 2025 09:13

¿También hay un tema que ofrezca un resumen general del mejor equilibrio entre costo y calidad? ¿O incluso qué LLM se puede usar de forma gratuita para una pequeña comunidad y funcionalidad básica? Puedo profundizar en los detalles y experimentar. Pero tengo un poco de prisa.

Por ejemplo, solo me preocupa la detección de spam y un filtro de lenguaje inapropiado. Tenía esto gratis, pero esos complementos están obsoletos o pronto lo estarán. Sería bueno si pudiera conservar esta funcionalidad sin tener que pagar por un LLM.

Saif · 12 Marzo, 2025 19:20

Tenemos este tema, que podría ser lo que buscas.

AquaL1te · 25 Marzo, 2025 09:36

¡Hecho! De hecho, fue bastante fácil. Pero tal vez para alguien no técnico todavía sea un poco difícil de configurar. Por ejemplo, el nombre del modelo se estableció automáticamente en la configuración, pero no era el correcto. Por suerte, reconocí el nombre del modelo en un ejemplo de curl para Claude en la página de la API y entonces funcionó

Los costos estimados son tal vez 30 céntimos de euro por mes para el control de spam (no tengo un foro enorme). ¡Así que es manejable! He establecido un límite de 5 euros en la consola de la API, por si acaso.

Saif · 25 Marzo, 2025 16:16

¿Cuál elegiste para Claude? ¿Cuál fue el nombre incorrecto que se mostró y a qué lo corregiste?

AquaL1te · 26 Marzo, 2025 09:31

Utilizo Claude 3.5, el ID del modelo por defecto es claude-3-5-haiku, pero tuve que cambiarlo a claude-3-5-haiku-20241022, de lo contrario, recibía un error.

Saif · 26 Marzo, 2025 15:49

Bueno tenerlo en cuenta, sí, a veces puede haber una desconexión. La información autocompletada debería servir de guía, lo que tiende a funcionar la mayor parte del tiempo, pero falla en ciertos casos como el tuyo (dadas todas las diferentes configuraciones de modelos y proveedores).

He actualizado la publicación principal de esta guía.

jrgong · 11 Abril, 2025 11:20

Este modelo no está listado en 3.4.2. ¿Esas preconfiguraciones solo están disponibles en 3.5 y tengo que agregarlas manualmente?

Editar: Además, ¿qué opción debo elegir para “Tokenizer” al usar modelos Grok 3?

Falco · 11 Abril, 2025 17:15

Las preconfiguraciones son simplemente plantillas, puedes obtener el mismo resultado final utilizando la “Configuración manual”.

He descubierto que el tokenizador de Gemini está bastante cerca del de Grok, así que prueba con ese.

CraigW · 24 Julio, 2025 22:52

¿Hay alguna forma de utilizar IBM WatsonX a través de la configuración de gestión actual, o esto requeriría trabajo de desarrollo adicional por parte del personal de Discourse?

Falco · 24 Julio, 2025 23:15

¿Por casualidad IBM WatsonX expone una API compatible con OpenAI?

CraigW · 25 Julio, 2025 18:22

Gran pregunta. Una rápida revisión de la documentación no me dijo mucho, pero el hecho de que este repositorio exista sugiere que no es directamente compatible: GitHub - aseelert/watsonx-openai-api: Watsonx Openai compatible API

AntiMetaman · 5 Septiembre, 2025 20:03

¿Cuáles de estos LLM se pueden usar gratis para anti-spam?

Edición: No importa, estoy usando Gemini Flash 2.5

pfaffman · 6 Septiembre, 2025 19:51

Yo también siempre me lo pregunto. Esta parece ser la mejor respuesta a esa pregunta.

Pero también, está esto en el OP del tema de configuración de Spam. Creo que es solo un poco difícil de encontrar en toda la información que hay.

Tema		Respuestas	Vistas
Simplified Large Language Model (LLM) configurations for Discourse AI Announcements ai	1	356	9 Agosto 2024
What LLM to use for Discourse AI? Site Management how-to , ai	0	904	23 Enero 2025
Feature request: improve Discourse AI LLM setup (model discovery) and add AI config import/export Feature ai	0	86	26 Enero 2026
Configure API Keys for Anthropic Integrations how-to , ai	0	1598	3 Octubre 2023
Can't choose default LLM model Support ai	2	174	16 Noviembre 2025

Página de configuraciones de Discourse AI - Large Language Model (LLM)

Funciones

Añadir conexiones de LLM

LLMs Soportados

Campos de Configuración

Preguntas Frecuentes Técnicas

Advertencias

Temas relacionados