Frustraciones con el detector de spam de AI

,

Estoy intentando configurar el detector de spam de IA para mi propia instancia de Discourse, pero tengo varias preguntas:

El prompt del sistema de la personalidad del detector de spam no se puede editar. Puedo crear una nueva personalidad, pero no hay ningún campo para hacerle saber a Discourse que se va a utilizar como detector de spam.

Quiero usar Qwen3 como el LLM para la tarea. No hay una configuración preestablecida para Qwen3, así que voy a crear una personalizada. Pero tampoco hay un Qwen3Tokenizer. ¿Qué hace el tokenizer aquí? ¿Funciona QwenTokenizer para Qwen3?

¿O hay una opción más fácil para configurar un servicio tipo webhook y que Discourse lo llame ante nuevos temas/publicaciones?

2 Me gusta

Hola, para responder a tu pregunta:

De la documentación:

Gracias, pero sé lo que es un tokenizador. Lo que no sé es para qué lo usa Discourse y qué pasaría si eligiera el tokenizador incorrecto. De todos modos, no necesito un tokenizador para llamar a un LLM.

¿Puedes intentar visitar esta https://\u003cyour-site\u003e/admin/plugins/discourse-ai/ai-spam? Debería permitirte insertar instrucciones personalizadas y probar contra una publicación.

Entiendo que esta instrucción se concatena a la instrucción del sistema en lugar de reemplazarla, lo que hace que la instrucción sea aún más larga y tenga lenguajes mixtos…

Pero pasar la prueba no significa que no haya ningún problema. (Para su información, todavía no he configurado completamente el LLM; probé el servicio gratuito de Gemini pero obtuve 429, así que ahora estoy tratando de descubrir cómo integrar llama.cpp en Discourse).

Acabo de hacer una configuración rápida y funciona bien al seleccionar la personalidad personalizada para el spam.

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

Avísanos de nuevo si no puedes hacerlo a través de /discourse-ai/ai-spam

4 Me gusta

Gracias, ¿así que esa etiqueta de “detector de spam” solo afecta al filtrado de listas de las personas?
Configuraré un entorno de prueba e intentaré usarlo.

1 me gusta

¡Parece que funciona, gracias!

2 Me gusta

Revisé el código fuente. Si no cometí errores, el tokenizador se utiliza para dos cosas: contar tokens para estadísticas y estimación de precios, y truncar publicaciones al límite establecido. Así que no debería afectarme mucho si se utiliza uno incorrecto.

1 me gusta