Estoy intentando configurar el detector de spam de IA para mi propia instancia de Discourse, pero tengo varias preguntas:
El prompt del sistema de la personalidad del detector de spam no se puede editar. Puedo crear una nueva personalidad, pero no hay ningún campo para hacerle saber a Discourse que se va a utilizar como detector de spam.
Quiero usar Qwen3 como el LLM para la tarea. No hay una configuración preestablecida para Qwen3, así que voy a crear una personalizada. Pero tampoco hay un Qwen3Tokenizer. ¿Qué hace el tokenizer aquí? ¿Funciona QwenTokenizer para Qwen3?
¿O hay una opción más fácil para configurar un servicio tipo webhook y que Discourse lo llame ante nuevos temas/publicaciones?
Gracias, pero sé lo que es un tokenizador. Lo que no sé es para qué lo usa Discourse y qué pasaría si eligiera el tokenizador incorrecto. De todos modos, no necesito un tokenizador para llamar a un LLM.
¿Puedes intentar visitar esta https://\u003cyour-site\u003e/admin/plugins/discourse-ai/ai-spam? Debería permitirte insertar instrucciones personalizadas y probar contra una publicación.
Entiendo que esta instrucción se concatena a la instrucción del sistema en lugar de reemplazarla, lo que hace que la instrucción sea aún más larga y tenga lenguajes mixtos…
Pero pasar la prueba no significa que no haya ningún problema. (Para su información, todavía no he configurado completamente el LLM; probé el servicio gratuito de Gemini pero obtuve 429, así que ahora estoy tratando de descubrir cómo integrar llama.cpp en Discourse).
Gracias, ¿así que esa etiqueta de “detector de spam” solo afecta al filtrado de listas de las personas?
Configuraré un entorno de prueba e intentaré usarlo.
Revisé el código fuente. Si no cometí errores, el tokenizador se utiliza para dos cosas: contar tokens para estadísticas y estimación de precios, y truncar publicaciones al límite establecido. Así que no debería afectarme mucho si se utiliza uno incorrecto.