Разочарования от детектора спама на базе ИИ

lilydjwg · 19.Ноябрь.2025 03:20:02

Я пытаюсь настроить детектор спам-сообщений на основе ИИ для своего экземпляра Discourse, но у меня возникло несколько вопросов:

Системный промпт для персонажа детектора спам-сообщений нельзя редактировать. Я могу создать нового персонажа, но нет поля, чтобы указать Discourse, что он будет использоваться как детектор спам-сообщений?

Я хочу использовать Qwen3 в качестве LLM для этой задачи. Предустановки для Qwen3 нет, поэтому я планирую создать свою собственную. Однако токенизатора Qwen3Tokenizer тоже нет. Что делает токенизатор в данном случае? Подойдёт ли QwenTokenizer для Qwen3?

Или есть более простой вариант: настроить службу, похожую на веб-хук, чтобы Discourse обращался к ней при создании новых тем или сообщений?

NateDhaliwal · 19.Ноябрь.2025 03:59:21

Привет! Отвечаю на ваш вопрос:

Из документации:

lilydjwg · 19.Ноябрь.2025 04:02:59

Спасибо, но я знаю, что такое токенизатор. Я не понимаю, для чего его использует Discourse и что произойдет, если я выберу неправильный токенизатор? В любом случае, для вызова LLM мне токенизатор не нужен.

nat · 19.Ноябрь.2025 04:10:07

Попробуйте перейти по ссылке https://<your-site>/admin/plugins/discourse-ai/ai-spam — там вы сможете:

выбрать своего персонажа
добавить собственные инструкции и протестировать их на посте

Да, вы можете это сделать, а затем запустить «Тест».

lilydjwg · 19.Ноябрь.2025 04:22:50

Насколько я понимаю, эта инструкция добавляется к системному промпту, а не заменяет его, из-за чего промпт становится ещё длиннее и содержит смешанные языки…

Но прохождение теста не означает, что проблем нет. (К сведению: я ещё не полностью настроил LLM; я попробовал бесплатный сервис Gemini, но получил ошибку 429, поэтому сейчас пытаюсь разобраться, как интегрировать llama.cpp в Discourse.)

nat · 19.Ноябрь.2025 06:03:33

Я только что выполнил быструю настройку, и всё работает нормально: при выборе пользовательского персонажа для спама.

Пожалуйста, сообщите ещё раз, если у вас не получится сделать это через /discourse-ai/ai-spam.

lilydjwg · 19.Ноябрь.2025 06:13:07

Спасибо, то есть метка «спам-детектор» влияет только на фильтрацию списков персонажей?
Я настрою тестовую среду и попробую.

lilydjwg · 19.Ноябрь.2025 11:14:32

Кажется, всё работает, спасибо!

lilydjwg · 21.Ноябрь.2025 04:21:34

Я проверил исходный код. Если я не ошибся, токенизатор используется для двух вещей: подсчёта токенов для статистики и оценки стоимости, а также для усечения постов до установленного лимита. Так что использование неправильного токенизатора не сильно повлияет на меня.

Тема		Ответов	Просм.
Discourse AI - Large Language Model (LLM) settings page Site Management how-to , ai	20	3821	09.05.2026
AI powered Spam detection Announcements ai , spam	11	1139	11.01.2025
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4475	10.03.2026
Introducing Discourse AI Blog	26	4126	04.05.2023
What's the cheapest/best AI to use for AI Spam? Support ai , spam	6	371	18.03.2025

Разочарования от детектора спама на базе ИИ

Связанные темы