Проблема с использованием после перевода с помощью ИИ

co_choa · 15.Июль.2025 10:22:14

Я следовал официальному руководству по настройке Discourse AI для перевода и настроил его на перевод всех предыдущих сообщений в течение нескольких дней. Действительно, это привело к значительному объему входных и выходных токенов. Однако через два дня я столкнулся с ситуацией, когда обрабатывались только входные токены, без каких-либо выходных данных. Я не уверен в причине — возможно, все предыдущие сообщения уже переведены? Если да, то какие меры я могу предпринять, чтобы уменьшить объем входных токенов и, следовательно, сократить расходы?

nat · 15.Июль.2025 10:33:11

Привет! Вы следовали этим рекомендациям?

nat:

Чтобы охватить важные настройки и рекомендации:

AI translation model - Мы настоятельно рекомендуем установить квоту для выбранной вами LLM, используемой в качестве модели перевода.

AI translation backfill hourly rate - эта настройка скрыта в интерфейсе и по умолчанию равна 0. Автоматический перевод не начнется, если это значение равно 0. Предполагая, что ставка составляет 50, ваш сайт будет переводить 50 постов, 50 тем и 50 категорий в час на локали, указанные в Content localization supported locales. При начале работы держите это число на низком уровне.

AI translation backfill max age days - по умолчанию 5. Это означает, что темы и посты старше 5 дней переводиться не будут. Вы можете увеличить это значение до большого числа, чтобы перевести все темы и посты.

График использования выглядит действительно тревожно. Попробуйте выполнить этот запрос в Data Explorer:

SELECT 
  a.id,
  a.language_model,
  LENGTH(p.raw) as raw_length,
  a.response_tokens,
  a.raw_request_payload,
  a.raw_response_payload,
  a.topic_id,
  a.post_id
FROM ai_api_audit_logs a
LEFT JOIN posts p ON p.id = a.post_id AND p.deleted_at IS NULL
LEFT JOIN topics t ON t.id = a.topic_id AND t.deleted_at IS NULL
WHERE a.created_at > CURRENT_DATE - INTERVAL '1 days'
AND p.deleted_at IS NULL
AND t.deleted_at IS NULL
AND p.user_deleted = false
AND a.feature_name = 'translation'
AND LENGTH(p.raw) < 1000
AND a.response_tokens > 10000
ORDER BY a.created_at DESC
LIMIT 100

Запрос должен показать количество использованных токенов ответа в зависимости от исходной длины поста. В идеале вы должны увидеть сопоставимое число, не превышающее 1,5-кратного количества токенов. Таблица AiApiAuditLog поможет определить, что происходит.

Кроме того, пожалуйста, сообщите:

Какую модель вы используете?
Какова ваша почасовая ставка для заполнения (backfill)? Я рекомендую держать её на низком уровне, например, 50 для начала.
Сколько языков вы поддерживаете? Поддерживает ли выбранная вами модель их?

co_choa · 15.Июль.2025 10:51:35

Я настроил GPT-4.1 Nano в качестве модели для перевода. Ранее почасовая скорость заполнения составляла 1000, но сегодня я изменил её на 100. Я включил поддержку японского и английского языков, и эта модель действительно поддерживает их.

nat · 15.Июль.2025 10:54:38

Да, 1000, вероятно, не лучшая идея, и мне стоит добавить здесь ограничение в настройках сайта.

Не уверен, как API OpenAI реагирует на около 3000 запросов в час. В вашей конфигурации на один пост мы выполняем: определение языка, перевод на японский, перевод на английский. Если вы проверите /logs, то, скорее всего, увидите, что ваш сайт достигает лимитов частоты запросов.

Предлагаю снизить значение ещё до 50 и посмотреть, как всё пойдёт.

В ближайшее время мы также внедрим возможность просмотра прогресса перевода всего сайта.

co_choa · 15.Июль.2025 10:55:13

Кроме того, при выполнении предоставленной вами команды запроса база данных не возвращает никаких результатов. Возможно, требуется какая-то настройка или модификация?

nat · 15.Июль.2025 10:56:34

Хм, этот запрос должен сработать. У вас установлен плагин discourse-data-explorer?

co_choa · 15.Июль.2025 10:56:41

Очень хорошо, я сначала попробую. Спасибо.

co_choa · 15.Июль.2025 10:57:23

Я установлю это позже и попробую снова. В данный момент пересборка форума невозможна, так как пользователи продолжают активно его использовать.

Тема		Ответов	Просм.
AI translation backfill not working after all settings configured Support ai , content-localization	34	883	13.11.2025
Discourse AI Failing to translate large number of posts and topics Support ai , content-localization	7	299	06.11.2025
AI translations errors Bug ai	10	242	10.05.2026
AI setting tells translations are disabled when enabled Bug ai , content-localization	21	420	01.09.2025
How to configure ai translate of `Ai translation backfill hourly rate`? Support ai	9	297	04.11.2025

Проблема с использованием после перевода с помощью ИИ

Связанные темы