Около 1500 постов (хотя важнее длина, а не количество, но большинство было относительно коротким) обошлись мне в общей сложности почти в 50 долларов США.
Однако я начал использовать эту опцию, когда она только появилась, и в какой-то момент, возможно, использовал слишком дорогую модель — я клиент OpenAI.
Один пост, переведённый на четыре языка, обходится мне примерно в два цента США.
Некоторое время отображается счетчик «Переведенные сообщения»: независимо от того, сколько сообщений я публикую в своем форуме, число всегда остается равным 52.
Параметр ai_translation_backfill_max_age_days установлен на 90, а параметр ai_translation_backfill_limit_to_public_content активирован.
Сообщения также написаны в публичной категории. Я только что создал ещё 8 сообщений с помощью тестового аккаунта и аккаунта администратора на двух разных языках. Сообщения в целом переводятся, но счётчик по-прежнему показывает 52 сообщения.
Понятно. Если процесс завис на 52, это может быть связано с определением локали. Если у вас есть такая возможность, попробуйте включить скрытую настройку сайта SiteSetting.ai_translation_verbose_logs = true. После этого вы можете перейти в раздел /logs и проверить, есть ли там ошибки.
Я хотел бы оставить обратную связь по поводу ограничения в 2 раза в день, а также по поводу (не афишируемого?) факта, что если правок больше двух, то дальнейшие правки никогда не переводятся (если только в течение следующих 24 часов не произойдет еще одна правка, полагаю). По крайней мере, так я это понимаю.
У нас была ситуация, когда глобальное событие генерировало постоянный фидбек в течение примерно 18 часов, и часть этого фидбека привела к обновлениям в теме с часто задаваемыми вопросами (FAQ). За день было, вероятно, 5 или 6 правок в FAQ.
Я понимаю необходимость ограничения количества правок существующих постов, но в таких ситуациях лимит в 2 правки за 24 часа кажется слишком строгим. В качестве альтернативы я предлагаю разрешать перевод одной отредактированной версии поста за определенный период в часах. Если в том же периоде происходит больше правок, то переводится последняя правка в начале следующего периода, и она засчитывается как перевод за этот период. Сколько часов? В идеале один, но если нет, то не хуже шести.
Кроме того, я хотел бы предложить функцию для модераторов/администраторов «Перевести сейчас», которая принудительно выполняет перевод (или повторный перевод отредактированного контента), обходя упомянутое выше ограничение, когда это срочно необходимо. Недавно начав использовать переводы, я обнаружил темы старше года, которым нужен перевод, но без этой функции мне пришлось установить большой период доотбора, чтобы захватить эти старые посты. Я мог бы обойтись гораздо меньшим периодом доотбора, если бы была возможность выбирать старые посты для перевода.
Хотя мне нравится идея кнопки «Перевести сейчас» (и я уже проголосовал за неё!), это не решает более серьёзную проблему, которая была поднята: мы предоставляем переведённый контент, который может не соответствовать оригиналу, если в течение одного дня было сделано более двух правок. При этом ни автор поста, ни читатели об этом не узнают. Это снижает доверие к функции перевода как к инструменту на нашей платформе.
Примеры:
На нашем внутреннем сайте исходный пост (OP) в теме может быть отредактирован несколько раз в день, когда ответы подсказывают дополнительные детали, которые нужно добавить или изменить.
На сайте, которым я раньше управлял, было обычным делом, когда исходный пост о популярной проблеме поддержки переводился в формат вики и редактировался несколько раз в течение дня, предоставляя полезные обходные пути для решения проблем, что позволяло снизить нагрузку на службу поддержки и сэкономить время и деньги компании.
И, конечно же, как уже упоминалось выше, обновления события могут потребовать нескольких правок. Представьте, что вы едете на очное мероприятие и приходите в неправильный день, потому что дата была изменена после того, как был достигнут двухдневный лимит на повторный перевод!
Даже если будет доступна функция, позволяющая сотрудникам сайта инициировать повторный перевод, если правку сделает человек, не знающий об этом лимите, он не поймёт, что нужно запросить повторный перевод. А на загруженном сайте сотрудники могут не заметить, что перевод больше не соответствует оригиналу.
Может ли дневной лимит стать настройкой сайта, чтобы владелец сайта мог сам определить идеальный баланс между надёжностью переводов и управлением затратами на LLM?
Можно ли добавить предупреждение о лимите при редактировании переведённого поста пользователем, чтобы он был в курсе? Мы уже предупреждаем о других функциях с ограничением скорости.
Это можно сделать, но если быть предельно честным, то если лимит установлен на X, а любой пользователь отредактирует его X+1 раз, вы столкнетесь с той же проблемой. В таком случае мы создадим решение, которое не решает проблему системно.
У нас есть индикатор, который показывает, когда перевод может быть устаревшим. Он окрашен так же, как индикатор редактирования поста.
У меня возник вопрос о локализованном контенте — существует ли возможность или план индексировать заголовки и содержимое локализованных тем в поиске Discourse с учётом языка пользователя?
Опция «Установить локаль из параметра» (позволяет установить локаль анонимного пользователя через URL-параметр ‘tl’, например, ?tl=es)
Эта опция должна быть доступна всем пользователям (не только анонимным/гостям). Иногда авторизованные пользователи или сотрудники всё равно нуждаются в ссылке на правильную версию языка для темы.
Теперь мне немного любопытно — возможно, это связано с тем, как я использую эту функцию. Похоже, что после её применения я вижу только выбранный язык. Например, если мой форум в основном ориентирован на японских клиентов, весь контент унифицируется на японский язык. Или, если я считаю, что мой японский недостаточно хорош, и хочу установить что-то на китайский, всё превращается в китайский. Кажется, что исходное состояние теряется.
Возможно ли добавить здесь состояние по умолчанию с примечанием в скобках (перевод не требуется)? Тогда один пост мог бы содержать японский, английский и китайский языки, не унифицируясь в один язык. Конечно, я был бы очень рад иметь такой плагин. Этот плагин определённо принесёт большую удобство моим пользователям.
В то же время стоит учесть, что некоторые пользователи изучают несколько языков — они способны читать и понимать разные языки. Возможно, они предпочитают понимать оригинальный текст самостоятельно, а не видеть его автоматически унифицированным на свой самый сильный язык.