Локализация контента и автоматический перевод для вашего сообщества

:partying_face:

Локализация контента и автоматический перевод теперь готовы, обеспечивая многоязычную поддержку для ваших сообществ. Эта функция включена здесь, на Meta.

Наши эксперименты здесь вызвали огромный интерес, пока мы занимались доработками, и мы рады сообщить, что ожидание наконец закончилось: теперь вы можете использовать эти замечательные новые функции на своих сайтах. :slight_smile: :tada:

Благодаря этим мощным нововведениям вы теперь можете переводить и предоставлять контент вашего сайта на нескольких языках для создания бесшовного многоязычного опыта. :globe_with_meridians: От заголовков тем до содержимого постов, а также категорий и их описаний — ваше сообщество теперь может быть полностью переведено на множество языков по вашему выбору.

Подробности о функции и инструкции по настройке вы найдете в теме документации: Content Localization - Manual and Automatic with Discourse AI

:discourse: Размещено нами? Эта функция доступна во всех наших тарифных планах с хостингом.

Часто задаваемые вопросы (FAQ)

Какой LLM использует Meta (этот форум)?
Мы проводили итерации и пока остановились на Gemini Flash 2.5; еще несколько недель назад мы использовали версию 2.0. Поддержка языков и стоимость будут продолжать меняться, и мы ожидаем обновлять модель по мере нахождения более подходящих вариантов. Этот рейтинг от OpenRouter полезен для определения того, что обычно используется: LLM Rankings | OpenRouter.

Но… сколько это всё стоит?
Стоимость перевода вашего сообщества зависит от множества переменных: выбранная модель, размер постов, количество тем, количество категорий. Мы рекомендуем установить приемлемую дневную квоту, а затем корректировать её по мере необходимости. Discourse AI - AI usage и Configuring LLM Usage Quotas in Discourse AI — отличные темы по мониторингу использования.

В качестве очень приблизительной оценки: перевод 🇨🇳 Discourse supports Chinese usernames | Discourse 支持中文用户名 на 2 языка (английский и японский) с использованием профиля по умолчанию занимает 7800 токенов. При использовании Gemini 2.5 Flash Lite это стоит $0.001030.

Грядущие функции и улучшения

Предоставление локализованного контента для SEO

Мы хотим помочь публичным сообществам привлекать больше органического трафика. Если ваш сайт определяет набор поддерживаемых локалей, каждая тема будет также содержать ссылки на свои переведенные версии для индексации поисковыми системами, такими как Google.

Выполнено :white_check_mark:

Выборщики локалей, понятные вам

В настоящее время на уровне всего сайта в выпадающем списке для японского языка указано «日本語». Мы должны использовать «Japanese», когда интерфейс отображается на английском языке.

Выполнено :white_check_mark:

Локализация тегов

В текущем виде теги не так надежны, как категории, и имеют некоторые особенности. Для добавления функций локализации теги потребуют фундаментальных изменений. [1]

Выполнено :white_check_mark:

Повторный перевод отредактированных постов

В настоящее время переведенный пост не переписывается заново, когда оригинал редактируется. Мы рассматриваем внедрение хороших пороговых значений по умолчанию или предоставление определенных элементов управления, которые позволят привилегированным пользователям запускать автоматический перевод отредактированного поста.

Выполнено :white_check_mark:

Дашборд прогресса перевода сообщества

Владельцам сообществ бывает сложно увидеть, какая часть их форума уже локализована.

Наша цель — показать дашборд, отображающий прогресс перевода для каждого настроенного языка.

Выполнено :white_check_mark:

Oneboxes и ссылки

В настоящее время они не отображаются корректно в локализованных темах. Это будет исправлено.

Выполнено :white_check_mark:

Есть вопрос или предложение?

Если вы обнаружили область, которая не была локализована, хотя должна была быть, или хотели бы предложить улучшения, мы с радостью выслушаем вас и обсудим ваши предложения внутри команды.

Пожалуйста, добавьте их в эту тему, и мы выделим их в отдельные темы, если это потребуется.


  1. Сравнение категории Bug - Discourse Meta и тега Topics tagged email дает нам понять, что теги идентифицируются не по их ID, а по именам. ↩︎

29 лайков

Меня интересует обоснование этого момента. Если я являюсь носителем английского языка и просматриваю сайт на английском, то выпадающий список языков (как правило) не имеет для меня значения. А если мой родной язык другой (но я всё ещё просматриваю сайт на английском), то, на мой взгляд, для меня было бы логично видеть название моего языка в его родном письменном виде.

3 лайка

У нас уже была внутренняя дискуссия по этому вопросу — вот пример, почему это может иметь смысл:

Некоторые селекторы языков указывают название языка как на локальном, так и на оригинальном языке, например:

  • Japanese 日本語
  • Arabic اللغة العربية

Именно это мы и рассматриваем.

9 лайков

Спасибо, проблема с поиском вполне понятна, и изменение этих заголовков — гораздо менее сложное и масштабное решение, чем добавление альтернативных поисковых терминов для значений.

Мне нравится идея использовать как английский язык (независимо от того, на каком языке работает система?), так и родное письмо, так как это не окажет потенциально негативного влияния на читателей, использующих другие языки.

2 лайка

Когда пользователь отмечает пост, видят ли модераторы, на каком языке он его прочитал?

Например, если я пометил этот пост как не по теме:

знаете ли вы, что я увидел некорректный перевод, и что мой сигнал не связан с оригинальным содержанием?

6 лайков

На данный момент нет, но это хороший момент. Возможно, стоит создать новый пользовательский флаг для этого. :memo:

EDIT: Готово.

7 лайков

Флаг, безусловно, полезен. Но для его использования мне нужно сравнивать оригинальный пост и перевод, который я вижу.

Если я этого не делаю, всё равно было бы полезно иметь индикатор, указывающий, что я просматривал немецкую версию, когда помечал тему как не по теме. Особенно в случаях, когда оригинал не на английском, и я не могу без дополнительных исследований понять, проблема в переводе или в оригинале.

Влияет ли пользовательский флаг на уровень доверия? Было бы несправедливо наказывать пользователей за ошибки в переводах, которые они не писали.

Редактирование:

Я сразу же попробовал это сделать.

6 лайков

Понял, я, видимо, неправильно вас понял. Но в любом случае этот флаг предназначен для отметки некорректных переводов.

Теперь я понял вашу первоначальную мысль, и это тоже важный момент. Кстати, прямо сейчас идёт переработка очереди проверок — Current Projects - April 2025. Я обсудю с этой командой возможность добавления некоторых метаданных для модераторов, просматривающих отмеченные посты. :ok_hand:t2: Как всегда, спасибо за вашу проницательность.

Судя по тому, что я прочитал, нет — согласие с пользовательским флагом не влечёт за собой штрафов для пользователя.

3 лайка

Огромное спасибо, это крайне полезно. Один быстрый вопрос: нужно ли активировать плагин перевода?

2 лайка

Нет, отличный вопрос — плагин переводчика вообще не используется. Рекомендую отключить его, чтобы избежать путаницы.

5 лайков

Каковы последствия для SEO при использовании этой функции? Может ли это потенциально привести к негативным эффектам?

1 лайк

Функция отображения переведённого контента пока не реализована.

Однако, чтобы правильно ответить на ваш вопрос — наша команда уже обсуждала это ранее, и я искренне считаю, что нам не стоит беспокоиться о негативных последствиях. Напротив, наша функция, если говорить конкретно о Google, фактически улучшит международный трафик сайта.

Возьмём в качестве примера Reddit. Допустим, вы — испаноязычный читатель, который ищет кофемашины на Reddit:


Результат поиска по запросу «кофемашины reddit» — обратите внимание на URL

Первый результат — это пост, переведённый машинным способом на Reddit; его URL — https://www.reddit.com/r/espresso/comments/1fbwbun/most_vfm_entry_espresso_machine/?tl=es-es (обратите внимание на параметр запроса языка tl). Как знают многие пользователи Reddit, поиск контента на своём языке может теперь приводить к отображению машинных переводов, выполненных самим API Google (у Reddit и Google огромное сотрудничество). Эти ребята тоже провели исследование, и я доверяю их материалам — AI-Generated Content Does Not Hurt Your Google Rankings (600,000 Pages Analyzed).

Итак, Google берёт ваш оригинальный контент и переводит его машинным способом, потенциально переманивая трафик с вашего сайта. В статье от тех же авторов (Google Is Stealing Your International Search Traffic With Automated Translations) подробно объясняется, как это может происходить, и даётся рекомендация переводить контент самостоятельно. С помощью нашей функции локализации вы можете начать переводить свой контент (как с помощью ИИ, так и вручную), получив при этом дополнительное преимущество: вы сможете гарантировать качество переведённых тем на том уровне, который вам нужен.

7 лайков

Спасибо, это хороший пример с Reddit. Я провел дополнительное исследование, и, похоже, Reddit также использует атрибуты hreflang. Планируется ли это реализовано аналогичным образом?
https://www.gsqi.com/marketing-blog/reddit-ai-translations-google/

2 лайка

Да, именно так всё и будет.

Это не будет быстрое внедрение, так как нам сначала нужно провести некоторые тесты.

6 лайков

Если я хочу написать свой ответ на родном языке, могу ли я это сделать? Несколько месяцев назад я пробовал, и меня предупреждали. Означает ли перевод моего контента, что мой международный трафик разрешает ввод на любом языке?

Посмотрите на ваш пример: я всё ещё использую Reddit, даже как наблюдатель, и этот перевод переводит для меня на родной язык с учётом наших способов выражения. Например? Когда я говорю «Hello» на английском здесь, мы не говорим «Olá», а «Fala tu», и Reddit сегодня это понимает. Вы уверены, что эта модель научится переводить таким образом с 7 800 токенами?

Наконец, есть ли какие-либо шансы, что CDCK предоставит платный API для перевода наших сообществ? Я задавал этот вопрос в прошлом, но теперь, когда, apparently, есть команда для этого, я снова здесь.

Это просто круто!

:skateboard:
:fire:


Я тоже был удивлён! Мой опыт связан с проведением общественных опросов для многоязычных групп населения, и иногда было непросто объяснить некоторым заинтересованным сторонам, почему многоязычные пункты меню имеют смысл для читателей, а не для англоязычных посетителей.

Это действительно удивительное время для многоязычных систем, учитывая, что большие языковые модели (LLM) дают надёжные результаты! Я с нетерпением жду изучения новых паттернов, которые мы сможем применять, чтобы общаться с максимальным количеством людей. :slight_smile:


:exploding_head:

Так это просто плагин Discourse AI?!

Мне придётся пересмотреть несколько вещей, но я думаю, что смогу перейти на переводы через Discourse AI с минимальными хлопотами. :thinking:

Да, именно так. Вся тема может быть написана на родном языке на 20 языках и будет отображаться на немецком для немецкоязычного читателя, если немецкий входит в список поддерживаемых языков.

Discourse не предоставляет рекомендаций по выбору модели, поэтому вам следует выбрать модель, которая поддерживает перевод на нужные вам языки.

В документации также упоминается возможность настройки персонажа, включающей промпт и модель. :backhand_index_pointing_down:t2:


Я не совсем понимаю, что вы имеете в виду. Не могли бы вы уточнить или рассказать подробнее об этом вопросе?

Не уверен, что это то, что вы имеете в виду, но CDCK вряд ли предложит какие-либо другие платные услуги. Однако клиент нашего хостинга может настроить эту функцию с использованием моделей, размещённых CDCK, но существуют ограничения по языкам в зависимости от выбранного тарифного плана.

4 лайка

У меня есть форум на португальском языке. Некоторое время назад я думал о создании ещё одного форума в той же нише, что и мой текущий, но на французском — моём втором языке. Однако я отказался от этой идеи, так как создание контента для двух новых форумов оказалось бы слишком трудоёмким.

Я очень рад этому объявлению и с нетерпением жду его реализации.

3 лайка

3 сообщения были перемещены в новую тему: При локализации выпадающий список категорий фильтрует на обоих языках, но работает только для одного

Сообщение было разделено на новую тему: Обратная связь по переводу сообщения на немецкий