Используйте ИИ для получения резюме и других данных по теме

ИИ может быть полезен при обработке и анализе длинных тем.

Вот моя текущая модель процедуры использования данных темы в контексте языковой модели ИИ:

  • Загрузка всех сообщений обсуждения по теме.
  • Извлечение релевантных данных.
  • Загрузка релевантных данных в языковую модель ИИ.
  • Запросы к языковой модели ИИ, касающиеся данных.

Загрузка всех сообщений обсуждения по теме:

  • Это возможно с помощью CLI-программы «discourse-reader».
  • Требуется:
    • Разовое получение ключа API пользователя.
    • Авторизация ключа API в настройках пользователя (форума).

Разовое получение ключа API пользователя:

  • Это возможно с помощью CLI-программы «discourse-user-api-key».
  • Точный рабочий процесс описан в справке программы.

Загрузка темы приводит к созданию сложного JSON-файла:

{
  "meta_data": ...,
  "post_data": [ ... ]
}

Пример:

# загрузка темы с форума
discourse-reader -forum="meta.discourse.org" -topic=210780 -output="210780.json" -userapikey="107dc02b7fad3bc217b6f0c121fdc805"

Извлечение релевантных данных:

  • Это возможно с помощью CLI-программы «jq».
  • Также возможны изменения в JSON-данных.

Пример:

# фильтрация ненужных данных
# метаданные
jq '.meta_data | {title, created_by:.details.created_by.username, created_at, id, posts_count, last_posted_at}' 210780.json > 210780.compact.json
# данные постов
jq '.post_data[] | .post_stream.posts[] | {post_number, username, created_at, reply_to_post_number, post:.cooked, reactions, accepted_answer}' 210780.json >> 210780.compact.json

Загрузка релевантных данных в языковую модель ИИ.
Запросы к языковой модели ИИ, касающиеся данных.

  • Для этих целей вскоре будет разработана простая CLI-программа.
  • На начальном этапе можно использовать браузерный интерфейс языковой модели ИИ.

Упомянутые программы можно найти на GitHub.

А вот пример использования для темы 210780 с этого форума:
https://meta.discourse.org/t/matrix-protocol-for-chat/210780/

ИИ - Google Gemini 2.0 (exp)

Промпт для Gemini:

Создайте список с количеством постов на каждого пользователя.
Составьте краткое резюме обсуждения.
Каков результат обсуждения?
Каковы следующие шаги?

Ответ от Gemini:

Посты на пользователя:

  • mattdm: 4
  • david: 1
  • sam: 4
  • AquaL1te: 2
  • seong: 1
  • Stephen: 1
  • satonotdead: 1
  • user12: 1
  • attj: 1
  • Falco: 3
  • halfshot: 2
  • merefield: 2
  • anarcat: 1
  • dan: 1
  • rokejulianlockhart: 3
  • volanar: 4
  • mcdanlj: 1
  • jimkleiber: 2
  • sunjam: 6
  • dubwoc: 1
  • davy: 2
  • Lhc_fl: 1
  • Thomas_Rother: 12
  • thoka: 2
  • mcwumbly: 4
  • joshsimmons: 2
  • hellekin: 5
  • kOS: 1

Резюме обсуждения:

Обсуждение вращается вокруг идеи интеграции протокола Matrix с чатом Discourse. Первоначальное предложение заключалось в том, чтобы сделать комнаты чата Discourse комнатами Matrix, что было бы более бесшовным решением, чем мост. Участники видят преимущества этого подхода, многие выражают сильную поддержку Matrix как открытого федеративного стандарта. Однако высказываются опасения, что пользователи с меньшей вероятностью будут взаимодействовать с «медленной полосой» (темами), если будут использовать не-Discourse клиенты Matrix. Другие указывают, что наличие чата и форумов на разных платформах также является барьером. Обсуждение также затрагивает потенциал федерации экземпляров Discourse через Matrix, а также использование ActivityPub.

Отмечается разработка плагина-моста Matrix для чата Discourse, и описываются его возможности. Однако также обсуждается отсутствие сквозного шифрования в чате Discourse. Сложности сопоставления пользователей, прокси и общие необходимые усилия выделены как значительные проблемы. Существует консенсус относительно преимуществ интероперабельности между чатом Discourse и Matrix, особенно учитывая растущее внедрение Matrix крупными организациями.

Результат обсуждения:

Хотя идея интеграции Matrix с чатом Discourse вызывает большой энтузиазм и поддержку, обсуждение выявляет значительные проблемы, включая:

  • Управление пользователями: Сопоставление пользователей между двумя системами является сложным.
  • Технические трудности: Реализация надежного моста — это масштабное мероприятие, которое может потребовать специфических навыков.
  • Ограниченность ресурсов: CDCK не считает это приоритетом из-за ограниченных ресурсов и пока не видит убедительного бизнес-кейса.
  • Проблемы с финансированием: Возможность получения финансирования от Германского суверенного фонда упущена.

Существующий код моста рассматривается как хорошая отправная точка, но считается находящимся на стадии альфа-тестирования, недостаточно документированным и требующим дальнейшей разработки. Нет четких обязательств со стороны CDCK по приоритизации этой интеграции, если только не будет обеспечено внешнее финансирование или если клиенты не поставят этот запрос в приоритет и не профинансируют разработку. Обсуждение завершается без четкого пути вперед или обязательств по реализации.

Следующие шаги:

  • Поиск квалифицированного разработчика: Главное препятствие — необходимость в разработчике, обладающем экспертизой как в Matrix, так и в Discourse.
  • Спонсорство со стороны клиентов: Бизнес-кейс, оправдывающий разработку, еще не сформирован; возможно, клиенту потребуется спонсировать усилия.
  • Взаимодействие с Фондом Matrix: Более тесное взаимодействие с Фондом Matrix для получения помощи, технических рекомендаций и потенциальных возможностей финансирования.
  • Оценка существующего кода: Анализ существующего кода для оценки необходимого объема разработки до бета-статуса и определения, является ли этот подход поддерживаемым.
  • Инициатива сообщества: Изучение возможности разработки сообществом плагина стороннего разработчика.
  • Краудфандинг: Оценка потенциала краудфандинга.
  • Обсуждение на OFFDEM: Обсуждение дополнительных возможностей финансирования на следующей встрече OFFDEM.
1 лайк

Или вы можете использовать:

Или:

5 лайков

Описанное выше решение работает для всех форумов Discourse. В то же время функции искусственного интеллекта, интегрированные в Discourse, доступны только при установке соответствующего плагина.

Качество ответа ИИ сильно зависит от введенного запроса. И даже в этом случае ответ (например, резюме) может быть несбалансированным.

Сценарий использования: После завершения темы может быть желательно создать её резюме. Например, в виде последнего сообщения в теме. Однако сначала его следует отредактировать и признать консенсусом.

1 лайк

На странице Discourse AI Topic Summary 🤖 вы можете настроить промпт по своему усмотрению в разделе Администрирование → Настройка → Текст. (Базовый ключ ai_topic_summary)

Другой вариант — обсудить контент с ботом, например с моим Чат-ботом или с ботом Discourse AI.

1 лайк