Почему мое суммаризация форума постоянно зависает?

markschmucker · 24.Октябрь.2024 23:50:54

У нас есть много тем, которые превышают типичную длину контекста (скажем, 128k), и тогда возникают проблемы. Вы рассматривали возможность создания резюме на основе только самых популярных постов? Начните с самого популярного поста, добавьте следующий по популярности и продолжайте, пока не будет достигнута целевая длина контекста, а затем передайте полученный текст GPT? По крайней мере, для нашего форума «лайки» являются очень хорошим индикатором «наибольшей релевантности».

Falco · 25.Октябрь.2024 00:02:36

Именно так это работает в длинных темах: мы используем 50 самых понравившихся постов в теме.

markschmucker · 25.Октябрь.2024 00:24:28

Хм, кажется, что суммирование зависает на длинных темах, поэтому я предположил, что это связано с длиной контента. Есть какие-то советы по отладке этого? Я использую gpt-o4. Я не вижу способа просмотреть конкретные API-запросы в своей панели управления OpenAI.

Falco · 25.Октябрь.2024 01:17:14

Вы можете просмотреть запросы в таблице ai_api_audit_logs.

Что касается зависания в процессе суммирования, то недавно у нас были проблемы с фронтендом в этой области, поэтому, пожалуйста, обновите свой сайт до последней версии.

markschmucker · 25.Октябрь.2024 14:55:44

Я нашел это в журналах ошибок:

Запрос слишком велик для gpt-4o в организации org-xxxxxxxxxxxxxxxxx по количеству токенов в минуту (TPM): лимит 30000, запрошено 45906.

Чтобы увеличить свои лимиты, я полагаю, мне нужно фактически потратить 50 долларов (а не просто заложить их в бюджет) и подождать примерно месяц плюс 7 дней:

На данный момент я потратил только 2,00 доллара, и платеж еще не требуется. Также я не вижу, как ограничить количество токенов в Discourse. Поэтому пока я не понимаю, как использовать суммаризацию для длинных тем.

Falco · 25.Октябрь.2024 15:56:09

Ох, значит, проблема в том, что у вас ограниченный аккаунт OpenAI, который накладывает лимит на токенов в минуту, что влияет на использование AI-суммаризации в Discourse.

Это очень обидно. Я бы посмотрел в сторону альтернативных провайдеров, таких как Anthropic, AWS, Azure, Google Cloud или даже провайдеров API Llama. Насколько я знаю, есть провайдеры с бесплатным тарифом, которые предлагают более высокий лимит, чем у вас.

markschmucker · 25.Октябрь.2024 16:41:02

Я перешёл с использования 4o на 4o-mini для суммаризации, и это, похоже, работает для моих самых длинных тем. Похоже, у OpenAI разные лимиты для разных GPT.

Тема		Ответов	Просм.
Summarising topics with an LLM (GPT, BERT, ...)? Feature	11	4111	22.11.2023
Configuring Discourse AI for Summarization Support ai , ai-summarize	6	232	23.07.2024
Topic Summarization doesn't work :-( Support ai , ai-summarize	8	271	04.06.2025
Summarize large topics by default Feature	2	1845	05.05.2017
AI summarization not working after upgrading to 3.3.0 beta1 Support ai	10	833	20.03.2024

Почему мое суммаризация форума постоянно зависает?

Связанные темы