Открыт PR для добавления GPT-5, но в процессе CI что-то идёт не так.
Я создал тему в Development об этом.
Открыт PR для добавления GPT-5, но в процессе CI что-то идёт не так.
Я создал тему в Development об этом.
Объединено.
Если вам кажется, что рассуждения GPT-5 слишком медленные, вы можете изменить уровень рассуждений. Теперь доступен новый уровень minimal.
Благодарим @NateDhaliwal за помощь в этом!
Наш бот тайм-аутил, пока мы не установили reasoning на минимальный. Спасибо!
Честно говоря, я считаю, что GPT-5 в целом слишком медленный при высоком уровне рассуждений, и его преимущества явно не оправдывают дополнительное время ожидания ответов.
А как он показал себя у вас в поддержке? Демонстрирует ли GPT-5 с минимальным уровнем рассуждений лучшие результаты, чем, скажем, 4o или 4.1?
Я пробовал gpt-5 через Chat GPT — это совсем другое дело по сравнению с API. Для получения ответов, лишь немного лучших, чем те, что дают 4o или o1, требуется длительное время на рассуждения. Когда нужно отвечать быстро, он не лучше версии 4.1.
Я почти уверен, что ситуация с API аналогична или даже хуже из-за отсутствия инструментов и возможностей промптинга. Но я не могу сказать точно, потому что gpt-5 работает мучительно медленно, а в среде форума он должен отвечать почти со скоростью света.
Что касается производительности контента, по anecdotal данным, кажется, что gpt-5 даёт заметно более качественные технические ответы, чем gpt-4o. Не знаю, как это измерить количественно, но это меня действительно впечатлило.
Результаты по времени ответа варьируются. Судя по экспериментам сегодня утром, gpt-5 в среднем работает медленнее, но не намного, и были случаи, когда ответ приходил быстрее с gpt-5. Время ответа составляет от 5 до 35 секунд.
Мы используем RAG, но не могу определить, какая часть задержки связана с поиском в RAG, а какая — с завершением чата. Возможно, иногда модель решает не выполнять поиск в RAG, поиск проходит быстрее, или что-то кэшируется (в поиске или при завершении).
Мы обычно выбираем более качественные ответы, даже если они приходят медленнее, поскольку предоставление клиентам ошибочных технических рекомендаций обходится дорого. Однако до определённого предела: если происходит тайм-аут, это создаёт очень плохой пользовательский опыт.
GPT-5 рекомендует для нашего случая в первую очередь gpt-5-mini и переходить на gpt-5 только в некоторых ситуациях. Звучит интересно, но сложно. Вы рассматривали возможность динамического переключения между моделями? Почему OpenAI не делает это автоматически? ChatGPT - Compare GPT models performance
Пришлось вернуться к gpt-4o, потому что, похоже, gpt-5-mini считает, что может делать то, чего не умеет. Он с уверенностью предложил настроить службу мониторинга сигнализации для клиента и подключить её к оборудованию домашней сигнализации. Он запросил у них идентификаторы оборудования и начал галлюцинировать, ведя себя как консьерж, который всё настраивает. Наш сайт может это сделать, но чат-бот — нет. Похоже, он не соблюдает ограничения, прописанные в системном промпте, как это делал gpt-4o. Нам нужно ужесточить настройки, прежде чем мы сможем разрешить людям его использовать.
Обновление: Оказалось, что gpt-5 гораздо лучше следует инструкциям и соблюдает правила в промпте, чем gpt-5-mini. Если вы собираетесь позволить боту представлять ваш бренд, я рекомендую gpt-5, даже если он работает медленнее и стоит в 5 раз дороже. Слишком велик риск, что gpt-5-mini выйдет из-под контроля.
Мне очень повезло с GTP-5-mini в агентных потоках благодаря вызову инструментов, написанию кода и работе со структурированными данными. Обычно я замечаю, что для AI-приложений работать со структурированными данными проще, чем с неструктурированными! Это было для меня неожиданным! Зато средства контроля (guardrails) проще реализовать (код в цикле, человек в цикле, LLM как судья и т.д.).
Посмотрите это видео для пошагового обзора высокопроизводительного и недорогoго GPT-5-mini и GPT-4o:
Если кто-то заинтересован в интеграции возможностей работы со структурированными данными в Discourse в виде плагина или иного решения, пожалуйста, свяжитесь со мной.
Например, это может быть NLP-расширение для SQL/статистики/науки о данных в Data Explorer. Также можно было бы создать инструмент/плагин/функцию, позволяющую выполнять запросы на естественном языке к файлам в формате read-only SQLLite, DuckDB и другим OLAP-файлам, загруженным в контейнер. Просто мысль… ![]()
Кстати, я добавил GPT 5.1 в плагин, а также внес некоторые исправления:
@tom_eric вы спрашивали о возможности играть в игры с другими участниками форума в другой теме.
Я попробовал этот запрос с Chatbot, и он, похоже, работает с GPT 5.1. Попробуйте:
@Chatbot организуйте игру в Го на доске 9x9 с @Other_Player и мной, используя таблицу Markdown для отображения доски — я сделаю первый ход, и ходы будут приниматься только от меня и @Other_Player, и только в нашу очередь — отображайте доску и просите меня сделать первый ход …
О, спасибо. Это действительно креативная идея. О, спасибо. Это действительно креативная идея.
Ничего, дай знать, как всё получится ![]()
Небольшая кастомизация окружения разработки позволила мне поэкспериментировать с чат-ботом, играющим в Zork, используя этот плагин и Discourse Frotz ![]()
(здесь с GPT 5.1 на пониженном уровне рассуждений)
Немного позже:
Набирает приличный счёт! И ещё:
![]()
(Извините, настройка слишком сложна, чтобы просто поделиться ею здесь).
Вау! Я и не знал, что это возможно. Похоже, с хорошими промптами возможно почти всё ![]()
В выпадающих списках моделей чат-бота теперь доступны GPT 5.2 и 5.2 Pro. Для версии 5.2 добавлен уровень рассуждения xhigh, если вы любите сжигать токены и наносить ущерб окружающей среде ![]()
Также вы могли заметить, что пользователи плагина Maths теперь могут легко заставить чат-бота обсуждать математику с красиво отрендеренными уравнениями, не добавляя ничего в системный промпт…
Я переместил кнопку запуска в более аккуратное место в правом нижнем углу (кроме iOS PWA/приложения) — дайте знать, если это работает не так, как задумано.
Это всегда было задумано для упрощения CSS с учётом этих надоедливых панелей управления на iOS, но я больше не мог с этим жить — это просто режет глаза
![]()
@ThisSource это был первый чат-бот на базе ИИ для Discourse, и он всё ещё работает :).
С радостью объявляю о первом постоянном спонсоре проекта Chatbot — компании Surety, которая теперь занимает новый раздел «Спонсоры проекта» в README.
Surety стремится предоставлять профессиональный мониторинг сигнализации и системы умного дома для энтузиастов своими руками максимально прозрачным и эффективным способом, идя вразрез с тенденциями в индустрии домашней безопасности.
Спасибо, Surety!
Если вы хотите стать спонсором одного из моих проектов, ознакомьтесь с этим: Sponsor @merefield on GitHub Sponsors · GitHub ![]()