Это руководство объясняет, как включить и использовать нативную поддержку вложений PDF и других документов при взаимодействии с ИИ-ботами в Discourse. Пользователи могут загружать PDF-файлы и другие документы напрямую в диалогах с ИИ-агентами.
Требуемый уровень пользователя: Администратор
Краткое содержание
Discourse AI теперь поддерживает нативную обработку вложений, позволяя пользователям загружать PDF-файлы и другие типы документов напрямую во время общения с ИИ-ботами. ИИ может читать и понимать содержимое этих вложений, что открывает возможности для таких сценариев, как анализ документов, их резюме и ответы на вопросы на основе загруженных файлов.
Для работы этой функции необходимо:
- Настройка разрешённых типов вложений для LLM
- Агент с включённой функцией «Vision» (это определяет, будут ли вложения включаться в сообщения)
- Разрешение расширения файла в настройках загрузки вашего сайта
Поддерживаемые провайдеры
Нативная поддержка вложений работает с моделями следующих провайдеров:
- Anthropic (модели Claude)
- AWS Bedrock (модели Claude через Bedrock)
- Google (модели Gemini)
- OpenAI (модели GPT)
- Azure (модели, совместимые с OpenAI)
- OpenRouter (модели, совместимые с OpenAI)
Каждый провайдер обрабатывает вложения по-своему на уровне API, но Discourse AI автоматически управляет этим процессом. Помните, что разные провайдеры реализуют различные уровни поддержки для разных типов вложений.
Поддерживаемые типы вложений
Для обработки ИИ можно настроить следующие типы документов:
| Тип | Расширения |
|---|---|
pdf |
|
| Простой текст | txt |
| Microsoft Word | doc, docx |
| Формат Rich Text | rtf |
| HTML | html, htm |
| Markdown | md, markdown |
Изображения обрабатываются отдельно через настройку «Vision enabled» и не требуют конфигурации типа вложения.
Настройка
Шаг 1: Разрешение расширений файлов для загрузки
Прежде чем пользователи смогут загружать вложения, убедитесь, что соответствующие расширения файлов разрешены в настройках вашего сайта.
- Перейдите в раздел Admin → Files
- Найдите настройку
authorized extensions - Добавьте нужные расширения (например,
pdf|txt|docx)
Шаг 2: Настройка модели LLM
- Перейдите в раздел Admin → Plugins → Discourse AI → LLMs
- Выберите модель LLM, которую хотите настроить (или создайте новую)
- В поле Allowed attachments выберите или введите расширения файлов, которые модель должна принимать (например,
pdf,txt,docx)
Если оставить поле «Allowed attachments» пустым, вложения документов будут отключены для этой модели. Изображения управляются отдельно через переключатель «Vision enabled».
Шаг 3: Настройка агента
- Перейдите в раздел Admin → Plugins → Discourse AI → Agents
- Выберите или создайте агента
- Убедитесь, что включена опция Vision enabled — это определяет, будут ли вложения (как изображения, так и документы) включаться в сообщения, отправляемые LLM
- Установите Default model на LLM, для которой настроены вложения
Как это работает
Когда пользователь загружает документ в диалоге с ИИ-ботом:
- Документ загружается в Discourse с использованием стандартной обработки загрузок
- Discourse AI кодирует содержимое документа (base64)
- Закодированное содержимое отправляется в LLM вместе с сообщением пользователя
- LLM обрабатывает как текстовое сообщение, так и содержимое документа
- ИИ отвечает, опираясь на объединённый контекст
Технические детали
- Документы кодируются в base64 и отправляются inline с запросом
- Каждый провайдер получает вложения в своём нативном формате:
- Anthropic: Использует тип
documentс источником base64 - Gemini: Использует формат
inlineData - OpenAI (Chat Completions API): Использует тип
fileсfile_data, содержащим содержимое base64 - OpenAI (Responses API): Использует тип
input_fileсfile_data, содержащим содержимое base64
- Anthropic: Использует тип
- Ограничения по размеру файла регулируются настройкой вашего сайта
max attachment size kb
Сценарии использования
Нативная поддержка вложений позволяет реализовать следующие рабочие процессы:
- Анализ документов: Загружайте контракты, отчёты или научные статьи, чтобы ИИ мог их резюмировать или отвечать на вопросы по ним
- Проверка контента: Попросите ИИ проверить и дать обратную связь по черновым документам
- Извлечение данных: Извлекайте конкретную информацию из загруженных документов
- Помощь в переводе: Загружайте документы на одном языке и обсуждайте их содержимое или запрашивайте перевод
- Техническая поддержка: Пользователи могут загружать файлы журналов или конфигурационные файлы для помощи в устранении неполадок
Ограничения
- Размер файла: Вложения ограничены настройками размера загрузки вашего сайта и возможностями провайдера LLM
- Поддержка провайдера: Поддержка вложений требует диалекта провайдера, работающего с документами (Anthropic, AWS Bedrock, Google, OpenAI, Azure и OpenRouter)
- Требование Vision для агента: У агента должна быть включена опция «Vision enabled», чтобы вложения включались в сообщения
- Сопоставление расширений: Расширение файла должно быть разрешено для загрузки на вашем сайте и указано в конфигурации типов вложений LLM
- Различия в результатах: Поскольку обработку файлов выполняют различные вендоры LLM и сами модели, стоимость, точность и результаты могут различаться. Anthropic, как правило, использует больше токенов для анализа, чем OpenAI или Google.
- Включение кэширования: Для OpenAI обязательно используйте Responses API, который обеспечивает более стабильную поддержку кэширования (при включённом режиме «thinking»). Для моделей Anthropic может потребоваться явное включение кэширования в конфигурации LLM. Это особенно важно при многотуровых диалогах.
Устранение неполадок
Вложения не обрабатываются
- Убедитесь, что расширение файла указано в настройке
authorized extensionsвашего сайта - Проверьте, что тип файла указан в настройке «Allowed attachments» LLM
- Убедитесь, что у агента включена опция «Vision enabled» и используется правильно настроенная LLM
Загрузка не удаётся
- Проверьте настройку
max attachment size kb - Убедитесь, что расширение файла разрешено
- Очень большие PDF-файлы могут не поддерживаться; у каждого вендора LLM свои максимальные размеры загрузки
ИИ не понимает документ
- Убедитесь, что вы используете модель, поддерживающую понимание документов
- Попробуйте более мощную модель (например, Claude Sonnet 4.5, GPT-5.1, Gemini Pro 3)
Часто задаваемые вопросы (FAQ)
Могут ли пользователи загружать несколько документов в одном сообщении?
Да, пользователи могут добавлять несколько вложений в одно сообщение, и ИИ получит доступ ко всем из них.
Работает ли это в чате, а также в личных сообщениях?
Да, поддержка вложений работает как в личных сообщениях с ИИ-ботами, так и в прямых сообщениях чата, при условии, что агент настроен для этих способов взаимодействия.
Отличается ли это от загрузок RAG для агентов?
Да. Загрузки RAG — это документы, добавляемые администраторами в базу знаний агента, которые индексируются и используются для поиска. Нативная поддержка вложений позволяет конечным пользователям загружать документы во время диалога для немедленного анализа без индексации.
Что происходит с загруженными документами?
Документы обрабатываются в соответствии со стандартными политиками обработки загрузок и хранения вашего сайта. Они сохраняются как обычные загрузки Discourse.

