Будет ли RAG поддерживать PDF-файлы в будущем?

2 поста были перемещены в новую тему: Задачи Rake в плагине AI не работают

Это теперь поддерживается, и базовая документация доступна по адресу:

Обратите внимание: для улучшенной обработки на данный момент потребуются изменения в контейнере, так как @featheredtoast / @tgxworld находились в процессе рефакторинга поддержки ImageMagick, и мы по ошибке отключили поддержку Ghostscript.

Это можно настроить вручную, но это выходит за рамки того, что я могу опубликовать здесь, так как процесс включает в себя множество тонких шагов. Поэтому тем, кто ожидает улучшенной обработки, дайте нам несколько недель.

7 лайков

Очень верные замечания. Кроме того, в некоторых PDF-файлах есть текст, но это просто ленивые сканы в виде графических файлов, а не реальный текст.

1 лайк