确认,给我几天时间,我也想尝试直接文本提取,这是我们可以默认启用的功能。
然后,“丰富”的基于 LLM 的提取可以放在标志后面。
许多 PDF 的麻烦在于它们非常大,并且可能非常消耗服务器资源。此外,像 tesseract 这样的东西可能有点难安装——它可以提高质量。
确认,给我几天时间,我也想尝试直接文本提取,这是我们可以默认启用的功能。
然后,“丰富”的基于 LLM 的提取可以放在标志后面。
许多 PDF 的麻烦在于它们非常大,并且可能非常消耗服务器资源。此外,像 tesseract 这样的东西可能有点难安装——它可以提高质量。