这项工作背后的一项挑战是支持所有类型的 PDF。可以想象,有些 PDF 是纯文本,易于解析。然而,有些 PDF 包含自定义字体、图像、图形、非线性格式等……
我们正在努力寻找一种方法来让所有类型的 PDF 都能够正常工作,因此这可能需要一些时间。