Wird RAG in Zukunft PDF-Dateien unterstützen?

JSON ist nur Text, daher unterstützen wir ihn bereits.

Es ist eine ineffiziente Darstellung für LLMs, da das Format viel Duplizierung aufweist, was einige Tokens verschwendet, aber insgesamt wird es funktionieren. Ich würde empfehlen, ein Skript darauf auszuführen und es neu zu formatieren, um die RAG-Leistung zu verbessern.

Es ist sehr schwierig, dies automatisch zu tun, da JSON sehr verschachtelt sein kann und die Auswahl einer perfekten domänenspezifischen Textdarstellung stark von der Domäne abhängt.

3 „Gefällt mir“