Aktuelle Einschränkung:
• Die semantische Suche im Forum indiziert nur den Beitragstext, nicht PDF-Anhänge
• PDF-Dateien sind über den /search KI-Umschalter nicht durchsuchbar
• Um dies zu umgehen, musste ich PDFs manuell separat in die Persona RAG hochladen
Vorgeschlagene Lösung:
• Text aus PDF-Anhängen während der Einbettungsgenerierung extrahieren
• PDF-Inhalte neben dem Beitragstext indizieren
• Themen mit PDF-Anhängen über die semantische Suche auffindbar machen
Vorteile:
• Benutzer finden technische Dokumentation über die Forums-Suche
• Kein Duplizieren von Inhalten erforderlich (Forumbeitrag + RAG-Upload)
• Bessere SEO (PDFs, die an indizierte Themen angehängt sind)
• Vereinfachte Architektur (Der Suchbefehl funktioniert einfach)
Wenn Sie dies implementieren würden, könnte ich möglicherweise:
Erzwingen von Tools entfernen (Die Suche würde PDF-Inhalte auf natürliche Weise finden)
RAG-Uploads vollständig eliminieren (alles in Forumsthemen)
Ich denke, ein Plugin könnte den Text in einem optional versteckten Details-Element zum verarbeiteten Beitrag hinzufügen. Das würde ihn hinzufügen, sodass er gefunden werden könnte, denke ich. Wenn Sie selbst hosten, würde die Entwicklung wahrscheinlich nur ein paar hundert Dollar kosten. Oder, wenn es so klingt, als wären sie interessiert, könnte es als PR eingereicht werden, für etwa doppelt so viel (um Tests und Ähnliches einzuschließen).
Zu Ihrer Information: Ich habe festgestellt, dass das Hochladen von PDF-Dateien in die Persona die Suche nach „normalen“ Foreninhalten in der KI-gestützten Suche verhindert hat. Ich habe mich daher für eine Kombination aus (a) der Konvertierung der wichtigsten Dateien in Markdown (damit ich sie direkt als Themen posten kann) oder (b) dem Herausfiltern der wichtigsten Schlüsselwörter/Inhaltsverzeichnisse usw. und deren Veröffentlichung zusammen mit den PDF-Dateien in den Foren entschieden. Ich musste auch von GPT 4.1 auf Sonnet 4.5 umsteigen und HYDE deaktivieren, um es zuverlässig zu machen.