Ich brauche eure Hilfe bei einem Problem. Wir haben viele Themen, die als HTML in der Datenbank gespeichert sind (raw_data), aber es handelt sich um HTML, das aus einem anderen System „migriert
Wir haben eine integrierte HTML-zu-Markdown-Konvertierungsbibliothek. Sie ist nicht perfekt, erfüllt aber ihren Zweck für die Zitationsfunktion.
Du könntest zwar alle Beiträge damit verarbeiten, aber das, was du hier beschreibst, klingt für mich nach einem erheblichen Maß an individueller Arbeit. Ich würde empfehlen, dich im Marketplace an die Community zu wenden und den Auftrag mit einem entsprechenden Geldwert zu versehen.
Das ist eine Sache, die ich mache. Du kannst Jay unter Jay@literatecomputing.com eine E-Mail schreiben.
Tatsächlich gefällt mir dein html2markdown-Parser sehr gut, und ich würde ihn gerne außerhalb von Discourse für meine tägliche Arbeit einsetzen. Hast du Tipps, wie man ihn in ein Textfeld-Beispiel extrahieren kann?
Es gibt keine Knappheit an html2markdown-Parsern. Aaron Swartz hat zum Beispiel einen geschrieben.
Der Unterschied ist, dass ich deinem vertraue, dass er genau das tut, was ich will – nicht mehr und nicht weniger.
Vielen Dank.
LQ