Eine KI kann hilfreich sein, wenn lange Themen durchforstet und analysiert werden.
Hier ist mein aktuelles Vorgehensmodell zur Nutzung von Daten eines Themas im Kontext eines KI-Sprachmodells:
- Alle Diskussionsbeiträge eines Themas herunterladen.
- Extrahieren der relevanten Daten.
- Hochladen der relevanten Daten in ein KI-Sprachmodell.
- Datenbezogene Abfragen an das KI-Sprachmodell.
Herunterladen aller Diskussionsbeiträge zu einem Thema:
- Dies ist über das CLI-Programm „discourse-reader“ möglich.
- Erforderlich:
- Einmalige Beantragung eines Benutzer-API-Schlüssels.
- Autorisierung des API-Schlüssels in den (Forum-)Benutzereinstellungen.
Einmalige Beantragung eines Benutzer-API-Schlüssels:
- Dies ist über das CLI-Programm „discourse-user-api-key“ möglich.
- Der genaue Workflow ist in der Hilfe des Programms beschrieben.
Der Download eines Themas führt zu einer komplexen JSON-Datei:
{
"meta_data": ...,
"post_data": [ ... ]
}
Beispiel:
# Thema aus Forum herunterladen
discourse-reader -forum="meta.discourse.org" -topic=210780 -output="210780.json" -userapikey="107dc02b7fad3bc217b6f0c121fdc805"
Extrahieren der relevanten Daten:
- Dies ist über das CLI-Programm „jq“ möglich.
- Änderungen an den JSON-Daten sind ebenfalls möglich.
Beispiel:
# Unnötige Daten herausfiltern
# Metadaten
jq '.meta_data | {title, created_by:.details.created_by.username, created_at, id, posts_count, last_posted_at}' 210780.json > 210780.compact.json
# Post-Daten
jq '.post_data[] | .post_stream.posts[] | {post_number, username, created_at, reply_to_post_number, post:.cooked, reactions, accepted_answer}' 210780.json >> 210780.compact.json
Hochladen der relevanten Daten in ein KI-Sprachmodell.
Datenbezogene Abfragen an das KI-Sprachmodell.
- Ein einfaches CLI-Programm wird in Kürze zu diesem Zweck entwickelt.
- Anfänglich kann die Browser-Oberfläche eines KI-Sprachmodells genutzt werden.
Die genannten Programme finden Sie auf GitHub.
Und hier ist ein Anwendungsbeispiel für Thema 210780 aus diesem Forum:
https://meta.discourse.org/t/matrix-protocol-for-chat/210780/
KI - Google Gemini 2.0 (exp)
Prompt an Gemini:
Erstelle eine Liste mit der Anzahl der Beiträge pro Benutzer.
Erstelle eine kurze Zusammenfassung der Diskussion.
Was ist das Ergebnis der Diskussion?
Was sind die nächsten Schritte?
Antwort von Gemini:
Beiträge pro Benutzer:
- mattdm: 4
- david: 1
- sam: 4
- AquaL1te: 2
- seong: 1
- Stephen: 1
- satonotdead: 1
- user12: 1
- attj: 1
- Falco: 3
- halfshot: 2
- merefield: 2
- anarcat: 1
- dan: 1
- rokejulianlockhart: 3
- volanar: 4
- mcdanlj: 1
- jimkleiber: 2
- sunjam: 6
- dubwoc: 1
- davy: 2
- Lhc_fl: 1
- Thomas_Rother: 12
- thoka: 2
- mcwumbly: 4
- joshsimmons: 2
- hellekin: 5
- kOS: 1
Zusammenfassung der Diskussion:
Die Diskussion dreht sich um die Idee, das Matrix-Protokoll in Discourse-Chats zu integrieren. Der anfängliche Vorschlag ist, Discourse-Chaträume zu Matrix-Räumen zu machen, was nahtloser wäre als eine Brücke. Die Teilnehmer sehen den Reiz darin, viele äußern starke Unterstützung für Matrix als offenen, föderierten Standard. Es gibt jedoch Bedenken, dass Benutzer weniger wahrscheinlich mit dem „langsamen Modus“ (Themen) interagieren, wenn sie Nicht-Discourse-Matrix-Clients verwenden. Andere weisen darauf hin, dass auch die Trennung von Chat und Foren auf verschiedenen Plattformen eine Hürde darstellt. Die Diskussion berührt auch das Potenzial zur Föderation von Discourse-Instanzen über Matrix sowie die Nutzung von ActivityPub.
Die Entwicklung eines Matrix-Bridge-Plugins für Discourse-Chats wird erwähnt und seine Fähigkeiten werden dargelegt. Allerdings wird auch die fehlende Ende-zu-Ende-Verschlüsselung im Discourse-Chat diskutiert. Die Komplexität der Benutzerzuordnung, Proxys und der Gesamtaufwand werden als erhebliche Herausforderungen hervorgehoben. Es besteht Konsens über die Vorteile der Interoperabilität zwischen Discourse-Chat und Matrix, insbesondere angesichts der zunehmenden Verbreitung von Matrix durch große Organisationen.
Ergebnis der Diskussion:
Obwohl es viel Enthusiasmus und Unterstützung für die Idee einer Matrix-Integration mit Discourse-Chats gibt, hebt die Diskussion erhebliche Herausforderungen hervor, darunter:
- Benutzerverwaltung: Die Zuordnung von Benutzern zwischen den beiden Systemen ist komplex.
- Technische Schwierigkeiten: Die Implementierung einer robusten Brücke ist ein erhebliches Unterfangen und erfordert möglicherweise spezifische Fähigkeiten.
- Ressourcenbeschränkungen: CDCK hat dies aufgrund begrenzter Ressourcen nicht priorisiert und noch keinen überzeugenden Business Case gesehen.
- Finanzierungsprobleme: Die Möglichkeit, Fördermittel vom deutschen Fonds für digitale Infrastruktur zu erhalten, ist verstrichen.
Der vorhandene Brückencode wird als guter Ausgangspunkt angesehen, gilt aber als im Alpha-Stadium, schlecht dokumentiert und entwicklungsbedürftig. Es gibt keine klare Zusage von CDCK, diese Integration zu priorisieren, es sei denn, es werden externe Mittel gesichert oder Kunden fordern die Anfrage und sponsern die Entwicklung. Die Diskussion endet ohne klaren Weg nach vorne oder Zusage zur Umsetzung.
Nächste Schritte:
- Finden eines qualifizierten Entwicklers: Die größte Hürde ist der Bedarf an einem Entwickler mit Fachkenntnissen in Matrix und Discourse.
- Kundensponsoring: Es wurde kein Business Case zur Rechtfertigung der Entwicklung erstellt; ein Kunde muss möglicherweise die Anstrengung sponsern.
- Austausch mit der Matrix Foundation: Engerer Austausch mit der Matrix Foundation für Unterstützung, technische Anleitung und potenzielle Finanzierungsmöglichkeiten.
- Bewertung des bestehenden Codes: Überprüfung des bestehenden Codes zur Bewertung der benötigten Entwicklung für einen Beta-Status und ob dies ein wartbarer Ansatz ist.
- Community-Initiative: Prüfung der Möglichkeit, dass die Community ein Drittanbieter-Plugin entwickelt.
- Crowdfunding: Bewertung des Potenzials für Crowdfunding.
- OFFDEM-Diskussion: Weitere Diskussion von Finanzierungsmöglichkeiten bei der nächsten OFFDEM.