Un’IA può essere utile quando si analizzano e si esaminano argomenti lunghi.
Ecco il mio attuale modello di procedura per l’utilizzo dei dati di un argomento nel contesto di un modello linguistico IA:
- Scarica tutti i post di discussione di un argomento.
- Estrazione dei dati pertinenti.
- Caricamento dei dati pertinenti in un modello linguistico IA.
- Query relative ai dati al modello linguistico IA.
Download di tutti i contributi di discussione a un argomento:
- È possibile tramite il programma CLI ‘discourse-reader’.
- Richiesto:
- Richiesta una tantum di una chiave API utente.
- Autorizzazione della chiave API nelle impostazioni utente (forum).
Richiesta una tantum di una chiave API utente:
- È possibile tramite il programma CLI ‘discourse-user-api-key’.
- Il flusso di lavoro esatto è descritto nell’aiuto del programma.
Il download di un argomento porta a un file JSON complesso:
{
"meta_data": ...,
"post_data": [ ... ]
}
Esempio:
# download topic from forum
discourse-reader -forum="meta.discourse.org" -topic=210780 -output="210780.json" -userapikey="107dc02b7fad3bc217b6f0c121fdc805"
Estrazione dei dati pertinenti:
- È possibile tramite il programma CLI ‘jq’.
- Sono possibili anche modifiche ai dati JSON.
Esempio:
# filter out unnecessary data
# meta data
jq '.meta_data | {title, created_by:.details.created_by.username, created_at, id, posts_count, last_posted_at}' 210780.json > 210780.compact.json
# post data
jq '.post_data[] | .post_stream.posts[] | {post_number, username, created_at, reply_to_post_number, post:.cooked, reactions, accepted_answer}' 210780.json >> 210780.compact.json
Caricamento dei dati pertinenti in un modello linguistico IA.
Query relative ai dati al modello linguistico IA.
- A breve verrà sviluppato un semplice programma CLI a questo scopo.
- Inizialmente, è possibile utilizzare l’interfaccia del browser di un modello linguistico IA.
I programmi menzionati si trovano su GitHub.
Ed ecco un esempio di utilizzo per l’argomento 210780 da questo forum:
https://meta.discourse.org/t/matrix-protocol-for-chat/210780/
AI - Google Gemini 2.0 (exp)
Prompt per Gemini:
Crea un elenco con il numero di post per utente.
Crea un breve riassunto della discussione.
Qual è l'esito della discussione?
Quali sono i prossimi passi?
Risposta di Gemini:
Post per utente:
- mattdm: 4
- david: 1
- sam: 4
- AquaL1te: 2
- seong: 1
- Stephen: 1
- satonotdead: 1
- user12: 1
- attj: 1
- Falco: 3
- halfshot: 2
- merefield: 2
- anarcat: 1
- dan: 1
- rokejulianlockhart: 3
- volanar: 4
- mcdanlj: 1
- jimkleiber: 2
- sunjam: 6
- dubwoc: 1
- davy: 2
- Lhc_fl: 1
- Thomas_Rother: 12
- thoka: 2
- mcwumbly: 4
- joshsimmons: 2
- hellekin: 5
- kOS: 1
Riassunto della discussione:
La discussione ruota attorno all’idea di integrare la chat di Discourse con il protocollo Matrix. Il suggerimento iniziale è di rendere le chat di Discourse delle stanze Matrix, il che sarebbe più fluido di un bridge. I partecipanti vedono l’attrattiva di ciò, con molti che esprimono un forte sostegno per Matrix come standard aperto e federato. Tuttavia, sorgono preoccupazioni sul fatto che gli utenti siano meno propensi a interagire con la “corsia lenta” (argomenti) se utilizzano client Matrix non-Discourse. Altri sottolineano che avere chat e forum su piattaforme diverse è anche una barriera. La discussione tocca anche il potenziale di federare istanze Discourse tramite Matrix, nonché l’uso di ActivityPub.
Viene notato lo sviluppo di un plugin bridge Matrix per la chat di Discourse e vengono delineate le sue capacità. Tuttavia, viene discussa anche la mancanza di crittografia end-to-end nella chat di Discourse. Le complessità della mappatura degli utenti, dei proxy e dello sforzo complessivo richiesto sono evidenziate come sfide significative. C’è consenso sui vantaggi dell’interoperabilità tra la chat di Discourse e Matrix, soprattutto data la crescente adozione di Matrix da parte di grandi organizzazioni.
Esito della discussione:
Sebbene ci sia molto entusiasmo e sostegno all’idea di un’integrazione Matrix con la chat di Discourse, la discussione evidenzia sfide significative tra cui:
- Gestione degli utenti: La mappatura degli utenti tra i due sistemi è complessa.
- Difficoltà tecniche: L’implementazione di un bridge robusto è un’impresa considerevole e potrebbe richiedere competenze specifiche.
- Vincoli di risorse: CDCK non ha dato priorità a questo, a causa di risorse limitate e non ha ancora visto un caso aziendale convincente.
- Sfide di finanziamento: L’opportunità di cercare finanziamenti dal Fondo Sovrano Tedesco è passata.
Il codice del bridge esistente è considerato un buon punto di partenza, ma è considerato in fase alfa, non ben documentato e richiede ulteriore sviluppo. Non c’è un chiaro impegno da parte di CDCK a dare priorità a questa integrazione, a meno che non vengano assicurati finanziamenti esterni o i clienti diano priorità alla richiesta e sponsorizzino lo sviluppo. La discussione si conclude senza un chiaro percorso da seguire o un impegno all’implementazione.
Prossimi passi:
- Trovare uno sviluppatore qualificato: La barriera più grande è la necessità di uno sviluppatore con esperienza sia in Matrix che in Discourse.
- Sponsorizzazione del cliente: Non è stato creato un caso aziendale per giustificare lo sviluppo; un cliente potrebbe dover sponsorizzare lo sforzo.
- Coinvolgimento con la Matrix Foundation: Coinvolgere maggiormente la Matrix Foundation per assistenza, guida tecnica e potenziali opportunità di finanziamento.
- Valutazione del codice esistente: Rivedere il codice esistente per valutare lo sviluppo necessario per uno stato beta e se questo è un approccio gestibile.
- Iniziativa comunitaria: Esplorare la possibilità che la comunità sviluppi un plugin di terze parti.
- Crowdfunding: Valutare il potenziale del crowdfunding.
- Discussione OFFDEM: Discutere ulteriori opportunità di finanziamento al prossimo OFFDEM.