Permettere al ChatBot di leggere i PDF per partecipare a una discussione di gruppo

Per coloro che hanno accesso a strumenti che consentono di chattare con un PDF, sarebbe bello se il Discourse AI - AI Bot potesse anche leggere i PDF e unirsi alla discussione.


Al momento gli accademici stanno apprezzando molto questa funzionalità, ma non conosco un modo per un gruppo di utenti di unirsi come gruppo con il bot per parlare del/i documento/i. Per quanto ne so, si può chattare solo da soli con il bot che ha letto il documento. Sono sicuro che esistono chat di gruppo con documenti, ma anche Discourse dovrebbe averle.

Pensala come un club del libro con un bot invitato e la discussione incentrata su uno o più documenti (PDF).



Se a qualcuno viene la brillante idea :star2: che Discourse + plugin di modelli AI (ref) = :moneybag:, spero che questo sia il primo posto in cui lo leggi.

Man mano che vengono creati sempre più plugin e bot diversi, si potrebbe eventualmente formare una garage band, :guitar: avere un incontro virtuale di programmatori :desktop_computer:, ecc.



3 Mi Piace

Per quanto riguarda Discourse Chatbot 🤖, PR benvenuti.

Chiunque è libero di contattarmi se desidera sponsorizzare questo lavoro.

Il framework che ho creato è facilmente estendibile e la lettura di PDF sarebbe una grande aggiunta. :+1:

3 Mi Piace

Avrò bisogno di personas dedicate per questo tipo di lavoro, penso che sia fattibile, si divide e si incorpora e poi si può discuterne. Ma non sono sicuro che lo mescolerei con “Aiuto Forum”… forse una persona “Esploratore Documenti”.

Caso d’uso molto interessante e dato che abbiamo così tanta infrastruttura per caricare documenti, ecc. non è un grosso sforzo costruirlo.

3 Mi Piace

Sta estraendo testo dal file e inserendolo nel prompt? Sembra una funzionalità interessante, in tal caso.

Innanzitutto, non ho creato nulla di tutto ciò, quindi posso solo fare delle ipotesi.

Sì.

I pochi plugin ChatGPT che ho provato leggono l’intero PDF, tuttavia molti leggono solo il testo poiché cercare di estrarre dati da espressioni matematiche e grafici va oltre le loro capacità. Questo è dovuto al fatto che un PDF è progettato per il layout e la presentazione e non per l’estrazione di contesto o la trasmissione di conoscenze come formato di interscambio dati.

Non sono sicuro di cosa intendi esattamente con questo, ma da quanto ho capito, incorporano la conoscenza in un database vettoriale e poi usano il prompt per estrarre le parti pertinenti e comporre una risposta.

L’analogia che uso per spiegare ad altri come comprendere il concetto è, invece di concentrarsi sull’idea di un PDF, pensare alle idee che gli autori dell’articolo stanno cercando di trasmettere nell’articolo e che si sta conversando con loro.

Se puoi eseguire plugin con ChatGPT, allora su questo sito

https://pugin.ai/

cerca PDF o paper e provali. Le due principali differenze che trovo in essi è che molti leggeranno un singolo PDF, (https://pugin.ai/p/chatwithpdf) mentre questo (https://pugin.ai/p/science) selezionerà gli articoli pertinenti da 250 milioni di articoli scientifici.


LangChain ha questo

e ci sono repository simili su GitHub (ref), YMMV.


Ecco un caso d’uso specifico per tale tecnologia per coloro che pensano che sarebbe limitata solo agli accademici.

Sfruttare gli LLM con vasti set di dati e guide meccaniche

1 Mi Piace

Che strano mettere un numero di modello nel nome di un repository! Perché non dovrebbe funzionare con il 3.5?

Per tua informazione

Anche altri stanno adottando idee simili.

1 Mi Piace