Discourse AI - Guida di installazione autonoma

Discourse · 24 Aprile 2023, 7:40pm

Questa è una guida destinata all’esecuzione delle proprie istanze dei servizi che alimentano i moduli di Discourse AI.

Introduzione

Se si desidera utilizzare Discourse AI sulla propria istanza self-hosted, potrebbe essere necessario eseguire anche i servizi complementari per i moduli che si desidera abilitare.

Ogni modulo ha uno o più servizi complementari necessari, e tali servizi utilizzano più CPU / GPU / spazio su disco rispetto a Discourse stesso, quindi tieni presente che questo non è consigliato per persone non familiari con l’amministrazione di server Linux e Docker.

Riassunto / AI Helper / AI Bot

Embeddings

Sentiment

Esecuzione in produzione

Potrebbe essere opportuno posizionare questo servizio dietro un reverse proxy per abilitare funzionalità come il bilanciamento del carico, TLS, controlli di integrità, limiti di frequenza, ecc. quando si esegue su un sito live.

Dopo che il servizio è attivo e in esecuzione, configura il modulo per connettersi al dominio in cui è in esecuzione il servizio utilizzando l’impostazione del sito appropriata e quindi abilita il modulo.

satonotdead · 26 Aprile 2023, 12:10pm

L’helper del compositore non è possibile da auto-ospitare per ora?

Complimenti al team per questo sviluppo e implementazione

Falco · 26 Aprile 2023, 1:06pm

Composer Helper funziona solo con le API OpenAI o Anthropic per ora, quindi funzionerà perfettamente in situazioni self-hosted a condizione che tu disponga di una di quelle API.

JoeD · 28 Aprile 2023, 5:44pm

Ho Composer Helper in funzione, grazie!

La riassuntivazione richiede un servizio di classificazione locale? O funzionerà solo con una chiave API di OpenAI se si utilizza il modello ChatGPT3.5? L’ho attivato ma non lo vedo nei topics.

Falco · 28 Aprile 2023, 5:48pm

Secondo Discourse AI - Summarization puoi usarlo con OpenAI configurando la chiave OpenAI (cosa che hai già fatto), selezionando uno dei modelli GPT come modello di riassunto e abilitando il modulo di riassunto.

Il pulsante di riassunto viene visualizzato solo per i topic con più di 50 risposte al momento, ma lo abiliteremo presto per tutti i topic.

nodomain · 29 Aprile 2023, 7:45pm

Puoi condividere alcune richieste di esempio? Attualmente sto cercando di configurarlo in un AWS ASG su un’istanza EC2 e non riesco a farlo funzionare; vedo solo 400 bad request nei log di Discourse.

Inoltre, un URL di controllo di integrità sarebbe fantastico, / restituisce un errore 404.

Falco · 29 Aprile 2023, 7:58pm

/srv/ok e /health sono gli endpoint di health check.

A memoria qualcosa del tipo:

jo -p model=bart-large-cnn-samsum content="La frase lunga da riassumere va qui" | \
  curl --json @- -XPOST http://service/api/v1/classify

Per il servizio di riassunto dovrebbe funzionare.

satonotdead · 30 Aprile 2023, 10:04pm

Puoi suggerire di utilizzare un servizio di riassunto su localhost con healthcheck dal modulo Nginx se siamo d’accordo con i limiti e il carico?

Voglio solo provare modelli open-source, al momento lo abbiamo fatto funzionare con le chiavi API di OpenAI.

Ci sono piani per abilitare il multilinguismo sul riassunto utilizzando modelli come ChatGPT3.5 che sono resi compatibili?

Falco · 30 Aprile 2023, 10:11pm

Se è quello che vuoi, dovrebbe funzionare, sì.

Il riassunto funziona già con le API di OpenAI e Anthropic, quindi ti darà capacità multilingue. Potrebbe essere necessario fare un po’ di hacking per tradurre il prompt in modo che rimanga più ancorato alla lingua dell’argomento.

nodomain · 3 Maggio 2023, 7:59pm

Buone notizie da AWS: Amazon RDS for PostgreSQL now supports pgvector for simplified ML model integration - AWS

Drew-ART · 15 Giugno 2023, 10:19pm

@Falco Saresti così gentile da fornire un esempio di configurazione del server che disponga di ‘abbondante CPU / GPU / disco’ e possa eseguire l’IA self-hosted accanto a un forum Discourse medio?

DonH · 16 Giugno 2023, 4:12pm

Vorrei vederlo anch’io, per favore. Inoltre, considerando il requisito di risorse, sarebbe meglio (possibile, più conveniente?) scaricare i servizi AI companion su un VPS separato?

esempio di configurazione del server

Falco · 16 Giugno 2023, 4:19pm

Dipende dai modelli e dai moduli esatti di Discourse AI che si desidera eseguire. Ad esempio, il modulo di tossicità utilizza 5 GB e quello NSFW utilizza 1 GB di RAM. Lo spazio su disco è simile, e CPU/GPU vengono utilizzati per l’inferenza, quindi le tue esigenze dipendono dal numero di richieste al secondo che ti aspetti di avere.

Sì, questo è probabilmente il modo migliore.

Drew-ART · 17 Giugno 2023, 4:04am

Va bene, ho provato a fare una stima:

Stime approssimative:

API ChatGPTv4

0,0008 $ per 100 parole
1 utente utilizza in media circa 100 parole (o token) al giorno per ciascun modulo AI
Esecuzione di tutti e 6 i moduli AI
0,0008 * 6 = 0,0048

Costo mensile totale per utente: 0,0048 * 30 = 0,144

I requisiti minimi del server per l’auto-hosting sono circa:

16 GB di RAM libera, 32 preferiti
CPU da 3,5 GHz o superiore e 8 core o più
SSD da 100 GB

Il server a costo più basso che soddisfa questi requisiti su Digital Ocean è:

RAM da 16 GB
8 vCPU Intel Premium (oltre 3,5 GHz)
Larghezza di banda: 6.000 GiB
SSD: 2x 200 GiB
Costo mensile: 244,00 $

Quindi, l’auto-hosting di ChatGPT4 sarà più conveniente rispetto all’utilizzo del suo servizio API quando Discourse avrà circa 2.000 utenti attivi al mese.

Con un arrotondamento piuttosto approssimativo e generoso. Ti sembra corretto @Falco

sam · 17 Giugno 2023, 5:39am

GPT-4 o 3.5 non possono essere auto-ospitati.

Alcuni LLM sono open source come Falcon o vari modelli basati su LLaMA (che presentano problemi di licenza) possono essere auto-ospitati, ma finora sono tutti inferiori a GPT 4 o persino a 3.5.

Il tuo calcolo approssimativo lì è completamente sbagliato, se hai intenzione di auto-ospitare un LLM, probabilmente vorrai una A100 o una H100, magari alcune di esse… prova a cercare i prezzi su Google…

Drew-ART · 17 Giugno 2023, 7:39am

Immagino che questo sia ciò che si ottiene quando si usa ChatGPT per aiutarti a calcolare i costi di self-hosting di ChatGPT.

Drew-ART · 17 Giugno 2023, 8:12am

Comunque, proverò a contribuire con qualcosa e tornerò per aggiornarlo quando avrò dei dati utente da confrontare.

Ecco i calcoli che ho eseguito per l’utilizzo dell’API di ChatGPT3.5 con i moduli sopra, basati sulla vaga supposizione che un utente attivo medio in un mese generi in media 100 parole per esecuzione:

Costi API ChatGPT3.5

$0,0003 per 100 parole in un’esecuzione
1 utente attivo genera in media circa 100 parole al giorno su ciascun modulo AI

Costo mensile medio per plugin/componente AI: 0,009

6 = $0,054

Ciò si traduce in un costo mensile totale per utente per tutti e 6 i plugin di $0,054 se vengono eseguiti su ChatGPT3.5.

Falco · 29 Giugno 2023, 4:14pm

Abbiamo appena iniziato a gestire i servizi AI qui per Meta in un g4dn.xlarge, quindi ora posso raccomandarlo come linea di base.

DonH · 29 Giugno 2023, 5:48pm

Grazie. I prezzi attuali sono riportati qui per chiunque si chieda cosa sia un g4dn.xlarge. Spero che tu possa pubblicare dati di utilizzo a un certo punto in modo da poter avere un’idea dei costi reali.

Falco · 29 Giugno 2023, 5:55pm

La macchina è fondamentalmente inattiva con solo traffico Meta. Potrebbe gestire tranquillamente qualche Meta di traffico.

Argomento		Risposte	Visualizzazioni
關於Discourse AI Support ai	6	764	Ottobre 1, 2024
Discourse AI plugin with self hosted discourse site Support ai	2	207	Luglio 9, 2024
Discourse AI Plugin official , included-in-core , ai	89	37626	Ottobre 14, 2025
Introducing Discourse AI Blog	26	3630	Maggio 4, 2023
I want to install Discourse AI on Discourse Installation ai	13	480	Giugno 18, 2024