Apresentando o Discourse AI

EricGT · Maio 3, 2023, 9:57am

Para aqueles que estão se perguntando o que é um banco de dados vetorial

Observação: Isso é de um fornecedor comercial de banco de dados vetorial, mas ainda é a melhor introdução que conheço e é o mesmo banco de dados vetorial usado pela OpenAI.

Para entender o que um vetor significa em relação a um modelo transformer, veja este vídeo técnico no YouTube

sam · Maio 3, 2023, 10:01am

Usamos o GitHub - pgvector/pgvector: Open-source vector similarity search for Postgres no discourse-ai, mas estamos pensando em outras ideias a longo prazo, como weaviate / elastic / milvus

Pinecone é um usuário do Discourse https://community.pinecone.io/

gkogan · Maio 3, 2023, 12:51pm

Olá @sam, sim, de fato, somos clientes felizes do Discourse, e uma das combinações mais comuns com o GPT-4 para o caso de uso exato que você mencionou — veja os logotipos + citações em nossa página inicial. Podemos ajudá-lo com um POC?

sam · Maio 3, 2023, 10:53pm

Com certeza, vou conectar você com o @Falco e vocês podem conversar.

Acho que seria ótimo se o discourse-ai viesse com um adaptador pinecone também, isso reduz uma quantidade enorme de atrito para os auto-hospedeiros de nossa plataforma.

Fabio_Machado_de_Oli · Maio 4, 2023, 6:22pm

Parece que você pesquisou os custos de treinamento, mas eu queria compartilhar meu entendimento com base no guia de fine-tuning da OpenAI. Se eu entendi corretamente https://platform.openai.com/docs/guides/fine-tuning, eles recomendam usar Ada para tarefas de classificação e fornecer 100 exemplos de cada classe. Nesse caso, teríamos um total de 200 exemplos (spam e não spam). Assumindo que um exemplo médio consiste em 500 tokens, o total seria 500 * 200 = 100.000 tokens em Ada, o que custaria US$ 0,04 para treinar. Se você usasse Davinci em vez disso, o custo seria de US$ 3,00.

Eu acho que o preço pode ser para uma única etapa ou uma única época de treinamento, mas não consegui encontrar informações mais detalhadas no site deles. Por favor, me avise se você tiver alguma informação ou se eu entendi alguma coisa errada.

jordan-violet · Maio 4, 2023, 6:47pm

Como mencionei, esses custos foram para o meu caso de uso para o meu negócio. Meu treinamento e uso é Davinci, não Ada, então 75x mais caro lá. Nós também praticamente usamos o máximo de tokens por solicitação.

Não sei exatamente o que Sam/Falco teriam em mente para o caso de uso deles — apenas mencionando em geral que o ajuste fino pode ser caro em escala!

byronvoorbach · Maio 4, 2023, 7:00pm

Parabéns pelo lançamento @sam e @Falco!

Ficarei feliz em apoiar o Discourse com a avaliação do Weaviate!

Tópico		Respostas	Visualizações
ChatGPT Assistant Integration Support	5	1428	11 de Fevereiro de 2024
Discourse AI plugin with self hosted discourse site Support ai	2	354	9 de Julho de 2024
Discourse AI Plugin official , included-in-core , ai	83	42772	21 de Janeiro de 2026
How do you use Discourse AI? Tell us and make it even better! Feature feedback , ai	20	2663	2 de Março de 2025
Enterprise: Discourse AI Guide Enterprise	0	114	1 de Junho de 2026

Apresentando o Discourse AI

Tópicos relacionados