Apresentando o Discourse AI

Temos o prazer de anunciar o Discourse AI, um novo plugin e nossa solução completa para integrar Inteligência Artificial e Discourse, possibilitando novos recursos e aprimorando os existentes. Com este primeiro lançamento, estamos enviando 7 módulos diferentes de Discourse AI para ajudar gerentes de comunidade, membros e moderadores com várias tarefas, desde análise de sentimento até revisão automática e sugestões de edição. Leia e descubra mais detalhes sobre cada um desses recursos, bem como o que está por vir em nosso roteiro!


Este é um tópico de discussão complementar para a entrada original em https://blog.discourse.org/2023/04/introducing-discourse-ai/
62 curtidas

Este é um impressionante corpo de trabalho, @Falco e equipe. Realmente animado para ver como tudo isso funciona na prática e seu impacto no gerenciamento da comunidade em geral.

20 curtidas

Obrigado pelo plugin. Estou ansioso pela funcionalidade de extrair texto de imagens.

6 curtidas

Estas são as atualizações que parecem abrir um novo presente de Natal.

Nós (no momento em que escrevo) não temos um gerente dedicado para nossa comunidade, e ferramentas como esta nos permitem continuar a escalar sem uma função dedicada.

Sem mencionar recursos como o auxiliar de composição que simplesmente elevam a experiência do usuário.

15 curtidas

Uau, parece incrível! Ansioso para ter o recurso de IA no plano Business :slight_smile:

7 curtidas

Estou animado com isso e adicionarei assim que puder.

Existem planos para usar IA para detectar spam de postagens/comentários de IA? É um grande problema (em geral) nas comunidades.

9 curtidas

Legal! Mas… por que as coisas legais são sempre tão caras pra caramba :sob:

1 curtida

:eyes:

Eu gosto desta :smiley:

6 curtidas

Bem, se você quiser gerar texto ou ter respostas, existe a versão mais barata e antiga :stuck_out_tongue:

15 curtidas

Olá Rosie,

Sim, estamos planejando explorar essa área. O complicado é que temos apenas um pequeno número de exemplos para alimentar o GPT-4, dadas as limitações de prompt, e atingir os limites de tokens é muito difícil. No entanto, existem várias outras abordagens que podemos seguir e exploraremos e reportaremos.

Mesmo com muito pouco ajuste fino, o GPT-4 não faz um trabalho terrível avaliando coisas:

13 curtidas

Você poderia tentar com uma postagem que contenha um longo bloco de código ou saída do syslog? Essas estão sendo marcadas como spam pelo akismet o tempo todo em nosso site.

9 curtidas

Claro, me envie o link de alguns.

4 curtidas

Se o custo do GPT-4 for aceitável, o ajuste fino do GPT-3 não ajudaria com isso?

4 curtidas

Provavelmente, mas ficaria super caro ajustar um modelo. Algumas pessoas obtêm resultados muito bons simplesmente usando embeddings, essa é provavelmente a próxima coisa a tentar.

4 curtidas

Quando verifiquei, o ajuste fino é muito mais barato do que eu esperava. depende muito de quantos dados de treinamento você planeja usar, mas se a comparação for com o tamanho que você pode ajustar em um único gpt 4, são centavos

Eu não cheguei ao ponto de usá-lo, então é provável que eu tenha perdido alguma coisa, então, por favor, me corrija se eu estiver errado

https://openai.com/pricing

3 curtidas

O treinamento pode ser muito, muito caro. No meu caso, para nossos cálculos de treinamento, apenas para o treinamento mínimo recomendado pela OpenAI, estaríamos falando de quase US$ 200.000 para treinamento em um único caso de uso.

5 curtidas

Novos usuários ainda se confundem com os limites do TL1?\n\nSe sim, acho que a IA poderia ser uma boa solução para isso, permitindo que novos usuários façam mais, mas com a IA prestando muita atenção a eles, e colocando no fila de moderação se não tiver certeza de que está tudo bem.

Conforme solicitado: posts do Ask Fedora que não são spam e que o Akismet sinalizou:

7 curtidas

Também estou bastante curioso para saber como a análise de sentimento classifica isso!

4 curtidas

Sem problemas, @Falco. Estava fazendo um teste nisso hoje e parece muito promissor, mesmo um prompt trivial se sai surpreendentemente bem. Spam é simplesmente muito, muito spam.

Deixarei para o Falco compartilhar os detalhes.

Outra abordagem interessante que podemos possivelmente combinar é usar o banco de dados vetorial. Se você postar algo e o vetor estiver próximo de outros 20 spams… bem, provavelmente é spam. Essa abordagem permite o ajuste fino.

Para ser honesto, vejo o futuro do Akismet como não muito brilhante. Matt deve estar estressado com o longo prazo aqui para isso.

4 curtidas