Temos o prazer de anunciar o Discourse AI, um novo plugin e nossa solução completa para integrar Inteligência Artificial e Discourse, possibilitando novos recursos e aprimorando os existentes. Com este primeiro lançamento, estamos enviando 7 módulos diferentes de Discourse AI para ajudar gerentes de comunidade, membros e moderadores com várias tarefas, desde análise de sentimento até revisão automática e sugestões de edição. Leia e descubra mais detalhes sobre cada um desses recursos, bem como o que está por vir em nosso roteiro!
Este é um tópico de discussão complementar para a entrada original em https://blog.discourse.org/2023/04/introducing-discourse-ai/
Este é um impressionante corpo de trabalho, @Falco e equipe. Realmente animado para ver como tudo isso funciona na prática e seu impacto no gerenciamento da comunidade em geral.
Estas são as atualizações que parecem abrir um novo presente de Natal.
Nós (no momento em que escrevo) não temos um gerente dedicado para nossa comunidade, e ferramentas como esta nos permitem continuar a escalar sem uma função dedicada.
Sem mencionar recursos como o auxiliar de composição que simplesmente elevam a experiência do usuário.
Sim, estamos planejando explorar essa área. O complicado é que temos apenas um pequeno número de exemplos para alimentar o GPT-4, dadas as limitações de prompt, e atingir os limites de tokens é muito difícil. No entanto, existem várias outras abordagens que podemos seguir e exploraremos e reportaremos.
Mesmo com muito pouco ajuste fino, o GPT-4 não faz um trabalho terrível avaliando coisas:
Você poderia tentar com uma postagem que contenha um longo bloco de código ou saída do syslog? Essas estão sendo marcadas como spam pelo akismet o tempo todo em nosso site.
Provavelmente, mas ficaria super caro ajustar um modelo. Algumas pessoas obtêm resultados muito bons simplesmente usando embeddings, essa é provavelmente a próxima coisa a tentar.
Quando verifiquei, o ajuste fino é muito mais barato do que eu esperava. depende muito de quantos dados de treinamento você planeja usar, mas se a comparação for com o tamanho que você pode ajustar em um único gpt 4, são centavos
Eu não cheguei ao ponto de usá-lo, então é provável que eu tenha perdido alguma coisa, então, por favor, me corrija se eu estiver errado
O treinamento pode ser muito, muito caro. No meu caso, para nossos cálculos de treinamento, apenas para o treinamento mínimo recomendado pela OpenAI, estaríamos falando de quase US$ 200.000 para treinamento em um único caso de uso.
Novos usuários ainda se confundem com os limites do TL1?\n\nSe sim, acho que a IA poderia ser uma boa solução para isso, permitindo que novos usuários façam mais, mas com a IA prestando muita atenção a eles, e colocando no fila de moderação se não tiver certeza de que está tudo bem.
Sem problemas, @Falco. Estava fazendo um teste nisso hoje e parece muito promissor, mesmo um prompt trivial se sai surpreendentemente bem. Spam é simplesmente muito, muito spam.
Deixarei para o Falco compartilhar os detalhes.
Outra abordagem interessante que podemos possivelmente combinar é usar o banco de dados vetorial. Se você postar algo e o vetor estiver próximo de outros 20 spams… bem, provavelmente é spam. Essa abordagem permite o ajuste fino.
Para ser honesto, vejo o futuro do Akismet como não muito brilhante. Matt deve estar estressado com o longo prazo aqui para isso.