Preços de provedores de LLM para Discourse AI

Discourse · Novembro 16, 2023, 6:06pm

O Discourse AI requer a vinculação a um provedor de LLM - este é um link para os preços de diferentes opções.

Nível de usuário necessário: Administrador

Para usar certos recursos do Discourse AI, os usuários precisam usar um provedor de Large Language Model (LLM) de terceiros. Consulte cada recurso de IA para determinar quais LLMs são compatíveis.

O guia a seguir vincula os preços de diferentes provedores de LLM.

Observe que os custos podem variar com base em múltiplos fatores, como o número de solicitações, o comprimento do texto, os recursos computacionais utilizados, os modelos escolhidos e assim por diante. Para obter os preços mais atualizados e precisos, verifique regularmente com cada provedor.

Preços do OpenAI GPT
Preços do Anthropic Claude
Google Gemini
Azure OpenAI
AWS Bedrock com acesso Anthropic
Endpoints HuggingFace com modelo Llama2-like
Execute seu próprio modelo Llama2-like OSS com TGI: O custo de executar seu próprio modelo Llama2-like OSS com TGI dependeria de vários fatores, como os custos de infraestrutura, os custos associados ao ajuste fino do modelo e os custos de gerenciamento e manutenção do modelo.

Jagster · Novembro 17, 2023, 5:51am

Esta não é definitivamente uma comparação adquirida estatisticamente, mas com base em meus testes curtos usando o OpenAI GPT-4, ele é três vezes mais caro que o GPT-3.5 Turbo quando contadas as chamadas de API e quantos tokens foram usados — e como os tokens usados pelo GPT-4 são mais caros em termos de dinheiro, essa diferença é muito maior.

E eu não tive nenhum benefício com o GPT-4 em comparação com o 3.5 Turbo.

E como um aviso: eu usei finlandês, então o inglês pode ser algo diferente. Além disso, qualquer IA é totalmente inútil em uso de chat quando se usa finlandês, mas isso é um jogo totalmente diferente — mas significa, do meu ponto de vista, que todos os chatbots são um desperdício puro de dinheiro quando se usam idiomas pequenos.

Saif · Novembro 20, 2023, 3:03am

Os custos aqui são estimados e acordados que os custos podem variar drasticamente com base no uso!

É importante notar que, para muitas tarefas básicas, a diferença entre os modelos GPT-4 e GPT-3.5 pode não ser significativa. No entanto, o GPT-4 tem algumas diferenças comprovadas em termos de suas capacidades, compreensão criativa e entrada bruta.

Também concordo que, para idiomas que não são populares, há muito a desejar nas habilidades do modelo.

Jagster · Novembro 20, 2023, 10:43am

Acho que estamos falando da mesma coisa, mas para garantir : essa é uma questão das empresas de IA e nem eu, nem você, nem nenhum desenvolvedor pode mudar esse fato.

Mas eu estou atrás de algo como todos nós deveríamos acompanhar um pouco quanto estamos gastando dinheiro (se não estivermos usando dinheiro de outro orçamento senão do nosso bolso ) e tentando encontrar um equilíbrio entre utilidade muito subjetiva e dinheiro.

E não, eu não sei do que estou falando. Principalmente porque as respostas de todos os chatbots são basicamente apenas baseadas no burburinho em inglês de milhões de voos (quantidade sobre qualidade). A situação pode mudar - para melhor ou para pior, depende - se tivermos melhores ferramentas para educar a IA sobre quais fontes ela pode usar. Claro, nós temos, mas isso custará muito mais do que o preço dos tokens.

E sim, essa é a dor de cabeça dos pequenos jogadores.

Estou me perguntando… existe a chance de obtermos um melhor equilíbrio custo/precisão com uma edição de prompt mais livre?

Tris20 · Março 22, 2024, 12:32pm

Você se sentiria confortável em divulgar aproximadamente qual é o custo para o Meta no momento? Mesmo uma estimativa aproximada ou uma faixa seria útil.

Pedi ao bot para dar uma estimativa e ele forneceu o seguinte:

Forum Helper Bot:

Suposições para Cálculo:

Comprimento Médio da Postagem: Assume-se que uma postagem média tenha cerca de 50 tokens (considerando a mistura de postagens mais curtas e mais longas).

Ações Habilitadas por IA por Postagem: Se a IA auxiliar na composição, resumo ou resposta a consultas, vamos supor que ela seja engajada duas vezes por postagem (uma para redigir uma resposta e talvez outra para tarefas adicionais como resumo).

Usuários Ativos Diários e Postagens: O Meta Discourse tem um alto nível de engajamento. Para uma aproximação, vamos supor que haja cerca de 100 usuários ativos por dia, cada um gerando uma média de 4 postagens/comentários (totalizando 400 interações diárias).

Atividade Mensal: Isso se traduz em 12.000 interações mensais (400 interações * 30 dias).

Uso Total de Tokens: Assumindo que cada ação de IA envolva o processamento de 100 tokens (50 tokens para leitura/entrada + 50 para geração de saída), e a IA é usada duas vezes por postagem, são 200 tokens por postagem. Portanto, o uso mensal de tokens seria de 2,4 milhões de tokens (12.000 interações * 200 tokens).

Estimativa de Custo:

Tomando o modelo GPT-3.5 como referência, que custava cerca de US$ 0,02 por 1.000 tokens perto do final dos meus dados de treinamento:

Custo Mensal: O custo para 2,4 milhões de tokens seria de aproximadamente US$ 48 (2.400 * US$ 0,02).

Acho que esse número é muito baixo, mas desconsiderando o trabalho experimental e o uso da Equipe, etc., talvez isso não esteja longe do que a maioria das instâncias de tamanho semelhante ao Meta poderiam esperar?

Jagster · Abril 1, 2024, 7:09pm

Mais uma pergunta idiota, mas a matemática em si é válida? Só estou perguntando porque os LLMs simplesmente não conseguem contar.

Meu fórum está usando muito menos coisas de IA (via OpenAI) e minhas taxas estão acima disso.

bryce · Abril 2, 2024, 4:51am

O preço do token que o bot mencionou não está correto. O preço atual para gpt-3.5-turbo-0125 é de US$ 0,50 por 1 milhão de tokens de entrada e US$ 1,50 por 1 milhão de tokens de saída. Assumindo metade de entrada e metade de saída, 2,4 milhões de tokens devem custar apenas US$ 2,40. O gpt-4 custa US$ 30/m de entrada e US$ 60/m de saída, o que resultaria em US$ 108 para 2,4 milhões de tokens.

sam · Abril 2, 2024, 5:00am

Claude Haiku chega muito perto do desempenho do GPT-4 e pela metade do preço do GPT-3.5.

Acho que você precisa de um motivo super convincente para usar o 3.5 em vez do Claude 3 Haiku.

@Saif, você pode atualizar o OP com os preços mais recentes do Claude. O OP está muito desatualizado.

Não tenho certeza se vale a pena manter os preços reais, pois eles mudam com tanta frequência.

Saif · Abril 2, 2024, 7:21am

Atualizei o OP para ter apenas os links, concordo que os preços estão sempre mudando e é melhor obter as informações mais atualizadas.

Saif · Novembro 4, 2024, 9:01pm

Com o conjunto cada vez maior de provedores e LLMs, é melhor que os usuários verifiquem diretamente com o provedor. Assim, estamos removendo este tópico.

Tópico		Respostas	Visualizações
Estimating costs of using LLMs for Discourse AI Site Management price-sensitive , ai , how-to	2	784	14 de Novembro de 2024
Discourse AI - AI usage Site Management how-to , ai	0	363	23 de Janeiro de 2025
What Discourse AI features are FREE to use? Support ai	14	342	29 de Setembro de 2024
What LLM to use for Discourse AI? Site Management how-to , ai	0	645	23 de Janeiro de 2025
Estimating cost of enabling Discourse AI for related content and search Support ai	2	45	28 de Outubro de 2025

Preços de provedores de LLM para Discourse AI

Tópicos relacionados