Treinando um modelo com postagens de um site?

Talvez não esteja no escopo, mas seria interessante treinar um modelo com todas as postagens do meu fórum e usá-las para criar um bot de IA de usuário especialista com o qual os usuários pudessem interagir, ou que pudesse responder a perguntas dos usuários por conta própria em tópicos, e vincular/citar postagens relevantes do passado.

3 curtidas

Eu entendo, mas existem enormes problemas de escalabilidade aqui. O treinamento é terrivelmente caro e nem mesmo está disponível no GPT 3.5 / 4.

A indústria está investindo muito em

  1. Aumentar os números de tokens (por exemplo, Anthropic com contexto de 100 mil tokens)
  2. Bancos de dados vetoriais para embeddings e dependendo de embeddings para contexto
6 curtidas

Chatbot já faz isso sem precisar de treinamento. Ele é até usado comercialmente.

(Ah, não tenho certeza por que isso foi reaberto.)

2 curtidas