Backfill de Resumo de IA está desperdiçando tokens ao resumir PMs

Resumo de IA Backfill está resumindo PMs e tópicos adequados. Em PMs, não há botão de resumo, então não há como ver o resumo. Ou não resumir PMs, ou adicionar um botão a PMs. Eu voto para não resumir PMs.

Parece que temos muito mais PMs do que tópicos adequados, então isso é uma grande ineficiência.

EDIT: Eu tenho ai pm summarization allowed groups definido como everyone. Isso afeta o backfilling? Ou apenas quem pode apertar o botão?

Como você mesmo descobriu, existe o botão se você estiver nos grupos permitidos definidos.

Como planejamos permitir a exibição de resumos curtos na lista de MPs e usar ambos os resumos para ajudar nosso próximo recurso de pesquisa de IA, eles são necessários por vários motivos.

Dito isso, podemos introduzir uma configuração para pular MPs aqui, da mesma forma que fizemos para embeddings.

2 curtidas

Dilema muito interessante…. Prevejo que em minha comunidade, em um futuro próximo, a divisão tópico/PM será de 50/50. Posso entender por que para algumas comunidades seria altamente antieconômico incluir PMs em qualquer coisa relacionada à IA e por que em outras seria inestimável. Talvez o ideal fosse ter um método pelo qual os administradores de discussão pudessem decidir desde o início se incluir ou não PMs? Dessa forma, pode haver uma decisão executiva tomada com base no tipo de comunidade, pois às vezes a IA não tem papel a desempenhar quando se trata de PMs básicas de perguntas e respostas, e outras vezes pode ser crucial se a comunidade compartilha informações pesquisáveis/valiosas via PM.

Não obstante, a busca é fundamental aqui: o seu tipo de comunidade se beneficia da geração de embeddings para PMs ou não? No final, acho que requer uma decisão final.

1 curtida

Nossa proporção é de 10 PMs para cada tópico normal:

topic_type total_count
Mensagens Privadas 52130
Tópicos Normais (Regulares) 5399

(O código do Explorador de Dados é uma cortesia do ChatGPT o1.)

Os tópicos normais geralmente usam um pouco mais de tokens de entrada do que os PMs, o que mitiga um pouco o problema, mas ainda assim.

2 curtidas