Comentário sobre Resumo de IA

Feedback sobre o resumo. Isso parece muito promissor :pray:

:point_up: o popup não é largo o suficiente

  • Seria ótimo oferecer opções sobre a duração do resumo. Parece que isso visa a contagem de 150-200 palavras, o que não é muito para alguns tópicos.
  • Eu adoraria personalizar o prompt. Por exemplo, eu provavelmente usaria marcadores como padrão.
  • Eu adoraria experimentar um prompt que cite quem diz o quê e referencie posts.
  • Eu desacoplaria o resumo com a configuração mínima de posts de IA do geral. O resumo com IA é provavelmente útil com menos posts.

Note que o gpt-3.5 agora tem uma versão com um limite de 16k tokens, o que pode ser muito relevante aqui.

E agora os 2 recursos matadores que eu gostaria de ver:

  • resumos diários com o recurso de resumo com IA
  • resumos quando eu passo o mouse sobre o tópico (por exemplo, pré-calculados)
4 curtidas

Estamos usando um prompt simplista no momento (quando OpenAI ou Anthropic são selecionados), mas mudaremos muito em breve, pois estamos trabalhando nisso no momento.

Personalizá-lo é um recurso interessante, podemos adicioná-lo no futuro.

Acabamos de fazer com que ele apareça para postagens com pelo menos uma resposta esta semana.

Adicionamos modelos de contexto grande da OpenAI no dia em que foram lançados. Atualmente, você pode escolher:

  • GPT 3.5 Turbo com 16k
  • GPT 4 com 32k
  • Claude com 100k

Há trabalho em andamento para armazenar em cache os resumos gerados para que possam ser usados em outros lugares, o que desbloqueia recursos como este.

7 curtidas

Não vejo isso no meu site, há alguma configuração que o controla?

Mais sugestões:

  • mostrar o botão resumir com IA no pipeline.
  • ter uma maneira de substituir o resumo normal por resumo com IA
  • Permitir apontar modelos GPT para o Azure. Observamos latências significativamente melhoradas em minha empresa
2 curtidas

É uma alteração que acabamos de fazer esta semana, então ela será implementada no seu site nos próximos dias.

O que “pipeline” significa aqui?

Como você pode ver aqui no Meta, já fizemos isso. O resumo antigo agora é chamado de “Mostrar principais respostas”. Ainda estamos trabalhando no design e na ordem dos botões.

Isso está em nosso roteiro!

6 curtidas

Desculpe pela falta de clareza, não tenho ideia de por que escolhi essa palavra :facepalm:

Eu quis dizer aqui

1 curtida

Isso é feito por:

É bastante irritante de configurar, pois você precisa criar um monte de implantações, mas funciona bem.

1 curtida

EDITADO

Usando o Gemini 1.5 Flash, os resumos geralmente contêm links para várias postagens, mas os vários links não são renderizados como links. Não me lembro de ter visto outros modelos tentarem usar vários links.

Links para postagens únicas são renderizados corretamente.

A carga de resposta correspondente inclui este texto:

[Username redacted](/t/-/56915/8, /t/-/56915/13, /t/-/56915/28, /t/-/56915/33, /t/-/56915/36)

Eu realmente gosto da ideia de citar vários links, se eles pudessem ser renderizados corretamente.

Bem, isso é simplesmente markdown inválido, é por isso que não funciona.

É uma pena que o Gemini Flash não consiga produzir markdown válido, aqui no Meta usamos o Llama 3.1 quantizado para FP8 para resumos, e ele consegue produzir links markdown adequados sem problemas.

2 curtidas

E que o haiku aparentemente não consegue retornar um código de status válido. Esses são os dois que tentei para sumarização até agora. Tentarei o Llama 3.1 em seguida.

Não sei se você consideraria corrigir problemas conhecidos, como verificar as segundas-feiras e esse markdown em particular. Percebo que não é o ideal, mas pode ser melhor do que perder opções de LLM que, de outra forma, seriam boas.

Você consegue ver resumos inválidos em https://discuss.ai.google.dev/ ?

Estamos usando flash lá, se você puder me indicar alguns, ficarei feliz em fazer um pouco de engenharia de prompt.

Essa é a única que vejo de imediato, mas esses tópicos são curtos, então um único usuário normalmente não seria citado várias vezes.

1 curtida

Isso parece muito corrigível, pois podemos melhorar nosso exemplo aqui. No momento, o prompt é:

Você é um bot avançado de sumarização que gera resumos concisos e coerentes do texto fornecido.\n\n- Inclua apenas o resumo, sem comentários adicionais.\n- Você entende e gera Markdown de fórum Discourse; incluindo links, _itálico_, **negrito**.\n- Mantenha o idioma original do texto que está sendo resumido.\n- Procure resumos de 400 palavras ou menos.\n- Cada postagem é formatada como "\u003cNÚMERO_DA_POSTAGEM\u003e \u003cNOME_DO_USUÁRIO\u003e \u003nMENSAGEM\u003e"\n- Cite postagens específicas notáveis usando o formato [NOME](/t/-/31793/NÚMERO_DA_POSTAGEM)\n - Exemplo: link para a 3ª postagem de sam: [sam](/t/-/31793/3)\n - Exemplo: link para a 6ª postagem de jane: [concordou com](/t/-/31793/6)\n - Exemplo: link para a 13ª postagem de joe: [#13](/t/-/31793/13)\n- Ao formatar nomes de usuário, use @NOMEDOUSUÁRIO OU [NOMEDOUSUÁRIO](/t/-/31793/NÚMERO_DA_POSTAGEM)

Isso parece um pouco ambíguo. Podemos fundamentá-lo com algo como isto:

Fundamentalmente, porém, @Roman / @Falco, teremos que remover esses prompts do código-fonte e talvez colocá-los em uma persona para que as comunidades possam ajustá-los e compartilhar o que funciona melhor.

Não me surpreenderia se, a longo prazo, precisarmos de prompts de caso especial para os modelos mais fracos.

Persona funcionaria muito bem aqui se tivéssemos suporte para “exemplos”, o que não parece um grande salto. Ou então, movemos para CompletionPrompt e damos uma interface de usuário para isso.

5 curtidas

Gosto da ideia de personalizar o prompt para atender às suas necessidades e aproveitar as capacidades do modelo. Também acho que transformar personas em um conceito mais agnóstico em relação a recursos é uma boa ideia.

1 curtida

Esta é basicamente a ideia das “funções de persona”, “instruções preparadas” que temos discutido este ano. Moveríamos tudo como AI Helper, Resumo, Pesquisa, etc. para usá-los, permitiríamos a criação de personalizados e teríamos uma interface de usuário para associá-los a recursos na interface de usuário.

Torna-se complicado quando atualizamos os semeados para enviar um formato diferente, por exemplo, de XML para JSON, então esperamos que seja algo que possamos considerar construir no próximo ano.

1 curtida

Eu não acompanho completamente os últimos posts. Eu ainda recebo os resumos inválidos. Há algo específico que posso tentar com personas, ou preciso esperar pela refatoração que vocês estão discutindo?

4 posts foram divididos em um novo tópico: Lidando com problemas de formato de resposta JSON do DeepSeek