Estou me perguntando se, com os avanços recentes em LLMs, seria possível analisar as postagens e o histórico de leitura de um usuário para fornecer um feed de Recomendações?
Este seria um ótimo recurso para nosso caso de uso focado em Perguntas e Respostas. Temos muitas categorias distintas, usuários muito ativos (colegas) e muitas informações extremamente úteis que eles simplesmente não verão. Uma boa lista de Recomendações ajudaria alguns de nossos usuários a se anteciparem aos problemas que estão tentando resolver.
Acho que o ideal seria uma lista composta por bugs comuns, significativos e em destaque sobre os quais as pessoas estão falando, relacionados às ferramentas e conversas em que o usuário já está demonstrando interesse.
Poderia compartilhar um link para o site, se ele for público?
Como alguém que tem usado os recursos de IA do Discourse, muitos antes de serem tornados públicos, estou ansioso para aprender mais sobre seu site. Entender os detalhes específicos que você observou me permitirá fazer recomendações mais informadas para o Discourse AI, levando em consideração os aspectos únicos de sua plataforma.
Adoraria, mas infelizmente é uma grande instância corporativa interna
Posso talvez te dar uma ideia do que estamos fazendo.
Contexto
Essencialmente, é como um Stackoverflow interno onde compartilhamos problemas específicos da empresa e do setor, como “como diabos eu configuro o proxy para isso?” ou “Não consigo encontrar nenhum resultado para Bug123 no Google, mais alguém resolveu isso?”
Nossas Categorias são específicas de ferramentas, como:
Kubernetes
Gitlab
Coisas problemáticas da IBM com a pior interface que você já viu
Como uma lista de recomendados poderia ser útil?
Atualmente, se eu leio/respondo a um tópico na Categoria Gitlab que fala sobre integração com outras ferramentas, como Kubernetes, não recebo notificações sobre tópicos relacionados. Portanto, se houver uma postagem muito útil na Categoria Kubernetes, posso não vê-la até muito tarde. Tenho que encontrá-la eu mesmo ou assinar as notificações corretas.
A maioria dos nossos usuários não terá boas configurações de notificação:
Eles estão sob pressão para obter resultados
Eles não passam tempo suficiente na plataforma para aproveitar ao máximo suas configurações de notificação.
Uma lista de recomendados forneceria informações potencialmente úteis, sob demanda, com um único clique. Essencialmente, “com base em seus interesses recentes, aqui estão alguns tópicos que podem ser úteis”. Poderia ser construída a partir do histórico de pesquisa do usuário, tópicos populares, palavras-chave comuns em tópicos em que eles participam, etc. Portanto, se eles nunca visitarem a Categoria de Coisas Problemáticas da IBM, nada dessa Categoria será recomendado, a menos que toque em algo em que eles já tenham um forte interesse, por exemplo, Gitlab.
Eu forneço um resumo de IA “daily buzz” no topo deste site, que é atualizado a cada 12 horas e utiliza posts dos últimos 2 dias.
A solução é proprietária e não está em um plugin público, mas demonstra o conceito.
E sim, está sujeita a erros!
Eu estava querendo fazer com que ele linkasse o conteúdo… ATUALIZAÇÃO: feito, só precisei do GPT 4 Turbo e de um pouco de engenharia de prompt. O GPT 3.5 não consegue lidar com esse nível de direção.
Obrigado, eu não tinha visto isso. Pode ser útil se as coisas mudarem para nós, mas infelizmente não parece atender às nossas restrições atuais (que falhei em mencionar anteriormente ).
Restrições
Não pode usar chat
Não pode usar mensagens privadas (PMs)
Não pode depender de IA para gerar respostas e fornecê-las silenciosamente aos nossos desenvolvedores – nós criamos software de segurança crítica
Essas restrições são essencialmente o motivo pelo qual uma lista de tópicos recomendados seria uma boa solução para nós: nenhum conteúdo é gerado, o chat não é usado, as mensagens privadas não são usadas.
Esta seria uma maneira interessante de fornecer um resumo diário. Como você diz, hiperlinks seriam definitivamente um ótimo recurso. Você está pensando em personalizá-lo para o conjunto distinto de interesses do usuário? O que tornou essa abordagem atraente em vez de depender do resumo diário existente?
Suspeito que esta seja a parte verdadeiramente desafiadora desta solicitação, mas também onde reside uma tonelada de valor.
A maioria das plataformas de hospedagem de conteúdo tem alguma forma de sistema de recomendação personalizado, eu ficaria surpreso se o Discourse não seguisse esse caminho em algum momento também. É argumentavelmente mais alcançável do que para plataformas como Spotify/Youtube, pois tudo é baseado em texto, removendo uma camada de erro entre a tradução de imagem/som para objeto/texto/conceito.
Pense mais fora da caixa com a solicitação na primeira postagem. Embora você tenha muitas restrições válidas que precisam ser atendidas, isso não significa que também não existam soluções potencialmente melhores.
Nota lateral sobre Tópicos Relacionados, que, honestamente, posso dizer que vi alguns milhares deles nos últimos dias e notei isto
Algo que vale a pena ficar de olho.
Ao revisar muitas postagens em Tópicos Relacionados para um site em inglês (OpenAI), comecei a notar que tópicos em espanhol tendem a ser agrupados e suspeito que, se fossem primeiro traduzidos para o inglês, cada postagem teria um vetor diferente e, portanto, seria agrupada com outras postagens.
Ainda estamos refinando o recurso (pretendemos anunciá-lo na próxima semana), mas nosso novo Relatório periódico usando IA se encaixa perfeitamente na sua visão:
Listar estatísticas principais, como principais usuários e contagens de posts/tópicos
Listar cerca de 10 tópicos novos interessantes com um breve resumo da atividade ocorrida durante o dia
Listar cerca de 10 tópicos antigos interessantes que tiveram atividade significativa durante o dia
Listar um resumo da atividade do grupo @team, com links para os tópicos que eles criaram, incorporados no texto
Fonte: SEMPRE embasar afirmações com links para discussões do fórum
Uso de Markdown: Melhorar a legibilidade com negrito, itálico, e > citações e links.
Links: Usar https://meta.discourse.org/t/-/ID_DO_TÓPICO/NÚMERO_DO_POST para referências diretas.
Menções a usuários: Referenciar usuários com @NOME_DE_USUÁRIO
Adicionar muitos links para tópicos: esforçar-se para linkar pelo menos 30 tópicos no relatório. O ID do tópico é sem sentido para usuários finais; se precisar inserir um link, use ref ou, melhor ainda, incorpore-o diretamente na frase
Categorias e tags: usar o formato #TAG e #CATEGORIA para denotar tags e categorias
Tópicos bug são super importantes para mim; certifique-se de priorizá-los e sinta-se à vontade para destacar quaisquer bugs mal categorizados que encontrar. NÃO mencione se algo está corretamente categorizado.
Ao fornecer um resumo de tópico, faça-o em formato de parágrafo, por exemplo:
@usuário descobriu que havia um problema com XYZ e @usuário2 sugeriu sugestão
relatório bruto gerado via IA - AVISO - contém cerca de 4 alucinações
Navegação Experimental da Barra Lateral de Admin - @martin apresentou uma navegação experimental na barra lateral de admin, gerando discussões sobre seu design e funcionalidade. Usuários como @packman e @Don forneceram feedback sobre entradas ausentes e problemas de exibição em dispositivos móveis, que @martin reconheceu e está considerando para atualizações futuras. Ler mais.
Lista de Tópicos Recomendados - @Tris20 sugeriu adicionar uma lista de tópicos recomendados ao menu superior, aproveitando os avanços em LLMs para personalizar o conteúdo conforme os interesses dos usuários. A conversa evoluiu com contribuições de @EricGT, @merefield e outros, discutindo o potencial e os desafios de recomendações de conteúdo personalizadas. Ler mais.
Dez Anos de Discourse - Usuários como @Judy_Hawkins e @Quercus compartilharam sua gratidão por várias comunidades Discourse que impactaram suas vidas, celebrando o décimo aniversário da plataforma. Ler mais.
Plugin de Localizações - @Don relatou um problema com o plugin de localizações, ao qual @merefield respondeu prontamente, indicando disposição para investigar o problema. Ler mais.
Restringir Usuários de Editar a Barra de Navegação - @Yola buscou ajuda para restringir usuários de editar a barra de navegação, e @JammyDodger esclareceu que o recurso foi projetado para personalização individual. @pfaffman e @LOCOSP forneceram soluções em CSS para ocultar o botão de edição. Ler mais.
Bugs no Upload de Arquivos - @Vladimir_P encontrou bugs ao fazer upload de arquivos, que @JammyDodger e @blake abordaram, levando à implementação de uma correção. Ler mais.
Criando e Instalando Plugins - @Gaurav_Kumar_Sandan perguntou sobre como criar e instalar plugins na página inicial, com @JammyDodger e @pfaffman fornecendo orientações sobre componentes de tema e instalação de plugins. Ler mais.
DiscoTOC - Índice Automático - Usuários como @digitaldominica e @Arkshine discutiram problemas com o componente DiscoTOC, que foram resolvidos após atualizações no Discourse. Ler mais.
Configuração de Usuário Personalizada em um Plugin - @pirhoo buscou aconselhamento sobre como criar campos de usuário personalizados a partir de um plugin, com @merefield fornecendo recursos para auxiliar no processo. Ler mais.
Localização dos Detalhes de Cobrança - @Teresations precisou de ajuda para localizar os detalhes de cobrança de sua hospedagem Discourse com a Communiteq, e @awesomerobot e @RGJ auxiliaram, indicando o painel de controle. Ler mais.
Tópicos Antigos Interessantes com Atividade Significativa
Feedback sobre Ajuste de Altura de Linha de Emojis - @sam e @tynaut discutiram o impacto dos ajustes de altura de linha de emojis no estilo do status do usuário, com @tynaut confirmando uma correção para o chat e investigando uma solução para posts/mensagens. Ler mais.
Usando FILTER para Resumir Dados - @JammyDodger compartilhou uma consulta SQL usando a função FILTER para segmentar dados de usuários com base em preferências de resumo de atividade, fornecendo uma explicação detalhada dos componentes da consulta. Ler mais.
Estilo de Comunicação como Parte do Perfil de um Usuário - @Saif e @simon discutiram o potencial e as preocupações de implementar análise de sentimentos em perfis de usuários para avaliar o estilo de comunicação. Ler mais.
Enter para Nova Linha, Shift+Enter para Enviar Mensagem no Chat - @meglio propôs uma alteração de configuração para o comportamento de entrada no chat, apoiada por usuários como @Jagster e @Moin, para tornar a mensagem em múltiplos parágrafos mais amigável. Ler mais.
Não é Possível Aprovar o Primeiro Post de um Usuário se Ele Contiver uma Enquete - @Firepup650 relatou um problema em que o primeiro post de um usuário contendo uma enquete não podia ser aprovado devido a um erro de permissão. Ler mais.
Mensagem de Erro ao Fazer Upload de Logo - @spicerunner relatou uma mensagem de erro ao fazer upload de um logo, que foi resolvida após uma atualização. Este tópico foi corretamente categorizado como bug. Ler mais.
Falha em E-mails de Notificação de Saída - @managenet enfrentou problemas com e-mails de notificação de saída após tentar alterar o limite de tamanho de anexos. Ler mais.
Não é Possível Recriar o App Travado na Extração de Uma Camada - @LOCOSP encontrou um problema com a extração de uma camada Docker durante uma recriação, buscando aconselhamento sobre como forçar o re-download dos arquivos. Ler mais.
O Discourse Launcher / Docker Usa os Servidores Locais de Postgresql e Redis? - @dalu74 perguntou se o Discourse usa as instalações locais de Postgresql e Redis do host, o que foi esclarecido por @hello-smile6. Ler mais.
Especificamente, você poderia liberar alguns desses relatórios automatizados para tentar destacar conteúdo interessante.
O fato de você controlar o tamanho do contexto, o número de dias abrangidos pelo relatório e muito mais permite que você tenha controle extremo aqui.
Atenção, porém: isso precisa do GPT-4 turbo para funcionar bem. O Anthropic Claude é um LLM com janela de contexto grande, mas os resultados que produziu não me impressionaram.
Você pode saber disso, mas também estou dizendo isso para outros, pois pode não ser tão óbvio.
Se você tiver acesso ao bot Discourse AI, que pode ser encontrado no canto superior direito
então, usando a persona Forum Helper, você também pode experimentar diferentes instruções que poderiam ser usadas com as instruções personalizadas do Relatório Periódico usando IA. Em outras palavras, você pode usar o Forum Helper para prototipar rapidamente o relatório.
Como alguém que teve o privilégio de auxiliar com feedback durante o desenvolvimento, posso dizer que as instruções personalizadas são importantes para obter os resultados desejados. No exemplo dado acima, posso ver claramente que Sam adicionou isso para sua variação de um relatório com base em sua solicitação inicial
Eu adoro a aparência disso, embora não tenha certeza se entendi totalmente a funcionalidade. Parece que isso está produzindo algo semelhante ao Digest. Eu gosto muito desse novo formato para essa informação.
O que eu não consegui ver na resposta é se isso pode fornecer um resumo personalizado. Eu perdi isso em algum lugar? É possível que isso seja gerado por usuário, com base nos interesses individuais do usuário?
Para tornar esses pensamentos mais concretos, é mais ou menos o que eu tinha em mente:
Identificar os principais interesses do usuário: (Executar uma vez) Analisar todos os tópicos e respostas com os quais o usuário interagiu (curtir, responder, criar) em busca de palavras-chave
Identificar interesses recentes do usuário: Analisar tópicos e respostas que o usuário leu este mês em busca de palavras-chave
Identificar conceitos-chave de tópicos recentes: analisar todos os novos tópicos esta semana
A parte que as pessoas mais gostam, que é impulsionada por LLM, é o simples resumo de 1 parágrafo das alterações em um tópico da data X para Y.
Em vez de fazer o LLM ler todo o corpus e criar um relatório como este, poderíamos apenas manter um “cache de fragmentos” onde, por exemplo, armazenamos parágrafos por tópico:
ID do tópico
Intervalo de datas para resumo
Resumo muito curto
2343
12-1 → 12-9
…
Com isso, podemos construir resumos personalizados por usuário. Então, estamos basicamente dividindo isso em vários problemas:
Identificação de tópicos interessantes → programação tradicional (tags/categorias observadas ou talvez observação em “segundo plano” com base na atividade - excluir já lidos)
Resumo de tópicos → recurso impulsionado por LLM
Isso tem várias vantagens. Escala muito bem, os resumos podem ser muito mais precisos porque a quantidade de contexto é muito mais limitada e há menos risco de vazamento de contexto e alucinação.
Tenho refletido sobre uma variação dessa ideia. Em vez de pensar em tópicos relacionados por tags ou categorias, considere-os com base em sua similaridade semântica. Embora nem todos os tópicos semanticamente relacionados se encaixem perfeitamente em uma esfera, é útil pensar neles dessa forma. Imagine uma esfera começando como um único tópico; à medida que mais tópicos são adicionados, a esfera se expande, mas tem um tamanho limitado depois de um tempo. No entanto, mais tópicos podem ser adicionados dentro da esfera à medida que ela cresce e, com o tempo, mesmo depois de atingir o tamanho total. Pense nisso como um show de fogos de artifício no céu, com explosões rápidas representando tópicos com diferentes similaridades semânticas sendo adicionados ao longo do tempo. Essa analogia me ajuda a entender melhor o conceito. Estou particularmente interessado nessas explosões rápidas e naquelas que persistem e cintilam por um longo período. Se alguém também tivesse uma representação visual disso, seria bom escolher centros semânticos e adaptar um parágrafo sobre isso.
Este tópico, ao usar Mostrar Postagem Completa, mostra uma imagem real de tópicos semanticamente relacionados.
EDIT
Aqui está um visual que se aproxima mais do que estou pensando.
Tenho que ser honesto e notar que esta é a primeira vez que ouço falar de “o algoritmo”, mas sim, ele se alinha bastante com o que estou pensando. Terei que investigar mais, mas não espero discordar do que você anota.
O algoritmo do Twitter refere-se ao complexo conjunto de regras e processos matemáticos que a plataforma de mídia social usa para determinar qual conteúdo é exibido aos usuários em suas linhas do tempo e feeds. Este algoritmo é projetado para curar e personalizar o conteúdo que os usuários veem com base em seus interesses, histórico de engajamento e outros fatores. O algoritmo do Twitter evoluiu ao longo dos anos, mas geralmente visa mostrar aos usuários os tweets mais relevantes e envolventes, ao mesmo tempo em que promove o engajamento e a retenção de usuários na plataforma.
Os principais componentes e fatores que podem influenciar o algoritmo do Twitter incluem:
Relevância: O algoritmo considera a relevância de um tweet para os interesses e preferências de um usuário. Ele leva em consideração as contas que um usuário segue, o conteúdo com o qual ele interage (curtidas, retweets, respostas) e as palavras-chave e hashtags que ele usa em seus tweets.
Engajamento: Tweets que recebem mais curtidas, retweets, respostas e compartilhamentos têm maior probabilidade de serem promovidos pelo algoritmo. Maior engajamento indica que um tweet está ressoando com os usuários e é considerado mais valioso.
Recência: O Twitter geralmente prioriza tweets recentes para manter os usuários atualizados com as informações e tendências mais recentes. No entanto, ele também pode mostrar tweets mais antigos que ainda são relevantes e envolventes.
Personalização: O algoritmo cria uma experiência personalizada para cada usuário, adaptando seu feed aos seus interesses e comportamentos específicos. Ele se adapta ao longo do tempo à medida que os usuários interagem com a plataforma.
Contagem de seguidores: O número de seguidores de uma conta também pode influenciar a visibilidade de seus tweets. Contas com mais seguidores geralmente têm maior probabilidade de ter seus tweets mostrados a um público mais amplo.
Tipo de mídia: Tweets com imagens, vídeos ou outras mídias tendem a receber maior engajamento e podem ser promovidos pelo algoritmo.
Qualidade e segurança: O algoritmo do Twitter também visa promover conteúdo de alta qualidade e seguro, ao mesmo tempo em que reduz a visibilidade de spam, notícias falsas e conteúdo prejudicial.
É importante notar que o Twitter atualiza e refina periodicamente seu algoritmo para melhorar a experiência do usuário e abordar preocupações relacionadas à disseminação de desinformação e conteúdo prejudicial. Os usuários também podem ter algum controle sobre sua linha do tempo ajustando suas configurações, silenciando contas ou usando recursos do Twitter como Listas e a opção “Mostrar os melhores Tweets primeiro” para personalizar ainda mais seu feed.
Eu adoro isso. Parece uma versão sem alertas do Watching, que é exatamente o tipo de coisa que estamos procurando. Algo que realmente me impressiona é o pouco esforço cognitivo que sinto ao ler este formato! Honestamente, mal posso esperar para ler mais deles!
Estou certo em pensar que isso só foi tentado no Meta até agora? Estou extremamente curioso sobre como isso lidaria com um fórum técnico com informações potencialmente mais obscuras.