O Discourse suporta exportar conversas como um conjunto organizado de dados?

O Discourse suporta a exportação de conversas como um conjunto organizado de dados que possa ser reutilizado offline? Casos de uso no Slack:

  1. Às vezes, extraio alguns dados do histórico para preparar documentos para novos membros.
  2. A mesma abordagem para extrair dados úteis de várias discussões e organizar a documentação externa do produto.
  3. Tentar analisar muitos tópicos/conversas mal organizados usando Python para obter dados estruturados com palavras destacadas — etapas para definir links entre diferentes conversas (uma espécie de análise de dados).

Espero ter sido claro :grinning:

1 curtida

Hmm, você já usou o TensorFlow? :wink: Talvez seja melhor evitar muitos dados não estruturados desde o início. Eu tenho o mesmo problema aqui. Mas estou tentando organizar tudo na origem. Tenho um inferno de conversas no Slack aqui, e vou resolver isso fazendo com que as pessoas estruturem os dados…

Não tenho certeza se a IA é a solução para o meu caso. Eu coletei dados de diferentes fontes, e a ideia principal é encontrar destaques realmente importantes (palavras, URLs, provas, etc.) e criar uma estrutura de dados que possa responder a essas perguntas:

  1. Qual foi a ordem correta no processo de aceitação de uma determinada solução relacionada a uma tarefa específica, a fim de reconstruir o quadro real dos eventos.
  2. O algoritmo deve detectar menções importantes em toneladas de conversas de baixa qualidade (especialmente e-mails com muitos níveis de anexos e publicações web não confiáveis).
  3. Definir conexões valiosas entre diferentes ações, mais ou menos da seguinte forma: notícias → blog → clima e necessidades públicos → decisão via chat/e-mail → estratégia utilizada → ações reais → suposições aprovadas → pessoas relacionadas → explicação do resultado.

Portanto, uso um modelo em Python para isso:

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

Provavelmente, gostaria de ter uma estrutura de dados semelhante exportada do Discourse (talvez através da API). Inicialmente, fiz uma pergunta sobre o Discourse for Teams, porque encontrei muitas semelhanças com o Slack e nossa equipe não está satisfeita com o Slack. A função paga de histórico é quase inútil.

1 curtida

A esse respeito, tudo o que você pode fazer com o Discourse, também pode fazer com o Discourse for Teams. É por isso que movi sua postagem para um novo tópico próprio. Talvez outras pessoas tenham sugestões para você.

Você está familiarizado com JSON? Você pode adicionar .json a praticamente qualquer URL no Discourse para visualizar a página em um formato mais portátil. Talvez isso ajude?

Por exemplo, este tópico:

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

5 curtidas

Uau, parece ótimo, muito obrigado, Tobias! Acredito que isso seja suficiente para mim :+1:

2 curtidas