Olá a todos, não encontrei uma postagem semelhante a esta, então vamos lá:
Minha organização está desenvolvendo nossos painéis de análise (dentro do Snowflake) e esperamos integrar os dados do usuário que temos no Discourse.
Atualmente, estamos auto-hospedando o Discourse em uma instância EC2 dentro do Docker. Parece que há algumas opções aqui:
- Usar o AWS Database Migration Service para acessar o servidor Postgres hospedado na EC2. Isso exigiria expor a porta Postgres (que acredito que não está configurada para ser publicamente acessível por padrão) e criar um novo usuário Postgres, mas, fora isso, parece uma solução muito boa.
- Um dump SQL direto para um bucket S3 (como os backups funcionam no Discourse) não funcionará, pois o SQL não é aceito como formato de dados pelo Snowflake.
- Instalar o plugin Data Explorer, escrever as consultas que geram os dados que queremos, em seguida, executar e exportar os dados resultantes em CSVs/JSONs que podemos importar para o Snowflake.
- Esta solução parece ter mais etapas do que a 1 acima, mas também resolveria o problema e teria menos chance de estragar o banco de dados do Discourse.
Agradeceria comentários ou relatos de outras pessoas sobre como obter os dados do banco de dados em um pipeline de análise. Obrigado!