Je veux exporter toutes les publications pour analyse

Existe-t-il un moyen d’exporter toutes les données des publications de la communauté ?

Je souhaite effectuer une analyse approfondie des métriques d’activité de la communauté.

  1. Temps jusqu’à la première réponse
  2. Repost jusqu’à la résolution
  3. Temps jusqu’à la résolution
  4. Réaffectation jusqu’à la résolution
1 « J'aime »

Je recommande le plugin Data Explorer. Il peut effectuer au moins une partie de l’analyse que vous souhaitez et exporter toutes les données dont vous avez besoin.

2 « J'aime »

Merci !

C’est génial !

1 « J'aime »

Quelqu’un a-t-il cette requête à partager ? Existe-t-il également un moyen d’exporter le texte brut de chaque publication ?

Merci !

Avez-vous examiné les requêtes d’exemple ?

select id post_id,raw from posts

1 « J'aime »

Cela inclura également les PM et les messages supprimés, ce qu’il ne souhaite probablement pas.

@401Ott, si vous voulez tous les messages publiés qui ne contiennent pas de messages privés, vous devrez alors filtrer les messages dont l’archétype du sujet est ‘private_message’.

De plus, si vous ne voulez pas les messages supprimés, vous devrez filtrer les messages dont la date de suppression (deleted_at) n’est pas NULL. Mais comme certains messages peuvent être supprimés lorsque leur sujet l’est, vous devrez également filtrer les messages dont le sujet auquel ils appartiennent possède un timestamp de suppression (deleted_at).

Si vous avez besoin de la requête exacte, veuillez préciser exactement ce dont vous avez besoin et je l’écrirai pour vous.

1 « J'aime »

Oui, je pense que c’est tout à fait exact : filtrer uniquement les publications publiques et publiées est idéal. Dans une exportation parfaite, je rechercherais le nom d’utilisateur, la date de création (de la publication), l’heure de création et le corps du texte de la publication. Avoir les tags associés serait également un plus.

Dans l’ensemble, mon objectif est de pouvoir identifier quand et à quelle fréquence un chemin d’URL spécifique est partagé sur ma communauté. J’espère que la présence de tout le texte des publications dans un fichier .csv aidera.

Merci beaucoup pour votre aide, @JusticeUK. Faites-moi savoir si cet objectif n’est pas réaliste (et pas de souci si ce n’est pas le cas :grinning_face_with_smiling_eyes :).

La méthode la plus simple et la plus rapide consiste à exécuter :
select post_id, user_id, created_at, raw, cooked from badge_posts where deleted_at is null

en utilisant from badge_posts au lieu de from posts. Les résultats sont déjà filtrés pour ne montrer que les publications publiques.

2 « J'aime »

C’est là que l’absence de documentation est assez frustrante, car je n’étais pas au courant de badge_posts, et donc les requêtes que j’ai écrites il y a quelques semaines filtrent toutes explicitement les messages privés des publications.