¿Cómo fusionar masivamente temas en padres para una importación de Yahoo Groups?

Después de importar decenas de miles de publicaciones antiguas de Yahoo Groups a Discourse, me he quedado con muchos temas desconectados que deberían ser el mismo hilo. Parece que la solución intuitiva para esto sería seleccionar o resaltar varias de estas publicaciones y luego arrastrarlas al tema principal.

O, quizás, una forma aún mejor sería simplemente seleccionar todos los temas que desea fusionar y permitir que el sistema los agrupe automáticamente en un único tema, utilizando el mensaje con la fecha más antigua como padre y como nombre/asunto principal del tema, mientras que las fechas existentes determinarían el orden.

Por ejemplo, mis mensajes son mayoritariamente como estos:

  • Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema
  • [nombre de la lista de correo] Nombre del tema

Básicamente, debería poder seleccionar todos estos y simplemente usar la herramienta de llave inglesa en el lado derecho y hacer clic en “fusionar” para lograr el objetivo.

¿Falta esta funcionalidad o me estoy perdiendo algo?

Discourse te permite mover publicaciones a temas nuevos o existentes. No estoy seguro de si esta es la solución a tu problema, pero si lo es, hay una guía para mover publicaciones aquí: Moving posts to a new or existing topic.

Gracias por señalarlo. Lamentablemente, ya era consciente de cómo funciona esto. El verdadero problema es que lo que estás demostrando en ese tutorial es cómo trabajar con publicaciones DENTRO de un tema.

Imagina por un momento que tienes 100 del MISMO tema con la misma o ligeramente diferente línea de asunto/título.

El problema es que la importación de mbox / Yahoo Groups no funcionó con precisión. Quizás se deba a IDs incorrectos en los correos electrónicos. Quizás a otra cosa, pero significa que para algunos de nosotros tenemos miles o decenas de miles de mensajes que están incorrectamente desconectados entre sí. Necesitamos una forma de fusionarlos.

Lamentablemente, una fusión automatizada probablemente no sea óptima basándose en las líneas de asunto. Probablemente necesitemos revisarlos visualmente y seleccionar muchos manualmente, y luego decirle al sistema que fusione todos estos en un tema común.

Parece que el mejor (realmente el único) lugar para hacerlo es dentro de la vista temática real de una categoría. Hacerlo mediante el método que presentas en la guía es increíblemente engorroso y simplemente no es factible, ya que tienes que entrar en un tema que tiene solo una publicación, luego pasar por el proceso de seleccionar esa publicación, aislar la publicación principal y luego combinarla. Esto se complica aún más cuando hay decenas o cientos de publicaciones que ya tienen la misma línea de asunto.

Por lo tanto, lo que necesitamos es una función “Seleccionar temas…” en la vista de categoría que funcione de manera similar a como funciona la función “Seleccionar publicaciones…” dentro de una vista de tema.

¿Tiene esto sentido?

Por lo que entiendo, estás en una encrucijada. Tienes que decidir cuán importante es para ti tener esos antiguos mensajes de Yahoo correctamente organizados y contenidos en un solo tema.

Si es importante, mi sugerencia sería retroceder un paso y corregir los archivos mbox. Luego, impórtalos cuidadosamente en pequeños lotes.

La mejor manera de hacerlo es probablemente importarlos a Mozilla Thunderbird y manipularlos allí. Cada carpeta de Thunderbird es un archivo mbox independiente, por lo que podrías mover todos los mensajes relacionados a una sola carpeta y luego abrir ese archivo mbox en un editor de texto para realizar una búsqueda y reemplazo y corregir el ID del mensaje, que es utilizado por el importador para determinar qué mensajes pertenecen juntos en un mismo tema.

Realmente, la mejor solución sería volver atrás en el tiempo y convencer a los programadores que crearon Outlook de que se esforzaran un poco más por seguir los estándares de correo electrónico vigentes.

Una cosa que me pregunto: @pfaffman, ¿sabes de alguna manera de hacer algo así programáticamente en este momento? Podría estar dispuesto a usar el enfoque de escopeta, donde simplemente digo “fusionar todos los temas con la misma línea de asunto + este prefijo”.

Lo que quiero decir con esto es como en mi primer mensaje original (OP) arriba, donde noto cómo algunos de los temas “Algun Nombre de Tema” están precedidos por “[nombre de la lista de correo]”. Básicamente, podría usar una opción de fusión “nuclear” para agrupar todo lo que es PROBABLE que esté relacionado y luego separarlos cuando los usuarios hayan usado inadvertidamente los mismos nombres o asuntos de tema…

Jaja, sí, no es una mala sugerencia @tobiaseigen, pero no hay forma en el mundo de que pueda encontrar el tiempo para dar este paso tan arduo con decenas de miles de mensajes. Solo los archivos mbox pesan más de 500 MB. Voy a probar suerte arreglando las cosas poco a poco directamente desde Discourse, ya que así también puedo contar con la ayuda de otros moderadores. Espero que o bien encontremos otras sugerencias como en mi última pregunta, o bien trabajemos en implementar un plugin si no hay otras opciones.

Recomendaría empezar de nuevo y asegurarse de que la importación se haga correctamente desde el principio; lo que @tobiaseigen recomendó suena prometedor. Ha pasado mucho tiempo desde que hice una importación grande de mbox y realicé bastante trabajo previo para solucionar cosas como las que describes. Si eso no es una opción, puedes intentar algo en el lado de Rails donde de alguna manera recolectes todos los mensajes que creas que pertenecen juntos, luego ordénalos por fecha y crea un nuevo tema (o elige el primero) y mueve todos los mensajes al nuevo tema.

Me tomaría un tiempo crear el código real.

Bueno, ha habido mucha participación en el foro desde la importación, por lo que en este punto no creo que un “reinicio” sea viable. Me daría un poco de miedo hacer muchas eliminaciones, y además los moderadores ya han comenzado a ajustar los datos importados, así como a fusionar cuentas, etc.

En algún momento revisaré un método de Rails por mi cuenta y luego compartiré lo que encuentre, a menos que alguien tenga una sugerencia antes de que pueda hacerlo. Si es necesario, simplemente dejaremos las cosas “desordenadas” durante las fiestas y hasta que resolvamos este pequeño contratiempo.