Mi viaje en un trabajo masivo de reactivar publicaciones

techAPJ · 11 Julio, 2018 09:15

This is now done via:

https://github.com/discourse/discourse/commit/536cef86f4d0a3526d33fd3feb54f03bead7fdd4

We no longer carry post ids in memory and the rebake task can be resumed by running posts:rebake_uncooked_posts.

One caveat here is that the resume task will not rebake posts in reverse order (i.e. the sort order will be id ascending).

clay · 17 Julio, 2018 18:33

So @techAPJ, if I need to trigger a rebake of every post on a Discourse install, is @pfaffman’s method the proper one to use?

techAPJ · 18 Julio, 2018 14:19

If you need to rebake all posts instantly then run bundle exec rake posts:rebake.

Post.update_all("baked_version = NULL") will rebake 100 posts (by default) every 15 minutes.

clay · 20 Julio, 2018 12:50

Thanks, Arpit.

FYI, I encountered some performance issues with that approach, so I went with this, which alleviated the problem and resulted in the same outcome:

Post.in_batches.update_all('baked_version = NULL')

ckshen · 6 Septiembre, 2018 08:17

@techAPJ I have a dummy question. Where do you run this command? After entering the app?

It tells me

bash: syntax error near unexpected token ''baked_version = NULL''

techAPJ · 6 Septiembre, 2018 08:39

./launcher enter app
rails c
Post.in_batches.update_all('baked_version = NULL')

TheDarkWizard · 30 Marzo, 2021 19:35

¿Sería adecuado el método por lotes para una gran cantidad de rebakes?

2851000 / 27182220 ( 10.5%)

Este es nuestro proceso actual después de iniciarlo ayer con el comando de rebake normal; parece procesar unas 1000 unidades cada 3 segundos. Estamos muy cerca del final de nuestro viaje de importación y pruebas, y solo quería asegurarme de que existe una forma más adecuada de realizar un rebake en un sitio grande antes de decidirnos por este método más lento.

Isambard · 31 Mayo, 2024 06:42

¿Alguien puede explicar cómo funciona esta versión de in_batches? Presumiblemente, hace el re-bake en lotes, pero de las publicaciones anteriores, se afirma que por defecto hace el re-bake en lotes de 100 cada 15 minutos por defecto.

Tengo un trabajo de re-bake de 2 millones para hacer y estoy tratando de encontrar la mejor manera de hacerlo. El trabajo no tiene urgencia, pero quiero asegurarme de que las operaciones normales y las operaciones administrativas (como la copia de seguridad) no se vean afectadas por un trabajo de larga duración.

Isambard · 31 Mayo, 2024 06:49

Y ahora acabo de leer esta publicación: Rebaked all my posts, but what's it doing now? que me dice que la tarea de re-horneado ni siquiera los está volviendo a hornear, sino que solo los está marcando para volver a hornearlos (¿cómo se hace esta marca?). El proceso es tan lento que realmente me cuesta creer que lleve tanto tiempo solo marcar una publicación para volver a hornearla.

merefield · 31 Mayo, 2024 07:03

Entonces, migra a un servidor más rápido.

Agradece que no abrume tu sitio. El propósito es evitar que este proceso consuma demasiados recursos, manteniendo tu sitio receptivo durante el proceso.

Consultar la fuente siempre es una buena idea:

github.com/discourse/discourse

lib/tasks/posts.rake

5eae8ced9


      
          def rebake_posts(opts = {})
            puts "Rebaking post markdown for '#{RailsMultisite::ConnectionManagement.current_db}'"
          
            begin
              disable_system_edit_notifications = SiteSetting.disable_system_edit_notifications
              SiteSetting.disable_system_edit_notifications = true
          
              total = Post.count
              rebaked = 0
              batch = 1000
              Post.update_all("baked_version = NULL")
          
              (0..(total - 1).abs).step(batch) do |i|
                Post
                  .order(id: :desc)
                  .offset(i)
                  .limit(batch)
                  .each do |post|
                    rebake_post(post, opts)
                    print_status(rebaked += 1, total)
                  end

Isambard · 31 Mayo, 2024 07:28

De hecho, el marcado debería ser muy rápido. Y el rebake_post parece hacer la llamada a la cocción. ¿Quizás hay algunas tareas asíncronas que ocurren como parte de esto o como resultado de esto?

merefield · 31 Mayo, 2024 07:40

Sí, por supuesto, es un trabajo que genera un conjunto de trabajos.

Isambard · 31 Mayo, 2024 10:10

¡No es la solución ideal, pero encontré otra manera!

Acabo de escribir mi propio re-horneador que es 1000 veces más rápido, así que en lugar de tardar un mes, solo tarda unos minutos.

De hecho, volveré a hornear justo antes de la inserción en la base de datos, por lo que el costo de volver a hornear desaparecerá en el tiempo de inserción de la base de datos.

merefield · 31 Mayo, 2024 10:27

ah, ok no estaba al tanto de tu contexto.

sí, esto está escrito para el caso de Producción.

TheDarkWizard · 10 Julio, 2024 12:48

Por curiosidad, ¿puedes compartir lo que hiciste?

Isambard · 10 Julio, 2024 23:56

Escribí un programa para escanear todas las publicaciones importadas y encontrar las marcas/emoticonos que contenían. Luego escribí otro programa para procesar las publicaciones sin formato en HTML y actualizar la base de datos directamente.

Tema		Respuestas	Vistas
Rake posts:rebake_incremental (feature request) Feature	2	812	22 Abril 2020
Rebake all posts? Self-hosting	14	9140	13 Mayo 2019
Slow rebake script to avoid overwhelming your server Migration	4	173	13 Noviembre 2025
Rebake with rails command or rake task doesn't work, but rebuilding HTML does. Why? Self-hosting	9	1999	27 Marzo 2022
Rebuild HTML for entire topic Feature	6	3930	8 Abril 2018

Mi viaje en un trabajo masivo de reactivar publicaciones

Temas relacionados