Foros grandes con más de 1 millón de publicaciones, ¿cómo funciona tu búsqueda?

Jumanji · 28 Abril, 2020 15:51

Hemos tenido una reciente afluencia de usuarios y un aumento repentino del tráfico, lo que ha llevado a más búsquedas realizadas simultáneamente.

Estamos empezando a ver tiempos de espera agotados en búsquedas en aproximadamente 1,2 millones de publicaciones.

¿Qué están haciendo sus foros más grandes en cuanto a la búsqueda? ¿Han migrado fuera de la función de búsqueda principal de Discourse o aún funciona bien? ¿Quizás han actualizado el algoritmo de búsqueda/consultas para que sea más restrictivo/específico? ¿Ajustes en la base de datos?

¡Gracias por sus comentarios!

Ghan · 28 Abril, 2020 16:01

¿Cuáles son las especificaciones de tu servidor y qué recursos parecen ser los más limitados?

Estoy considerando la posibilidad de migrar un foro con aproximadamente 20 millones de publicaciones (publicaciones públicas + conversaciones privadas), por lo que me interesa mucho conocer posibles problemas de rendimiento en foros de gran tamaño.

pfaffman · 28 Abril, 2020 16:56

Hay un largo camino entre 1 millón de publicaciones y 20 millones, por lo que hay pocos consejos que puedan aplicarse a ambos. Por si acaso, tengo un sitio con 9 millones de publicaciones que tiene un rendimiento aceptable en un i7-7500U @ 2.7GHz con 16 GB de RAM. Hay algunos otros sitios de bajo volumen en el mismo servidor.

Un sitio que usa una base de datos de AWS con 8 GB de RAM y 4 millones de publicaciones está teniendo dificultades, especialmente en las búsquedas.

@Jumanji, ¿cuáles son las especificaciones de tu servidor?

Falco · 28 Abril, 2020 16:58

Jumanji · 7 Mayo, 2020 01:31

Estamos en AWS. Los foros se ejecutan en 4 instancias, creo que t3.large, es decir, 4 vCPU y 16 GB de RAM. Ejecutamos Kubernetes en una imagen Docker personalizada. Nuestra base de datos está en su propia instancia, m4.large, es decir, 2 vCPU y 8 GB de RAM. La RAM en las instancias de la base de datos podría ser sin duda el cuello de botella.

Las consultas que están agotando el tiempo de espera son generalmente términos más genéricos, palabras sueltas. Hemos tenido algunas que se ejecutaron durante más de 60 segundos. Ahora, también hemos visto un aumento del tráfico en nuestro sitio web en el último mes. El mes pasado, el tráfico mes a mes aumentó un 40% respecto al mes anterior. También pasamos de la v1.9 a la v2.4 durante ese tiempo, y sé que desde la 1.9, la Búsqueda ha añadido la búsqueda con autocompletado, así que asumo que eso genera más carga en el servidor de la base de datos.

Realizamos un análisis de consultas y la siguiente consulta se ejecutó entre 20 y 60 segundos:

`SELECT "posts".*
FROM "posts"
JOIN (
    SELECT *, row_number() over() row_number
    FROM (
        SELECT topics.id, min(posts.post_number) post_number
        FROM "posts"
        INNER JOIN "post_search_data" ON "post_search_data"."post_id" = "posts"."id"
        INNER JOIN "topics" ON "topics"."id" = "posts"."topic_id" AND ("topics"."deleted_at" IS NULL)
        LEFT JOIN categories ON categories.id = topics.category_id
        WHERE 
            ("posts"."deleted_at" IS NULL)
            AND "posts"."post_type" IN (1, 2, 3)
            AND (topics.visible)
            AND (topics.archetype <> 'private_message')
            AND (post_search_data.search_data @@ TO_TSQUERY('english', '''a'':*ABD & ''price'':*ABD'))
            AND (categories.id NOT IN (SELECT categories.id WHERE categories.search_priority = 1))
            AND ((categories.id IS NULL) OR (NOT categories.read_restricted))
        GROUP BY topics.id
        ORDER BY
            MAX((
                TS_RANK_CD(
                    post_search_data.search_data,
                    TO_TSQUERY('english', '''a'':*ABD & ''price'':*ABD'),
                    1|32
                ) * (
                    CASE categories.search_priority
                    WHEN 2
                    THEN 0.6
                    WHEN 3
                    THEN 0.8
                    WHEN 4
                    THEN 1.2
                    WHEN 5
                    THEN 1.4
                    ELSE
                    CASE
                        WHEN topics.closed
                        THEN 0.9
                        ELSE 1
                        END
                    END
                )
            )) DESC,
            topics.bumped_at DESC
        LIMIT 6
        OFFSET 0
    ) xxx
) x ON x.id = posts.topic_id AND x.post_number = posts.post_number
WHERE ("posts"."deleted_at" IS NULL)
ORDER BY row_number;

---

 Sort  (cost=495214.55..495214.56 rows=1 width=1177) (actual time=20529.725..20529.727 rows=6 loops=1)
   Sort Key: (row_number() OVER (?))
   Sort Method: quicksort  Memory: 29kB
   ->  Nested Loop  (cost=495164.08..495214.54 rows=1 width=1177) (actual time=20525.899..20529.703 rows=6 loops=1)
         ->  WindowAgg  (cost=495163.65..495163.80 rows=6 width=16) (actual time=20520.976..20521.078 rows=6 loops=1)
               ->  Limit  (cost=495163.65..495163.66 rows=6 width=24) (actual time=20520.969..20521.063 rows=6 loops=1)
                     ->  Sort  (cost=495163.65..495232.24 rows=27438 width=24) (actual time=20520.967..20520.969 rows=6 loops=1)
                           Sort Key: (max((ts_rank_cd(post_search_data.search_data, '''price'':*ABD'::tsquery, 33) * (CASE categories.search_priority WHEN 2 THEN 0.6 WHEN 3 THEN 0.8 WHEN 4 THEN 1.2 WHEN 5 THEN 1.4 ELSE CASE WHEN topics.closed THEN 0.9 ELSE '1'::numeric END END)::double precision))) DESC, topics.bumped_at DESC
                           Sort Method: top-N heapsort  Memory: 25kB
                           ->  GroupAggregate  (cost=493642.90..494671.83 rows=27438 width=24) (actual time=19082.214..20506.763 rows=32951 loops=1)
                                 Group Key: topics.id
                                 ->  Sort  (cost=493642.90..493711.50 rows=27438 width=400) (actual time=19082.184..19283.907 rows=191436 loops=1)
                                       Sort Key: topics.id
                                       Sort Method: external merge  Disk: 77632kB
                                       ->  Hash Left Join  (cost=36655.60..486646.69 rows=27438 width=400) (actual time=1562.696..18611.724 rows=191436 loops=1)
                                             Hash Cond: (topics.category_id = categories.id)
                                             Filter: (((categories.id IS NULL) OR (NOT categories.read_restricted)) AND (NOT (SubPlan 1)))
                                             ->  Gather  (cost=36645.63..486471.60 rows=58991 width=400) (actual time=1562.623..18249.349 rows=191436 loops=1)
                                                   Workers Planned: 2
                                                   Workers Launched: 2
                                                   ->  Nested Loop  (cost=35645.63..479572.50 rows=24580 width=400) (actual time=1556.547..18541.793 rows=63812 loops=3)
                                                         ->  Hash Join  (cost=35645.20..328688.61 rows=157831 width=25) (actual time=1551.912..13356.416 rows=285279 loops=3)
                                                               Hash Cond: (posts_1.topic_id = topics.id)
                                                               ->  Parallel Seq Scan on posts posts_1  (cost=0.00..286245.92 rows=504559 width=12) (actual time=0.280..11249.160 rows=404770 loops=3)
                                                                     Filter: ((deleted_at IS NULL) AND (post_type = ANY ('{1,2,3}'::integer[])))
                                                                     Rows Removed by Filter: 21884
                                                               ->  Hash  (cost=33938.80..33938.80 rows=92912 width=17) (actual time=1549.103..1549.103 rows=80351 loops=3)
                                                                     Buckets: 65536  Batches: 2  Memory Usage: 2557kB
                                                                     ->  Seq Scan on topics  (cost=0.00..33938.80 rows=92912 width=17) (actual time=0.010..1492.606 rows=80351 loops=3)
                                                                           Filter: ((deleted_at IS NULL) AND visible AND ((archetype)::text <> 'private_message'::text))
                                                                           Rows Removed by Filter: 216751
                                                         ->  Index Scan using posts_search_pkey on post_search_data  (cost=0.43..0.96 rows=1 width=383) (actual time=0.017..0.017 rows=0 loops=855836)
                                                               Index Cond: (post_id = posts_1.id)
                                                               Filter: (search_data @@ '''price'':*ABD'::tsquery)
                                                               Rows Removed by Filter: 1
                                             ->  Hash  (cost=9.43..9.43 rows=43 width=9) (actual time=0.059..0.059 rows=43 loops=1)
                                                   Buckets: 1024  Batches: 1  Memory Usage: 10kB
                                                   ->  Seq Scan on categories  (cost=0.00..9.43 rows=43 width=9) (actual time=0.007..0.045 rows=43 loops=1)
                                             SubPlan 1
                                               ->  Result  (cost=0.00..0.01 rows=1 width=4) (actual time=0.000..0.000 rows=0 loops=191436)
                                                     One-Time Filter: (categories.search_priority = 1)
         ->  Index Scan using index_posts_on_topic_id_and_post_number on posts  (cost=0.43..8.45 rows=1 width=1169) (actual time=1.435..1.435 rows=1 loops=6)
               Index Cond: ((topic_id = topics.id) AND (post_number = (min(posts_1.post_number))))
               Filter: (deleted_at IS NULL)
 Planning time: 3.508 ms
 Execution time: 20541.411 ms
(46 filas)`

Falco · 7 Mayo, 2020 01:34

¿Es el tamaño total de tu base de datos inferior a 8 GB? Querrás que la mayor cantidad posible de tus datos quepan en la RAM.

Oh, esto será lento. Y mucho peor si el disco es un punto de montaje de red.

También revisa mi respuesta anterior para ver algunos ajustes.

Faizan_Zahid · 7 Mayo, 2020 12:20

@Jumanji ¿Podrías compartir algunos sitios de foros de alto tráfico que funcionen con Discourse, por favor? Enlaces, por favor.
Tráfico superior a millones.

Jumanji · 7 Mayo, 2020 18:18

No formo parte del equipo de Discourse, pero encontré esto mediante una búsqueda.

Jumanji · 8 Mayo, 2020 18:49

Estamos en 24 GB. Definitivamente es más grande que la RAM disponible para la instancia.

sam · 12 Mayo, 2020 08:04

En algunos casos, después de movimientos masivos, ejecutar vacuum analyze puede mejorar el rendimiento.

Además, si estás en AWS, ¿estás usando RDS? Si no… ¿por qué no?

Jumanji · 12 Mayo, 2020 23:56

Gracias por eso. Sí, lo ejecutamos y ahora estamos en RDS.

Tema		Respuestas	Vistas
Improving Instance Performance (Megatopics, Database Size and Extreme Load) Self-hosting	60	5273	13 Octubre 2020
Discourse installation has been getting slower and slower and slower Self-hosting server-resources	37	1810	15 Mayo 2023
Search query times out for big sites Development	2	1371	13 Enero 2020
Slow Profile Loads with 100GB+ database Feature	43	3052	1 Enero 2021
Are there any commands that will speed up the site? Support	19	2290	2 Diciembre 2020

Foros grandes con más de 1 millón de publicaciones, ¿cómo funciona tu búsqueda?

Temas relacionados