Resumen de SEO en Discourse (sitemap / robots.txt )

Discourse tiene muchas funciones de SEO que funcionan directamente. Al usar nuestros valores predeterminados sensatos, los administradores de la comunidad pueden centrarse en cultivar una comunidad y no deben sentirse tan distraídos por la optimización para motores de búsqueda. Dicho esto, hay algunas cosas que puedes cambiar, algunas cosas que debes saber y algunos consejos y trucos generales a continuación.

Aquí tienes una comparación de lo que ve un usuario y lo que ve un motor de búsqueda:

Lista de temas:

Tema:

Meta Tags

En Discourse, las metaetiquetas genéricas esenciales para el SEO se generan automáticamente en función del contenido presente en la página. La etiqueta de título, por ejemplo, se deriva del título del sitio o del tema, y la descripción se genera a partir del contenido de la primera publicación. Sin embargo, la personalización a nivel de página para los metadatos es limitada. Para alterar estos valores, necesitas ajustar la configuración o los campos de contenido de los que se generan.

  • La configuración del sitio Título, Descripción y Descripción corta del sitio
  • Los nombres de las categorías
  • Los títulos y el contenido de las publicaciones
  • Y así sucesivamente :technologist:

Estructura de URL y codificación

Caracteres no latinos y URL

Discourse, por defecto, elimina los caracteres no latinos de las URL de temas cuando la configuración regional se establece en EN. Para evitar esto, puedes cambiar la configuración regional al idioma principal no latino o cambiar la configuración método de generación de slug de ASCII a codificado.

Configuración de subcarpeta vs. subdominio

Discourse se inclina por los subdominios sobre las subcarpetas debido a su simplicidad técnica. Google realmente no tiene preferencia entre los dos[1], pero Discourse recomienda encarecidamente evitar las configuraciones de subcarpetas a menos que tengas un profundo conocimiento técnico.

Canonicalización

A Google le interesa indexar las versiones canónicas de las páginas. En Discourse, para un tema con varias respuestas, el enlace canónico (la primera publicación) se entrega a Google, que luego toma la decisión de indexar. Los temas de más de 20 publicaciones se paginarán, y cada página será un enlace canónico que contendrá hasta 20 publicaciones.
Por ejemplo, la etiqueta canónica para la última respuesta en este tema será https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12.

Marcado de esquema

Utilizamos marcado schema.org para ayudar a categorizar el contenido en los motores de búsqueda a través de las migas de pan. Se incluye el nombre de la categoría en el slug del tema:

Mapa del sitio

Discourse incorpora un mapa del sitio ubicado en /sitemap.xml que está habilitado por defecto a través de la configuración habilitar mapa del sitio. Esto facilita una mejor indexación por parte de los motores de búsqueda.

Vista estática para motores de búsqueda

Discourse tiene una vista HTML estática sin JavaScript para ayudar a los rastreadores web a indexar tu sitio más rápido. El contenido entre la vista dinámica y la estática es idéntico y nada se omitirá ni se eliminará cuando el sitio sea rastreado por los motores de búsqueda.

Posibles problemas con los rastreadores web

Los rastreadores web, también conocidos como robots, son esenciales para indexar páginas web. Sin embargo, algunos rastreadores pueden ser demasiado entusiastas y saturar el foro con muchas solicitudes. Discourse bloquea varios rastreadores notorios por defecto, pero te permite ajustar la configuración de agentes de usuario de rastreadores bloqueados si es necesario.

robots.txt

Puedes ver y editar, si es necesario, robots.txt[2]. Este archivo sirve como una herramienta para guiar a los rastreadores web sobre cómo interactuar con el contenido del foro. Su propósito principal es gestionar el acceso de los rastreadores, evitar que saturen el servidor y ayudar a mantener la salud SEO del sitio evitando la indexación de páginas de bajo valor o repetitivas.

:warning: Modificar este archivo sin una cuidadosa consideración puede dañar la indexación de tu sitio.

Migraciones y redirecciones de URL

La función de permalink se utiliza para redirigir URL antiguas, con el objetivo de preservar el SEO, evitar errores de “Página no encontrada” y ayudar a los motores de búsqueda con los metadatos correctos para una indexación más fácil.
Si tu sitio comunitario se migra a Discourse por nuestro equipo, las redirecciones de URL están incluidas a menos que haya razones válidas para no hacerlo.

Si estás utilizando uno de los scripts de importación existentes,, debes asegurarte de que el script lo maneje[3]. Puedes añadir permalinks manualmente desde tu panel de administración, en PersonalizarPermalinks.

Discrepancia entre vistas de página de Discourse y Google Analytics

Discourse y Google Analytics tienen metodologías diferentes a la hora de contar las vistas de página, lo que a menudo conduce a un mayor recuento de vistas de página en Discourse. Esta diferencia se debe a que Discourse es una aplicación de página única, que cuenta cada solicitud significativa como una vista de página.

Por otro lado, Google utiliza Javascript para contar las vistas de página solo en la carga completa de la página, excluyendo los rastreadores web por defecto. A diferencia de Google, Discourse cuenta las solicitudes brutas realizadas y emite vistas de página en la primera carga de una página o al cambiar de ruta, lo que hace que sus mecanismos de seguimiento sean distintos entre sí.

Si deseas obtener más información sobre informes de datos y análisis, consulta la categoría dedicada:

Métodos de desindexación

Para sacar páginas del índice de Google, puedes eliminar contenido o bloquear el acceso a una página. Dependiendo de tus necesidades, puedes hacer que todo tu sitio sea privado [4]. Puedes excluir temas eliminándolos o poniéndolos en categorías restringidas. Los temas ocultos no se indexan por defecto, pero pueden serlo si hay un enlace público en algún lugar que redirija a él.

Para una eliminación duradera, utilizar la herramienta de Eliminaciones en la Consola de Búsqueda de Google es la forma de mantener las páginas fuera de los resultados de búsqueda.

Más información en Retirar de Google información de tu sitio web - Ayuda de Search Console.


  1. Puedes leer más al respecto en Secure Uploads. ↩︎

  2. Busca la configuración “permitir indexación en robots txt”. ↩︎

  3. Buscar la cadena permalink en el script de importación debería darte esta información. ↩︎

  4. Busca la configuración se requiere inicio de sesión. ↩︎

19 Me gusta

¡Gracias por esta descripción detallada de SEO para Discourse! Como experto en SEO que trabaja con varias plataformas, me resulta muy útil ver cómo Discourse maneja elementos esenciales como sitemap.xml y robots.txt. La configuración predeterminada es bastante amigable para el SEO, pero tengo curiosidad por saber si existen algunas prácticas recomendadas o recomendaciones de plugins para mejorar aún más el control de indexación o la integración del marcado de esquema en los foros de Discourse.

¡Espero aprender más de la comunidad y contribuir en lo que pueda!

2 Me gusta