Detección de spam en Discourse AI reemplaza el plugin Akismet

A partir de hoy, eliminaremos el plugin Discourse Akismet y, en su lugar, habilitaremos Discourse AI - Detección de spam de forma predeterminada para los clientes alojados en los planes Pro y Standard.

¿Por qué hacemos este cambio?

Durante las últimas semanas, hemos descubierto que nuestro detector de spam con IA ofrece un rendimiento superior al de Akismet.

Hemos tenido más de 126 sitios utilizándolo extensivamente y, dentro de Meta, hemos visto personalmente una tasa de éxito superior al 96% en la detección de spam.

Además del rendimiento, la configuración ahora sería una experiencia predeterminada con opciones de personalización y flexibles, en caso de que las necesite.

¿Qué necesito hacer?

Si está en nuestro alojamiento Starter o Pro, ¡no necesita hacer nada!

El cambio ocurrirá automáticamente en segundo plano. Ya no verá Akismet en los plugins. Ahora verá el detector de spam de IA activado en la configuración del plugin de IA utilizando un LLM de pesos abiertos alojado por Discourse.

Si tiene el plugin de IA deshabilitado, deberá activar manualmente el detector de spam de IA y seleccionar un LLM.

¡Ya tengo habilitada la detección de spam de IA!

Si ya tiene habilitada la detección de spam de IA a través de los experimentos de Novedades, ¡puede ignorar este anuncio ya que ya la tiene!

¿Por qué este cambio es solo para Starter y Pro?

Como de costumbre, la implementación de cambios en nuestro alojamiento comienza con los niveles iniciales y se expande gradualmente para cubrir todos los niveles.

19 Me gusta

2 publicaciones se dividieron en un nuevo tema: Cambio de marca de la cuenta de detección de spam de IA

¿Significa esto que estás descontinuando el plugin por completo, o solo que ya no lo ofreces en tu plataforma alojada? Yo autohospedo y no estoy usando ninguna ‘IA’. ¿Me obligarán a empezar a usar la detección de spam con IA?

3 Me gusta

Este cambio solo afecta a los clientes alojados en los niveles de plan Starter y Standard. El plugin Akismet se elimina y ya no está disponible para esos niveles de plan.

Los autoalojadores pueden tomar sus propias decisiones aquí.

3 Me gusta

¿Funcionará la detección de spam de IA correctamente para idiomas con menos hablantes en el mundo? Como por ejemplo, el ucraniano.

Además, ¿gestionará las publicaciones bilingües, algo natural en algunos países, como por ejemplo en Ucrania, donde la gente habla tanto ucraniano como ruso indistintamente, y a veces pueden usar ambos en una sola publicación?

Supongo que otro ejemplo podría ser napolitano/italiano? ¿O español/catalán? Pero no estoy muy seguro de estos pares; solo sé sobre ucraniano/ruso.

3 Me gusta

Absolutamente, simplemente depende del LLM que utilices para potenciarlo.

Los modelos de Google tienden a ser extremadamente multilingües, Gemini Flash soporta 120 idiomas, por lo que es un buen candidato.

Pruébalo con el botón de prueba en algunas publicaciones reales, algunas publicaciones de spam, etc. Puedes proporcionar instrucciones personalizadas como:

Publicar en ruso / ucraniano de forma intercambiable está bien.

4 Me gusta

Funciona para el finlandés a través de OpenAI. Bueno, de vez en cuando da falsos positivos si hay una sola línea, pero no creo que sea un problema del idioma, sino de indicaciones débiles.

5 Me gusta

[cita=“Saif, post:4, topic:354602”]
Los autoalojados pueden tomar sus propias decisiones aquí
[/cita]

Hola, soy autoalojado. ¿Está la detección de spam de Askimet integrada en el núcleo de una instalación de Discourse o necesito instalar este plugin por separado? Gracias.

1 me gusta

No está incluido en el núcleo. Puedes encontrar el tema aquí: Discourse Akismet

Pero el tema está cerrado y oculto. No estoy seguro de lo que eso significa. Tendría sentido si el plugin ya no se mantuviera, pero este tema dice que solo se eliminó de dos niveles de alojamiento. Entonces, ¿por qué los autoalojados y los clientes alojados en niveles superiores no deberían poder encontrar la información buscando en Meta? Esperaría una respuesta a eso antes de instalarlo.


Y creo que una vez en la primera publicación, accidentalmente se reemplazó ‘Starter’ en lugar de ‘Standard’ con ‘Pro’.

Akismet nos ha fallado demasiadas veces. Hemos observado muchos sitios con él instalado que simplemente se inundan de spam.

Los auto hospedadores deberían usar Discourse AI con uno de los muchos modelos gratuitos si el presupuesto es una preocupación. Gemini Flash 2.0 de nivel gratuito hace el truco razonablemente.

6 Me gusta

Gracias por la información, no era obvio que mi sitio de Discourse autoalojado no estaba protegido contra el spam. Asumí erróneamente que lo estaba. En mi opinión, esta información debería presentarse de manera más destacada para los futuros administradores de Discourse que contemplen autoalojar su sitio.

Buscaré esa funcionalidad de Discourse AI, que nunca antes había considerado debido a restricciones presupuestarias.

Intento enumerar aquí las acciones para un administrador en un sitio autoalojado como el mío, ¿puedes decirme si tengo razón?

  1. ¿Primero debería instalar el plugin Discourse AI? Discourse AI

  2. ¿Segundo, debería configurar un LLM como se explica aquí? Discourse AI - Large Language Model (LLM) settings page

  3. ¿Luego debería configurar un mecanismo de detección de spam como se explica aquí? Discourse AI - Spam detection

1 me gusta

Un recordatorio/nota para los auto-alojadores:

Añadir LLMs “aleatorios” para lidiar con el problema del spam potencialmente abre una caja de Pandora en términos de privacidad y protección de datos de identificación personal (PII). Si se te exige cumplir con el GDPR o COPPA, etc., el uso de LLMs externos podría requerir que entres en un acuerdo de protección de datos con el proveedor del LLM para asegurar que tu sitio no filtre PII a un tercero. Y las PII comienzan con cosas simples como nombres y direcciones de correo electrónico.

Esto es solo algo a tener en cuenta.

2 Me gusta

No sé si las cosas están en EE. UU. o en el Reino Unido [1], pero en la UE esta es una pregunta relativamente simple.

Los datos necesarios pueden ser “filtrados” o transferidos a terceros, incluso si se consideran PII (Información Personal Identificable), si cumplen con el GDPR. Y todos los jugadores importantes lo hacen. O eso dicen. Es una cuestión de confianza.

Odio decir esto en voz alta, pero no confío en ninguna empresa de China. Y lo mismo ocurre con las empresas estadounidenses. Ambas partes tienen problemas gubernamentales importantes, y la necesidad de ganar dinero al estilo extranjero es fuerte. Microsoft filtró/está filtrando datos a EE. UU., incluso si deberían mantenerlos en la UE.

¿Todavía uso Amazon y OpenAI? Sí, porque debo. Pero todas mis VPS y la mayor parte de la actividad de S3 se han trasladado de AWS. Pero mis correos electrónicos personales, y los transaccionales de, por ejemplo, el foro, todavía son manejados por AWS.

Toda la actividad de IA basada en foros es manejada por OpenAI. No confío en ellos, pero ¿cuáles son mis opciones? Realmente no me gusta la conexión con Microsoft, pero las cosas podrían ser peores…

Entonces, nosotros, como administradores de la UE, estamos bastante seguros cuando no pedimos copias de pasaportes o identificaciones personales, porque Discourse como plataforma maneja su parte bastante bien. Y mientras el tercero declare que cumple con el GDPR y otras regulaciones (lo mismo que con los anuncios de Google, etc.), la “filtración” no es un problema legal.

Pero es un problema moral, sin duda. Por eso usamos IA y al mismo tiempo intentamos enseñar a los usuarios, o no la usamos en absoluto. Esas son las opciones.

Y en el panorama general… la IA en el foro es un problema mucho menor, en términos de PII, que usar Meta, 8.8.8.8 como DNS o servicios VPN comerciales (o grabar llamadas de iPhone usando servidores chinos… [2]).


  1. opinión personal: ambos países son un desastre en este asunto ↩︎

  2. en serio… mi aspiradora robot quería enviar todos los datos de ubicación e información wifi a China ↩︎

2 Me gusta

¿El plugin de IA consume más recursos computacionales (léase: ambientales) que Akismet?

1 me gusta

100% desconocido, Akismet es una API y Wordpress nunca publicó la cantidad exacta de cómputo que utiliza.

Nuestros servidores de GPU están sirviendo a toda nuestra base de clientes, y los LLM se han vuelto significativamente más eficientes en los últimos 3 años.

4 Me gusta