Enumera las publicaciones fuera de tema para una moderación fácil

¿Hay alguna forma de analizar cadenas de publicaciones para determinar si se desvían del tema/hilo y de la primera publicación?
Pienso en “este tema se parece a…” lo que indica que existe una base de datos de similitud.
Podría haber una evaluación de las marcas hechas por los usuarios en el pasado.
Podría haber una evaluación de los movimientos moderados en el pasado.
ver también
https://meta.discourse.org/search?q=off%20topic%20NLP&expanded=true
Podría haber una IA o PNL para trabajar las publicaciones e identificar aciertos y errores del tema. Esto podría ayudar a la moderación y a limpiar el foro.