Você pode nos dizer exatamente qual ferramenta e método você usou para detectar e encontrar esse plágio para que possamos tentar escanear todo o nosso site e todas as nossas páginas em busca de tais problemas e corrigir todos esses URLs?
Além disso, acho que o Google pode estar errado nisso porque encontrei outros sites que copiam conteúdo do meu site exatamente, e acho que o Google está confuso e marcando nosso site como copiado, enquanto os outros sites estão copiando nosso conteúdo. E o conteúdo foi originalmente postado em nosso site por nossa equipe de redatores.
Veja este como um exemplo, este site https://rotaractbeirut.org/ 1 está copiando todo o conteúdo do nosso site howtodiscuss.com 1
Existem muitos outros sites que estão copiando conteúdo do nosso site https://howtodiscuss.com/
Além disso, se publicarmos conteúdo primeiro e grandes sites copiarem nosso artigo e o Google os indexar primeiro (devido à sua taxa de rastreamento frequente), então como podemos provar ao Google que fomos nós que escrevemos originalmente aquele artigo?
Só porque você mencionou TheSpruce, também pode ser o caso de TheSpruce ter copiado conteúdo de Howtodiscuss e não o contrário. Só porque uma grande marca é um site de alta autoridade, isso não os impede de copiar o conteúdo de pequenos sites. Como no exemplo acima que dei. Onde outro site está copiando todos os nossos artigos.
Dito isso, se você puder nos fornecer a ferramenta ou método para escanear em massa todo o nosso site e nos encontrar todos os URLs para todo o conteúdo plagiado, para que possamos corrigi-lo imediatamente. E por favor, compartilhe conosco como você encontrou esse conteúdo duplicado em nosso site?
Contratei uma grande equipe de redatores e investi muito dinheiro neles para publicar conteúdo de alta qualidade, exclusivo, escrito manualmente e bem pesquisado. Eu quero parar esse plágio se os redatores o fizeram por engano.
Quero limpar meu site o mais rápido possível e me livrar de todo o conteúdo plagiado e duplicado do meu site. Há alguma ajuda que eu possa obter do lado técnico/desenvolvimento do Discourse para acelerar esse processo ou para nos ajudar a encontrar plágio em todos esses 157.000 tópicos que temos? Cheguei a comunidades de SEO, mas elas não conseguiram realmente me ajudar a limpar meu site. É por isso que postei este problema no Discourse, pois vocês são especialistas e têm soluções para quase todos os tipos de problemas.
Ainda estou preocupado que, mesmo que publiquemos conteúdo original primeiro e alguns grandes sites copiem nosso conteúdo e o Google os indexe primeiro, então o Google os chamará de primeiro editor (devido à sua autoridade de rastreamento frequente), mas na verdade fomos nós que o publicamos primeiro. Como podemos corrigir isso e impedir que o Google confunda nosso site como o copiado em vez do ladrão original.