Explorando os Limites da IA no Reconhecimento de Conteúdo Gerado por IA

Sério? Nem mesmo a OpenAI afirma que isso pode ser feito.

3 curtidas

Boa observação, isso foi apenas sugerido como uma opção possível. Houve modelos melhores como GPT4-Turbo e Claude 3 desde aquele post de blog que poderiam indicar um melhor desempenho em teoria.

1 curtida

Isso não foi uma crítica à abordagem geral aqui.

Usar um LLM para procurar recursos no texto que possam sugerir que é spam é um objetivo muito bom e acolho a adição de todo o coração.

Meu único problema foi com a afirmação de que você pode identificar automaticamente texto gerado por IA, o que é um problema muito difícil.

Note a distinção:

  1. Identificar spam geral com LLM = ótimo e posso ver como isso pode ser tratável e muito valioso
  2. Identificar que o spam foi gerado por IA - com ou sem o uso de um LLM, isso é difícil. Não acho que os modelos atuais sejam capazes de fazer isso bem especificamente e os positivos são provavelmente apenas alucinações.
3 curtidas

Eu te entendo! Sim, é uma questão muito mais complexa. Na verdade, nos meus testes originais, tentei configurar para ambos, mas focar apenas em spam provavelmente produz melhores resultados aqui.

2 curtidas

Então estamos de acordo.

Acho que há alguns sinais reveladores de IA, no entanto - como o comprimento das postagens e o uso excessivo de linguagem excepcionalmente florida… então talvez esses aspectos possam ser analisados… o comprimento das postagens é provavelmente difícil para um LLM, embora a “floridez” possa ser menos difícil. Você pode usar funções determinísticas para sinalizar o comprimento das postagens, é claro.

Por outro lado, se alguém usou o ChatGPT para refinar, por exemplo, seu inglês (como segunda língua), sinalizar sua postagem provavelmente não será útil para a inclusão geral da Comunidade.

Indo um passo adiante aqui, técnicas gerais de aprendizado de máquina podem ser úteis, mas mais complexas de implementar do que simplesmente enviar texto para um LLM e obter o resultado.

2 curtidas