Possibilidade de sair como usuário de traduções automáticas

EDITAR: Este tópico começou como um tipo de solicitação de recurso que me permitiria, como autor, ter mais controle sobre como minhas contribuições (posts) são tratadas. Resultou em uma reflexão muito mais profunda sobre como a tradução de IA de conteúdo poderia acabar e se ela é significativa e possível em um contexto deste fórum (e similares). Segue meu post original:


Quero continuar sobre o que percebi ao discutir as armadilhas das traduções automáticas. A maior parte da discussão foi sobre como o Administrador do Discourse pode configurar o site para traduzir (ou não) de forma agradável e, quando o faz, como os usuários devem ser informados sobre o que estão lendo (qual é o idioma original, se é uma tradução etc.).

Mas tenho outro ponto de vista:

Houve um argumento de que os proxies fazem alguma tradução para trazer tráfego:

Mas quero falar sobre a fonte da informação, ou seja, quando você finalmente chega ao post que o autor escreveu, o que verá?

Então, vamos pegar o Meta como exemplo e olhar de diferentes pontos de vista e objetivos:

  • Proprietário do site (CDCK): Queremos falar com o maior número possível de pessoas, então ativamos a localização por IA.
  • Leitor: Quero ler facilmente tudo nos idiomas com os quais me sinto confiante (minha língua materna e quaisquer outras que aprendi, quero ler os originais, caso contrário, tradução automática para minha língua materna).
  • Escritor: Agora existem duas opções:
    A) Eu escrevo em qualquer idioma e estou bem com você traduzindo para o que quiser.
    B) Sou muito cuidadoso com o que escrevo e como escrevo no idioma que escolhi (aqui no Meta seria o inglês como a língua principal original do fórum) e quero optar por não participar das traduções automáticas que vocês oferecem.

Então, B é o meu ponto. Eu, como contribuidor, quero ter algum controle sobre o que vocês fazem aqui com minhas contribuições, não importa como vocês imaginem o funcionamento do fórum. Estou bem com o fato de que algumas pessoas não conseguirão entender o que digo. Se eu escrever em inglês, posso esperar que as pessoas também aprendam inglês para me entender – eu mesmo tive que aprender inglês em primeiro lugar. E não quero ser mal interpretado apenas para ser ouvido pelo maior número possível de pessoas.

Portanto, este recurso é para que o autor possa controlar o nível de tradução de seus posts.

E se você imaginasse implementá-lo, é claro que pode ficar mais complicado – se eu falar várias línguas, posso ir tão longe a ponto de localizar meu post manualmente. Não é provável, mas em teoria, sim.

4 curtidas

Isso é… algo. Você está realmente exigindo isso de todas as pessoas vivas na Terra, só porque você aprendeu inglês :flushed_face:

Claro. Poderia ser feito. Então, todas as postagens onde o autor diz o que um leitor deve fazer, devem ser ocultadas de todos os tópicos traduzidos. Porque isso seria justo.

Este será um mundo interessante quando todos os italianos, falantes de espanhol, portugueses, russos, chineses, vietnamitas… seguirão sua ideia.

1 curtida

Estamos discutindo os aspectos técnicos e filosóficos das traduções ou o gosto e a experiência de vida uns dos outros aqui?

1 curtida

Por que você acha que eles não estão relacionados? Você acabou de dizer por que quer obter algo usando um motivo muito filosófico e agora algum motivo não é adequado?

Eu realmente não gosto de dois pesos e duas medidas. Mas não cabe a você dizer o que posso ou não posso fazer. Você faz sua escolha de escrever ou não, nada mais.

Estou fora.

Será um mundo muito triste se as pessoas pararem de tentar aprender as línguas umas das outras. Uma guerra global em menos de 5 anos. Mesmo sem a IA ser má. E estou sendo otimista aqui.

Exatamente, e esta postagem é toda sobre minha escolha e a escolha da CDCK de me aceitar ou não.

1 curtida

Obrigado pelo seu feedback, mas acho que pode ser até contra as regras da comunidade reagir a um tópico apenas porque você não compartilha o ponto de vista do autor. Existem muitos recursos do Discourse que eu não usaria e não os anuncio em todos eles, muito menos dizendo aos autores o quão estúpidos eles são.

Se você, como autor, não se importa com a forma como é apresentado, eu fico totalmente bem. Eu não me importo e não vim aqui para ouvir que eu estava errado, e acho que nem é o objetivo deste fórum. Fico mais do que feliz em ouvir que não será feito, ou que existe outra solução para o meu problema. Uma discussão civilizada e construtiva. Obrigado.


E quanto à sua pergunta: Exijo que todos aprendam inglês? Não. Não preciso que todos leiam o que escrevi. Mas se lerem, quero que vejam apenas o original. E se quiserem ver a tradução, quero que usem sua própria ferramenta para que estejam cientes ao traduzir algo. Para que saibam que não é perfeito. Receio que, à medida que a tradução automática por IA for implementada e utilizada, as pessoas se tornarão preguiçosas para estudar o que era o original. E preguiçosas para falar comigo na língua que eu entendo. E eu quero optar por sair disso como autor neste site. Fiquei muito feliz com a comunidade de língua inglesa de todo o mundo e tenho a forte sensação de que o conteúdo se degradaria se cada um de nós começasse a falar em nossas línguas, enquanto deixamos a IA traduzir automaticamente para os outros. Não com tópicos muito técnicos, mas definitivamente com tópicos mais profundos como este.

Acho que a tradução automática deve ser habilitada para categorias como #suporte ou Bug, mas considerada com sabedoria para qualquer categoria mais profunda como #recurso ou #feedback-do-site e habilitada, mas revisada manualmente em, por exemplo, #documentação ou #wiki-da-comunidade. Caso contrário, mesmo como leitor, posso começar a me preocupar com a qualidade do conteúdo.

Basicamente, o Discourse agora mudou do negócio de UGC (Conteúdo Gerado pelo Usuário) de 100% de altíssima qualidade para Semi-AIGC (um post é UGC - o original, todas as traduções são basicamente geradas por IA, embora todos esperem que estejam corretas - mas ainda assim - são totalmente geradas por IA e nenhum humano as lerá para garantir que algo não deu errado). E como as pessoas começarão a responder ao AIGC, pode ficar muito confuso.

É um grande passo.

E minha pergunta é: quero fazer parte disso? Ou pelo menos ter a opção de ficar de fora?

6 curtidas

Este é um bom tópico, concordo que ter a escrita sendo traduzida automaticamente sem que isso fique claro para os leitores pode ser um problema. Outra solução possível é haver um banner de alerta para notificar os leitores qual é o idioma original que estão lendo e qual sistema foi usado para traduzi-lo.

O inglês é uma das línguas mais bizarras que já existiu, onde algumas pequenas alterações na estrutura da frase ou na gramática podem mudar drasticamente o significado de uma frase ou a forma como os leitores a interpretam.

1 curtida

Agora, quando você diz isso, talvez nem resolva meu problema.

Digamos que eu fale inglês (mas não seja nativo). Agora temos um tópico que é assim:

  1. Tópico Principal: SomeLanguage
  2. Resposta: EnglishLanguage
  3. Resposta: SomeLanguage
  4. Resposta: TotallyDifferentLanguage

Tudo é traduzido para o inglês, mas apenas a primeira resposta é realmente de um falante de inglês.

Agora, em que idioma está este tópico? Nenhum aviso tornará isso mais fácil para mim. Qual é a qualidade de tal tópico? Basicamente, todos estão respondendo à tradução da IA. Se o tópico original já não era de alta qualidade, ele piorará cada vez mais… E acho que eu responder “Somente em inglês” não resolverá isso.

Talvez todo o meu ponto possa ser realmente reduzido. Uma discussão significativa pode ser mantida em uma mistura de idiomas conectada por um robô? Abrir para qualquer pessoa com qualquer habilidade linguística e baixar a barreira para o mínimo histórico realmente melhorará a discussão?

Tenho que enfatizar: Estou muito feliz com esta comunidade cheia de pessoas que investem sua energia em:

  1. Aprender uma nova tecnologia
  2. Aprender um novo idioma (se aplicável)
  3. Aprender a discutir em primeiro lugar

Um desses não será mais necessário. Mas nem mesmo isso. Será substituído por um robô. Ganha ou perde?

Também pode ser usado para alunos mais velhos ou adultos de uma língua estrangeira, onde o desafio de falar de forma compreensível e de entender é mais difícil devido ao baixo volume e, portanto, é necessária uma maior maestria dos detalhes da pronúncia.[21]

1 curtida

Vou tentar algo aqui (estou escrevendo isso em tcheco) – hoje recebi uma nota 5 do professor.

Agora isso é interessante. Escrevi esta frase em tcheco. Temos notas numeradas de 1 a 5, onde 1 é a melhor e 5 é a pior na escola.

Escrevi exatamente:

Hoje recebi um 5 da minha professora.

Em inglês, a tradução foi muito boa, preservando o significado (embora não o fato em si). Verifiquei brevemente outros idiomas e não foi tão bom.

Em alemão, disse “Fünf”, mas eles têm 6 notas na Alemanha. Então 5 significa reprovação, mas eles têm algo ainda pior do que isso (imagine!).

Mas se um suíço de língua alemã ler, é o contrário (5 é o segundo melhor)!

Em japonês, ainda menciona o número 5, que na verdade significa “Melhor” no Japão.

Agora imagine tchecos, alemães, suíços e japoneses indo a um bar…

Ah, e verifiquei a Finlândia e lá é ainda mais engraçado!

1 curtida

Um momento…

Que recurso podemos adicionar ao Discourse para proibir “copiar e colar” idas e vindas para o Google Tradutor???

Devemos fornecer aos usuários finais a capacidade de desativar a “cópia” substituindo CTRL-C no teclado???

Grande parte desta discussão parece um exercício intelectual. Parte dos Termos de Serviço da vasta maioria dos fóruns é que “você está concedendo direitos aos operadores do fórum, em troca do valor que eles lhe fornecem ao lhe dar uma comunidade online”


Onde eu me posiciono firmemente é em “rotulagem”, queremos que fique claro que o conteúdo foi traduzido e garantir que seja sempre fácil acessar o original, certamente apoio a iteração em nossa interface do usuário.

“originalmente escrito em alemão - veja o original clicando aqui”

É muito barulho para adicionar a cada postagem, mas tenho certeza de que podemos encontrar uma maneira amigável e clara de rotular as coisas.

Além disso… o “Eu falo Lang 1 / 2 / 3, então me mostre o original nesses idiomas” é valioso. Tenho esse mesmo problema no X porque sou multilíngue.

9 curtidas

Não acho que alguém tenha sugerido que você impedisse isso. Tive a impressão de que isso era preferível porque cria a consciência de que é uma tradução.

E também tenho a impressão de que atualmente nem todos os usuários estão cientes disso. Isso leva a mal-entendidos como em Edit of hidden entry blocked period setting onde o nome da configuração do site que forneci foi traduzido, e o usuário não percebeu, então isso não o ajudou.

Posso entender o sentimento de querer optar por não ter suas postagens traduzidas para evitar mal-entendidos. Como disse no outro tópico: Fico imaginando o que teria acontecido se eu tivesse escrito minha postagem que causou mal-entendidos em alemão e a IA a tivesse traduzido da maneira que postei. Minhas intenções teriam sido interpretadas de forma diferente então? Ou a reação teria sido a mesma?

3 curtidas

Quero dar um passo atrás aqui.

Se fosse

  1. Claramente uma tradução
  2. De alguma forma mais fácil de acessar o original (já está a 1 clique)

Que problema resta?

2 curtidas

Esta thread deveria ser mais longa, mas é um feedback simples e uma sugestão de recurso. Ao discuti-la, percebi que é algo muito mais complicado e que pode não ter solução alguma ou levará muito tempo para ser encontrada.

Existem muitas questões sutis que podem aparecer apenas com o tempo, frustrando um usuário após o outro. Valorizo profundamente a principal motivação da CDCK para criar o Discourse — apoiar discussões civis. Adorei isso desde a primeira vez que o instalei, 10 anos atrás. Foi o diferencial para mim, não importando quão bom ou ruim fosse o produto. Acreditei que com essa missão vocês criariam um ótimo produto. E acho que estava certo.

Bastantes.

Problemas de Localização de Produto

Eu localizei alguns pacotes de software, o Discourse é um dos 2 grandes. Também criei vários pacotes de software grandes. É muito trabalho com a língua se você quiser fazer isso corretamente. Nomear algo de forma inconsistente frustra os usuários. Seja no aplicativo ou na documentação. Às vezes, encontro uma palavra tcheca melhor para o que você tem um termo simples em inglês (mas nós não temos) e tenho que percorrer todas as traduções do Discourse para verificar se está sendo usada de forma consistente.

Então você vê o problema do @Moin com apenas um pequeno detalhe — uma configuração citada. Se vocês suportarem o tcheco um dia e toda pessoa tcheca puder ler todo o Meta em sua língua, eu me preocupo. Porque aposto que 50% serão mal traduzidos. Todas as configurações do site, etc., terão nomes incorretos. Porque não foi fácil encontrar palavras que tivessem significados semelhantes ao que você quer dizer em outra língua. Havia várias opções e eu tive que escolher. Às vezes, contra as sugestões da IA de tradução.

Discussões Mais Profundas

Depois, há discussões como esta. É uma discussão complicada do meu ponto de vista. É crítica, então eu realmente tenho que pensar muito e escrever as coisas com algumas perspectivas culturais em mente. Eu meio que sei para quem estou escrevendo porque leio seus perfis e sei de que países vocês são. O fato de todos nós já sabermos inglês significa algo. Significa que nos aproximamos e já compartilhamos alguns pedaços de uma cultura comum. Nós meio que sabemos o que soa engraçado em inglês, então não precisamos sempre dizer coisas como “só para você saber, isso é uma piada tcheca”.

Já sabemos os obstáculos em encontrar palavras para o que queremos dizer, cometemos erros no passado e agora tentamos não repeti-los. Veja este teste que acabei de fazer aqui

Se estou usando uma língua estrangeira, a probabilidade é alta de que eu também esteja ciente não apenas dos problemas de tradução. Pode ser que eu tenha aprendido (talvez da maneira difícil) que as notas escolares não são as mesmas no mundo todo. Então eu não te digo qual nota eu tirei quando nos EUA vocês têm letras. A IA também sabe, então traduziu “nota reprovada” para o inglês. Mas falhou miseravelmente com outras línguas e apenas deu o número. Mas é exatamente isso que eu escreveria se estivesse me comunicando em um fórum tcheco com tchecos (vocês todos pareceriam tchecos de repente). Então eu não me preocuparia nem um pouco que você não entendesse. E a conversa ficaria muito estranha a partir da 3ª postagem.

E este é um problema muito simples. Imagine que você começa a perder o sentido, uma palavra após a outra, ao longo de uma discussão importante.

Como no jogo do telefone que mencionei. A tradução por IA funciona como o “ruído” aqui. Você começa com algo e termina com algo completamente diferente.

Eu, O Autor

Então, o que eu queria sugerir era que comecei a me sentir mal como autor aqui. Quero contribuir, mas quero ter mais controle. Como um autor de livro que tem que concordar com as traduções de seus livros. A tradução nunca soará como o original, mesmo com o maior cuidado. Os autores sabem disso. Então não é como se qualquer um pudesse traduzir seus livros a qualquer momento. Eles escolheriam o tradutor, pelo menos, e verificariam como o livro soa na nova língua.

Eu não tenho controle sobre isso aqui. Quero ser compreendido, realmente me importo com isso. Talvez 95% das postagens aqui sejam coisas técnicas simples, seja lá o que for. Mas eu ficaria desmotivado a começar algo mais profundo e significativo se soubesse que estou sendo traduzido sem cuidado (por IA) para várias línguas e culturas. Nenhum aviso resolveria. Está aí e as pessoas o usarão porque é fácil. Ninguém jamais lerá o original. E as pessoas começarão a responder à minha thread com base nessas más traduções e eu lerei más traduções do que elas escreveram. Eu ficaria muito infeliz.

4 curtidas

Bem, se você está escrevendo na Alemanha, posso garantir que não temos mal-entendidos sem traduções. O mesmo vale se eu usar finlandês.

Como isso é uma situação vantajosa para todos?

Esta não é uma questão de problemas de tradução que são facilmente resolvidos apenas perguntando. Esta é uma questão de tornar a comunicação o mais forte possível além das fronteiras e forçar o uso de uma língua franca — porque antes não havia outra solução, porque não havia tradutores. Agora temos essa ferramenta.

E pergunto por qual motivo alguém sente que é seu direito ditar qual idioma eu uso para ler — e se estou adivinhando certo, esse foi o ponto de Sam sobre copiar e colar.

Já existem ferramentas se alguém quiser ler o idioma original. Há uma marca para mostrar quando algo é federado (oh céus, mesmo lá alguém pode usar um tradutor e entender mal as coisas :smirking_face:) e espero que todos usem algum tipo de marca quando uma IA estiver participando. E temos uma marca para tradutores.

Mas esse não é o ponto agora. É dar aos escritores o direito de dizer quando as traduções são feitas ou não. Não se trata de tags e botões.

1 curtida

Foi exatamente aí que comecei. E para responder à sua pergunta “quem sou eu para dizer?”, a resposta é simples: O autor do conteúdo aqui. O conteúdo que alimenta o fórum. O produto real “vendido” aqui.

Mas agora estou fazendo uma pergunta realmente mais sofisticada: a multilinguismo matará o meta? A redução das barreiras de entrada trará mais qualidade? Essa é mais a minha preocupação agora. Sei que você pensa “Sim, claro! Todos deveriam participar!”. Enquanto eu sussurro “Não tenho certeza, talvez a barreira do idioma tenha sido uma boa para filtrar todo o ruído…”.

Lembro-me dos dias em que tínhamos “content farms”. Tantos sites onde as pessoas geravam toneladas de textos para enganar o SEO. E os sites que usavam isso rapidamente se degradaram nos resultados de busca. Porque todos sabemos que não é conteúdo real, as pessoas eram pagas para gerá-lo. E tenho a sensação (não o conhecimento, não posso provar) de que as traduções automáticas cairiam de alguma forma nesse espaço. Não é conteúdo real.

E eu me sentiria como a pessoa que apoia a “content farm”. Eu escrevo algo aqui e 20 outras versões emergem automaticamente. E as pessoas começam a responder sem sentido… E não há nada a fazer a respeito.

Na verdade, também temo que o meta possa acabar como aqueles sites baratos de Perguntas e Respostas que usávamos antes do StackOverflow aparecer com seu ótimo conteúdo curado. Que eu sei que tem uma história compartilhada com o Discourse, é claro.

1 curtida

O Meta é principalmente um fórum de discussão para falar sobre recursos / bugs / pequenas falhas de UX do Discourse e assim por diante.

Se um bug for descrito cuidadosamente em alemão e depois eu o ler em inglês - as chances são razoavelmente altas de que eu entenda qual é o bug. Com o direcionamento certo, também podemos fazer com que a IA apresente esse bug a um público mais amplo para que eles entendam que foi um bug e foi corrigido.

Outra pergunta que vale a pena ponderar… apenas 8% dos japoneses falam inglês, em comparação com, digamos, 45% dos tchecos.

O inglês como filtro para “pessoas capazes de um Discurso civilizado online” pode servir como uma espécie de teste de Rorschach em alguns países onde todas as “pessoas de alta qualidade falam inglês fantasticamente”, mas certamente não em todos os países.

Sim, alguma Discussão com nuances é muito difícil de traduzir. Mas é importante notar que a tradução por IA hoje é a pior que jamais será. Com o tempo, podemos capturar melhor as nuances e a entonação. Na verdade, acabei de ler sua postagem em hebraico e foi bastante fiel, todos os seus pontos principais foram capturados com um sólido 8 em 10.

5 curtidas

Mas este caso de uso específico não acontecerá mais. Veja, mantemos o tópico em inglês enquanto a tradução pode continuar no contexto de toda a comunicação (não sei se acontece, mas poderia). Traduzindo em uma direção Inglês → outros idiomas. Assim, temos uma tradução estável de 8/10 de todo o tópico. Isso é muito bom!

Digamos que tcheco-hebraico seja 7/10.

Então eu começaria em tcheco e você leria 7/10 em hebraico.

Então você responderia em hebraico e eu leria a tradução tcheca de 7/10.

Para tornar as coisas mais interessantes, agora o japonês entraria com uma versão 7/10 (mas um 7/10 diferente – algumas peculiaridades linguísticas especiais além do tcheco-hebraico).

E digamos que @Jagster também estaria disposto a contribuir com sua linguagem muito especial.

O inglês não estaria envolvido. Nem um pouco.

Pessoas falando em suas próprias bolhas, nada em comum, nem mesmo um senso disso. E há algo fora da vontade delas que tenta fazê-las se entenderem. (Na verdade, não – apenas fazendo seu trabalho – tradução. O trabalho não é “fazê-las se entenderem”.)

Você tem certeza de que isso poderia funcionar em quaisquer circunstâncias? Mesmo tradutores humanos se recusariam a servir a isso, acredito. Não se trata de a IA ser boa o suficiente. Se for 9.8/10 em um tópico de 100 posts, acredito que falharia de qualquer maneira.

Talvez usar um ícone de tradução/idioma ao lado dos ícones de histórico / hora na postagem?

:+1: O Firefox mostra uma opção “Nunca traduzir para este idioma”

Também: sempre me mostre o original pode ser valioso. Descobri que viajar para lugares onde não falo o idioma me salva da publicidade… E a web se tornou um lugar assim.

Nota: talvez mover os comentários existentes neste tópico do anúncio original para cá?

5 curtidas