Converter imagem em texto

As pessoas postam capturas de tela, poderia haver uma maneira de extrair texto de uma imagem e adicioná-lo na parte inferior da postagem

1 curtida

Claro. Google OCR.

Mas não pelo Discourse. E eu apostaria que tal funcionalidade não virá tão cedo de qualquer forma :wink:

1 curtida

Suspeito que você teria que criar um plug-in, seja criando-o você mesmo ou contratando um freelancer Marketplace

1 curtida

Veja este plugin

O cliente (@csmu) nunca me pagou, aliás :face_with_symbols_on_mouth:

6 curtidas

Olá @michaeld

Analisando rapidamente este plugin, estou certo de que as imagens são enviadas para servidores do Google para processamento? Qual foi o raciocínio para essa abordagem em vez de usar uma gema Ruby para processar localmente ou no servidor da instância do Discourse? Estou interessado neste tópico, mas o envio de imagens para fora da empresa não é uma opção.

Melhor desempenho, facilidade de manutenção, evitando dependências de versão na instalação local.

Entendo que esta nem sempre é uma abordagem aceitável. Um PR é bem-vindo, embora o usuário deva sempre ser capaz de evitar um inferno de dependências locais.

1 curtida

Interessante. Imagino que isso tenha sido focado principalmente na escrita à mão, certo? Se fosse simplesmente extrair texto de uma imagem, por exemplo, uma captura de tela de erro, então acho que uma gema local seria precisa o suficiente. Brinquei com uma biblioteca Python para algo assim há um tempo e obtive resultados razoáveis. Às vezes era lixo, mas os resultados nunca seriam lidos pela comunidade, apenas pelo mecanismo de busca. Se o usuário notasse algo bobo, ele poderia sempre modificar o texto oculto.

Eu não quero resultados razoáveis, quero resultados excelentes.

2 curtidas

Não há OCR que possa oferecer excelentes resultados. Mesmo resultados razoáveis podem ser difíceis de alcançar — não importa qual biblioteca esteja em uso,

1 curtida

Lembre-se que o OCR geralmente funciona em capturas de tela, não em digitalizações ou fotos. Ainda assim, não será 100%, mas é um bom tipo de texto para tentar reconhecer.

Observo que a interface web do Mastodon oferece uma função de OCR na caixa de diálogo onde você pode inserir uma descrição de imagem por motivos de acessibilidade. Pode ser que ele seja executado no lado do servidor. Veja como fica, depois de eu clicar em “Detectar texto da imagem”:

1 curtida

Interessante. Parece que tem resultados semelhantes ao Tesseract. Gostaria de saber como a ferramenta Mastodon lida com imagens com gráficos e texto?

Um objetivo nobre :heart: Embora eu compartilhe o desejo por resultados excelentes, ficarei feliz com uma melhoria de 80% :wink:

No contexto que tenho em mente, o objetivo é extrair coisas como mensagens de erro de capturas de tela. Por exemplo, se um usuário tem um log de erros em seu terminal, a tendência é apenas tirar um print. Mesmo que o resultado não seja perfeito, se ele extrair cerca de 80% do texto corretamente, então alguém que procura pela mensagem de erro, ou outro pedaço de texto relacionado, tem uma chance muito maior de encontrar o Tópico, do que se fosse apenas a imagem não pesquisável.