Converter imagem em texto

vainaixr · Setembro 20, 2022, 5:56am

As pessoas postam capturas de tela, poderia haver uma maneira de extrair texto de uma imagem e adicioná-lo na parte inferior da postagem

Jagster · Setembro 20, 2022, 5:59am

Claro. Google OCR.

Mas não pelo Discourse. E eu apostaria que tal funcionalidade não virá tão cedo de qualquer forma

merefield · Setembro 20, 2022, 6:27am

Suspeito que você teria que criar um plug-in, seja criando-o você mesmo ou contratando um freelancer Marketplace

michaeld · Setembro 20, 2022, 6:36am

Veja este plugin

O cliente (@csmu) nunca me pagou, aliás

Tris20 · Fevereiro 1, 2023, 10:37am

Olá @michaeld

Analisando rapidamente este plugin, estou certo de que as imagens são enviadas para servidores do Google para processamento? Qual foi o raciocínio para essa abordagem em vez de usar uma gema Ruby para processar localmente ou no servidor da instância do Discourse? Estou interessado neste tópico, mas o envio de imagens para fora da empresa não é uma opção.

michaeld · Fevereiro 1, 2023, 10:58am

Melhor desempenho, facilidade de manutenção, evitando dependências de versão na instalação local.

Entendo que esta nem sempre é uma abordagem aceitável. Um PR é bem-vindo, embora o usuário deva sempre ser capaz de evitar um inferno de dependências locais.

Tris20 · Fevereiro 1, 2023, 12:16pm

Interessante. Imagino que isso tenha sido focado principalmente na escrita à mão, certo? Se fosse simplesmente extrair texto de uma imagem, por exemplo, uma captura de tela de erro, então acho que uma gema local seria precisa o suficiente. Brinquei com uma biblioteca Python para algo assim há um tempo e obtive resultados razoáveis. Às vezes era lixo, mas os resultados nunca seriam lidos pela comunidade, apenas pelo mecanismo de busca. Se o usuário notasse algo bobo, ele poderia sempre modificar o texto oculto.

michaeld · Fevereiro 1, 2023, 12:43pm

Eu não quero resultados razoáveis, quero resultados excelentes.

Jagster · Fevereiro 1, 2023, 12:52pm

Não há OCR que possa oferecer excelentes resultados. Mesmo resultados razoáveis podem ser difíceis de alcançar — não importa qual biblioteca esteja em uso,

Ed_S · Fevereiro 1, 2023, 10:54pm

Lembre-se que o OCR geralmente funciona em capturas de tela, não em digitalizações ou fotos. Ainda assim, não será 100%, mas é um bom tipo de texto para tentar reconhecer.

Observo que a interface web do Mastodon oferece uma função de OCR na caixa de diálogo onde você pode inserir uma descrição de imagem por motivos de acessibilidade. Pode ser que ele seja executado no lado do servidor. Veja como fica, depois de eu clicar em “Detectar texto da imagem”:

Tris20 · Fevereiro 9, 2023, 3:27pm

Interessante. Parece que tem resultados semelhantes ao Tesseract. Gostaria de saber como a ferramenta Mastodon lida com imagens com gráficos e texto?

Um objetivo nobre Embora eu compartilhe o desejo por resultados excelentes, ficarei feliz com uma melhoria de 80%

No contexto que tenho em mente, o objetivo é extrair coisas como mensagens de erro de capturas de tela. Por exemplo, se um usuário tem um log de erros em seu terminal, a tendência é apenas tirar um print. Mesmo que o resultado não seja perfeito, se ele extrair cerca de 80% do texto corretamente, então alguém que procura pela mensagem de erro, ou outro pedaço de texto relacionado, tem uma chance muito maior de encontrar o Tópico, do que se fosse apenas a imagem não pesquisável.

Tópico		Respostas	Visualizações
Transcribing handwritten text in images plugin Marketplace	6	926	28 de Setembro de 2021
Ai plugin ocr support Feature ai	11	966	2 de Abril de 2024
Adding a picture questions feature Feature ai	3	838	12 de Janeiro de 2024
Autorecognize text in image for Alt-Text Feature	3	672	22 de Fevereiro de 2024
Introduce alt-text for images on chat Feature chat	0	369	22 de Fevereiro de 2023

Converter imagem em texto

Tópicos relacionados