Localizando texto dentro de uma imagem

votos
25

Atualmente, estou trabalhando em um projeto e meu objetivo é localizar texto em uma imagem. OCR'ing o texto não é minha intenção como de ainda. Quero obter basicamente os limites de texto dentro de uma imagem. Eu estou usando o componente de imagem AForge.Net para manipulação. Qualquer ajuda em algum sentido ou outro?

Atualize 2/5/09: Eu já fui junto outra rota no meu projeto. No entanto ENTENDI tentar obter texto usando MODI (Microsoft Office Document Imaging). Ele permite que você OCR uma imagem e puxe texto dele com alguma facilidade.

Publicado 05/08/2008 em 04:04
fonte usuário
Em outras línguas...                            


4 respostas

votos
12

Esta é uma área ativa de pesquisa. Há literalmente grande quantidade de artigos acadêmicos sobre o assunto. Vai ser difícil dar-lhe assistência especialmente w / o mais deatails. Você está procurando tipos específicos de texto? Fontes? Apenas inglês? Você está familiarizado com a literatura acadêmica?

"A detecção de texto" é um problema padrão em qualquer sistema de OCR (reconhecimento óptico de caracteres) e, consequentemente, há lotes de pedaços de código nas interwebs que lidar com ele.

Eu poderia começar a lista pilhas de links de google, mas eu sugiro que você acabou de fazer uma busca por "detecção de texto" e começar a ler :). Há um amplo código de exemplo disponível também.

Respondeu 05/08/2008 em 04:24
fonte usuário

votos
3

reconhecer o texto dentro de uma imagem é realmente um tema quente para os pesquisadores nesse campo, mas só começou a crescer fora de controle quando captcha do tornou-se a "norma" em termos de defesa contra spam bots. Por que usar o captcha do como proteção? bem porque é / era muito difícil de localizar (e ler) de texto dentro de uma imagem!

A razão pela qual eu menciono captcha do é porque o mais avanço * é feita dentro dessa pequena área, e eu acho que a solução poderia ser melhor encontradas lá. especialmente porque captcha do são realmente sobre como localizar texto (ou algo que se assemelha texto) dentro de uma imagem desordenado e depois tentar ler as letras corretamente.

por isso, se você pode encontrar-se uma boa ferramenta de captcha open source quebrar você provavelmente tem tudo que você precisa para continuar sua busca ...
Você provavelmente poderia até mesmo jogar fora o código mais dificil que lida com o próprio reconhecimento de caracteres, porque esses OCR são usados para ler texto distorcida, algo que você não tem que fazer.

*: Avanço em termos de visibilidade, utilizáveis e prático informações para um "não-pesquisador"

Respondeu 05/08/2008 em 07:00
fonte usuário

votos
0

Largura do traçado transformar pode fazer isso por você. Isso é pelo menos o que MS desenvolvido para seu sistema operacional do telefone móvel. Uma discussão sobre a implementação é aqui no https://stackoverflow.com/

Respondeu 19/04/2013 em 15:54
fonte usuário

votos
0

Se você está bem com o uso de uma API online para esta, a API em http://www.wisetrend.com/wisetrend_ocr_cloud.shtml pode fazer a detecção de texto, além de apenas OCR.

Respondeu 23/06/2010 em 06:49
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more