Vyhledání textu v obraze

hlasů
25

Já jsem v současné době pracuje na projektu, a mým cílem je najít textu v obraze. OCR'ing text není mým záměrem, jak přesto. Chci, aby v podstatě získat hranice textu v obraze. Já používám AForge.Net zobrazovací komponentu pro manipulaci. Jakákoli pomoc v nějakém smyslu nebo jiný?

Aktualizujte 05/02/09: Já jsem od té doby šel jinou cestou v mém projektu. Nicméně jsem se pokusit získat text pomocí MODI (Microsoft Office Document Imaging). To vám umožní OCR obraz a vytáhnout text z něj nějakou lehkostí.

Položena 05/08/2008 v 04:04
zdroj uživatelem
V jiných jazycích...                            


4 odpovědí

hlasů
12

Jedná se o aktivní oblast výzkumu. Existují doslova želez akademických prací na toto téma. Je to bude těžké, aby vám pomoci zejména w / o více deatails. Hledáte konkrétní typy textu? Fonty? Pouze anglicky? Znáte odborné literatury?

„Detekce Text“ je standardní problém v jakémkoliv (optické rozpoznávání znaků) OCR systému a v důsledku toho existuje spousta kousky kódu na interwebs, které se zabývají s ním.

Mohl bych začít výpis hromady odkazů z google, ale já doporučuji vám právě to hledání „odhalení textu“ a začít číst :). K dispozici je dostatek příklad kódu stejně.

Odpovězeno 05/08/2008 v 04:24
zdroj uživatelem

hlasů
3

rozpoznávání textu v obraze je skutečně horké téma pro výzkumné pracovníky v této oblasti, ale teprve začíná růst vymkne kontrole, když captcha se stala „normou“, pokud jde o obranu proti spamu. Proč používat captcha jakožto ochranu? dobře, protože to je / bylo velmi obtížné najít (a číst) text uvnitř obrazu!

Důvod, proč jsem se zmínil, captcha to je proto, že většina pokrok * se vyrábí v tomto malém prostoru, a myslím, že vaše řešení by mohlo být nejlépe tam našli. zejména proto, že captcha je skutečně o umístění textu (nebo něco, co se podobá textu) uvnitř přeplněné obrázek a pak se snaží správně číst dopisy.

takže pokud si sami můžete najít dobrý open source captcha lámání nástroj pravděpodobně máte vše, co potřebujete pokračovat v pátrání ...
Dalo by se pravděpodobně ještě vyhodit nejvíce obtížný kód, který zpracovává rozpoznávání znaků sám, protože tyto OCR se používá ke čtení zkreslený text, něco, co nemají dělat.

*: Pokrok v oblasti viditelného, užitková a praktických informací pro „non-výzkumný pracovník“

Odpovězeno 05/08/2008 v 07:00
zdroj uživatelem

hlasů
0

Šířka mrtvice transformace může dělat, že pro vás. To je alespoň to, co MS vyvinuty pro jejich mobilní telefon OS. Diskuse o implementaci je zde na https://stackoverflow.com/

Odpovězeno 19/04/2013 v 15:54
zdroj uživatelem

hlasů
0

Pokud jste v pořádku s pomocí online rozhraní API pro to, API v http://www.wisetrend.com/wisetrend_ocr_cloud.shtml může dělat detekci textu kromě právě OCR.

Odpovězeno 23/06/2010 v 06:49
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more