Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Serwis OCR
Forum PHP.pl > Inne > Oceny
lukaskolista
Witam, chciałbym zaprezentować moją stronę, na której można skorzystaćz OCR (Optical Character Recognition). Nie ma żadnej filozofii - jedynie strona główna, na której znajduje się guzik do wczytywania plików (pliki wysyłane są AJAXem).

http://checkwords.pl
nospor
Twoja strona sypie błędem
"NIe podałeś adresu strony w linii 25 w pliku forum.php.pl"
lukaskolista
Jakiego adresu strony nie podalem? Jakim pliku forum.php.pl?
nospor
facepalmxd.gif
Licze, ze sobie tylko zartujesz...
lukaskolista
Jej, nie wiem jak moglem nie podac, chyba wina poniedzialku wink.gif
nospor
To ze zapomniales podac, bywa czasami. Ale ze po moim poscie udawales wielkie zdziwienie o co chodzi..... Stary, ta plama na honorze nigdy ci nie zejdzie tongue.gif
lukaskolista
To po splamieniu mojego honoru mozemy przejsc do oceny serwisu biggrin.gif
phpion
PDF odczytało bardzo fajnie, ale nie mogę odczytać obrazka (screen samej zawartości z notatnika więc białe tło i czarne litery). Występuje nieoczekiwany błąd.

PS: Kohana?
lukaskolista
Kohana kohana smile.gif aplikacja zawiera az 2 akcje kontrolera welcome smile.gif Nawet bez FW daloby rade to zrobic.
phpion
http://checkwords.pl/welcome/recognize_text - to mógłbyś jako owarunkować. Z ciekawości: na jakiej zasadzie to działa? Odpalany jest jakiś zewnętrzny soft?
lukaskolista
Jak i po co?
phpion
smile.gif nie rób proszę ze mnie idioty, przecież jeszcze przed chwilą rzucało błędem Kohany.
lukaskolista
Aaa chodzi o tablice $_FILES, poprawilem to chwile przed wejsciem na ten link zeby zobaczyc co jest nie tak.

Edit:
przy okazji wyszla kohanowe niedorobienie: w funkcji File::mime_by_ext($ext) nalezy podawac rozszerzenie tylko z malych liter, w przypadku duzych liter nie zwraca mimetype, tylko null.
phpion
W jednym z poprzednich postów zapytałem na jakiej zasadzie działa rozpoznawanie tekstu - uchylisz rąbka tajemnicy?

PS: Co do Kohany to nie kop konającego wink.gif
lukaskolista
Dziala to na zasadzie ogolnodostepnych w sieci algorytmow, od siebie nic nie dodalem, moze lekko zmienilem parametry bo IMO wtedy dziala lepiej. Mialem tez kiedys rozpoznawanie twarzy i porownywanie ich z baza danych mordek, zeby znajdowac delikwenta, ale przy okazji awarii dysku twardego poszlo wpizdu, nie bylo to warte tyle, ile chcieli za odzyskanie danych.

Co do algorytmu:
Najpierw trzeba zrobic matryce, na ktorej beda tylko kolory czarny i bialy (czarny - tekst, bialy - tlo). Pozniej trzeba grafike podzielic na linie na zasadzie procentowego dopasowania do wzorca, kazda linie dzieli sie w pionie na kolumny tez na zasadzie bialych przestrzeni i otrzymuje sie literki, ktore trzeba dopasowac wedlug wzorca - tutaj najgorsza jest zastosowana czcionka.
#luq
Czytasz jakieś konkretne fonty? Tekst nie może być przekręcony?
Bo moich dwóch obrazków nie zczytało.
lukaskolista
Fonty zrzucone do png jakims tam konwerterem.
ano
No nie wierze, że robiłeś "własnego ocra". Ale chyba nie w php?...
Czemu po prostu nie użyć dobrego, sprawdzonego i darmowego softu, np https://code.google.com/p/tesseract-ocr/
?

I przydałoby się jakieś kolejkowanie, jak trochę "ludzi" na raz by zaczelo ocr'ować to zaraz Ci zabije serwer.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.