lukaskolista
14.04.2014, 14:19:21
Witam, chciałbym zaprezentować moją stronę, na której można skorzystaćz OCR (Optical Character Recognition). Nie ma żadnej filozofii - jedynie strona główna, na której znajduje się guzik do wczytywania plików (pliki wysyłane są AJAXem).
http://checkwords.pl
nospor
14.04.2014, 14:21:15
Twoja strona sypie błędem
"NIe podałeś adresu strony w linii 25 w pliku forum.php.pl"
lukaskolista
14.04.2014, 14:23:17
Jakiego adresu strony nie podalem? Jakim pliku forum.php.pl?
nospor
14.04.2014, 14:24:07

Licze, ze sobie tylko zartujesz...
lukaskolista
14.04.2014, 14:26:41
Jej, nie wiem jak moglem nie podac, chyba wina poniedzialku
nospor
14.04.2014, 14:27:47
To ze zapomniales podac, bywa czasami. Ale ze po moim poscie udawales wielkie zdziwienie o co chodzi..... Stary, ta plama na honorze nigdy ci nie zejdzie
lukaskolista
14.04.2014, 14:28:47
To po splamieniu mojego honoru mozemy przejsc do oceny serwisu
phpion
14.04.2014, 14:31:25
PDF odczytało bardzo fajnie, ale nie mogę odczytać obrazka (screen samej zawartości z notatnika więc białe tło i czarne litery). Występuje nieoczekiwany błąd.
PS: Kohana?
lukaskolista
14.04.2014, 14:32:22
Kohana kohana

aplikacja zawiera az 2 akcje kontrolera welcome

Nawet bez FW daloby rade to zrobic.
phpion
14.04.2014, 14:34:17
http://checkwords.pl/welcome/recognize_text - to mógłbyś jako owarunkować. Z ciekawości: na jakiej zasadzie to działa? Odpalany jest jakiś zewnętrzny soft?
lukaskolista
14.04.2014, 14:35:07
Jak i po co?
phpion
14.04.2014, 14:38:27

nie rób proszę ze mnie idioty, przecież jeszcze przed chwilą rzucało błędem Kohany.
lukaskolista
14.04.2014, 14:41:16
Aaa chodzi o tablice $_FILES, poprawilem to chwile przed wejsciem na ten link zeby zobaczyc co jest nie tak.
Edit:
przy okazji wyszla kohanowe niedorobienie: w funkcji File::mime_by_ext($ext) nalezy podawac rozszerzenie tylko z malych liter, w przypadku duzych liter nie zwraca mimetype, tylko null.
phpion
14.04.2014, 14:48:22
W jednym z poprzednich postów zapytałem na jakiej zasadzie działa rozpoznawanie tekstu - uchylisz rąbka tajemnicy?
PS: Co do Kohany to nie kop konającego
lukaskolista
14.04.2014, 14:52:43
Dziala to na zasadzie ogolnodostepnych w sieci algorytmow, od siebie nic nie dodalem, moze lekko zmienilem parametry bo IMO wtedy dziala lepiej. Mialem tez kiedys rozpoznawanie twarzy i porownywanie ich z baza danych mordek, zeby znajdowac delikwenta, ale przy okazji awarii dysku twardego poszlo wpizdu, nie bylo to warte tyle, ile chcieli za odzyskanie danych.
Co do algorytmu:
Najpierw trzeba zrobic matryce, na ktorej beda tylko kolory czarny i bialy (czarny - tekst, bialy - tlo). Pozniej trzeba grafike podzielic na linie na zasadzie procentowego dopasowania do wzorca, kazda linie dzieli sie w pionie na kolumny tez na zasadzie bialych przestrzeni i otrzymuje sie literki, ktore trzeba dopasowac wedlug wzorca - tutaj najgorsza jest zastosowana czcionka.
#luq
14.04.2014, 18:07:35
Czytasz jakieś konkretne fonty? Tekst nie może być przekręcony?
Bo moich dwóch obrazków nie zczytało.
lukaskolista
15.04.2014, 07:44:53
Fonty zrzucone do png jakims tam konwerterem.
No nie wierze, że robiłeś "własnego ocra". Ale chyba nie w php?...
Czemu po prostu nie użyć dobrego, sprawdzonego i darmowego softu, np
https://code.google.com/p/tesseract-ocr/?
I przydałoby się jakieś kolejkowanie, jak trochę "ludzi" na raz by zaczelo ocr'ować to zaraz Ci zabije serwer.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę
kliknij tutaj.