mysql 샘플 테이블 + 쿼리 연습 문제

http://java-school.net/jdbc/SQL-SELECT-Statement CREATE TABLE DEPT (     DEPTNO DECIMAL ( 2 ),     DNAME VARCHAR ( 14 ),     LOC VARCHAR ( 13 ),     CONSTRAINT PK_DEPT PRIMARY KEY ( DEPTNO ) ); CREATE TABLE EMP (     EMPNO DECIMAL ( 4 ),     ENAME VARCHAR ( 10 ),     JOB VARCHAR ( 9 ),     MGR DECIMAL ( 4 ),     HIREDATE DATE ,     SAL DECIMAL ( 7 , 2 ),     COMM DECIMAL ( 7 , 2 ),     DEPTNO DECIMAL ( 2 ),     CONSTRAINT PK_EMP PRIMARY KEY ( EMPNO ),     CONSTRAINT FK_DEPTNO FOREIGN KEY ( DEPTNO ) REFERENCES DEPT ( DEPTNO ) ); CREATE TABLE SALGRADE (     GRADE TINYINT ,     LOSAL SMALLINT ,     HISAL SMALLINT ); INSE...

tesseract-ocr 광학문자인식 Java



Tesseract는 1984년부터 약 10년간 Hewlett and Packard(HP)에서 개발한 오픈 소스 OCR 엔진이다.
Tesseract의 텍스트 추출 결과는 임시 텍스트 파일로 저장되고, OCR 서버 프로그램은 이 파일 을 파싱하여 클라이언트에 텍스트 형태 로 응답한다.
Tesseract의 작동 과정
-첫째, 이미지를 OCR 엔진의 입력으로 입력하고 난 뒤, 임계값을 이용하여 입 력 이미지를 이진화한다.
-둘째, 이진화한 이미지 의 연결된 구성 요소를 분석하여 각 구성 요소 의 외곽선을 추출하고, 이를 이진 데이터의 집합 인 블랍(blob) 형태로 저장한다.
-셋째, 텍스트 라 인(text line)을 분석하여 블랍을 체계화 한 뒤, 문자의 자간에 따라 단어 단위로 나눈다. 마지막 으로, 단어 단위로 나뉜 블랍을 단어 단위와 페 이지 단위로 인식한다.



0. Tesseract-OCR 설치
아래경로에서 다운받음.
http://ko.osdn.net/projects/sfnet_tesseract-ocr-alt/downloads/tesseract-ocr-setup-3.02.02.exe/

1. cmd에서 불러온 이미지의 문자를 .txt 문서로 저장후 콘솔창에 출력.
tesseract-orc install (cmd)
https://www.youtube.com/watch?v=Mjg4yyuqr5E

2. JSP에서 이미지 업로드하고 이미지의 문자를 JSP페이지에 프린트
tesseract-ocr (Java)
https://www.youtube.com/watch?v=gZyk2JtCSG0

https://drive.google.com/file/d/0B-PizWTHf9T_S2FkNDdZc2Y2elk/view
-> 에서 동영상의 프로젝트를 다운받아서 import 해줌
-> org.apache.jasper.JasperException: Unable to compile class for JSP: 
-> Build Path에서 Libraries 탭에서 'Add Library'
-> JRE system library + Server Runtime
-> 어느정도 x표시가 사라짐
-> Build Path에서 Order and Export 탭에서 'JRE System Library [jre7]' Remove
-> index.jsp 실행됨!
-> java.io.FileNotFoundException: c:\Tesseract-OCR\readImg.PNG.txt (지정된 경로를 찾을 수 없습니다)
-> 짜증난다
-> 원인 : 첫번째 동영상과 두번째 동영상의 Tesseract-OCR 폴더의 경로가 다르다.
-> 해결 : 폴더를 C: 로 옮겼다.
-> 된다!



index.jsp




read.jsp (결과) ... 글씨가 작으면 잘 못읽는다