xdotool 이거 아주 좋네요....

[attachment=0:edij17hw]아주좋아요.png[/attachment:edij17hw]

리눅스에서 매크로 구현을 놓고 얼마 전 '별님’께서 xdotool이라는 명령어를 추천해주셨는데…

이거 아주 좋네요.

터미널 명령을 통해 xwindow에 떠있는 리브레오피스를 쪼물딱 거리는…

리브레오피스와 터미널 명령어를 넘나드는 상상도 못할 자동화를 구현해주네요.

저에게 또 신세계가 열렸습니다.

리눅스를 기반으로 한 '사무 자동화’라는 한 우물만 파와서 그런지 MS기반을 뛰어넘는 업무환경이 열리고 있습니다.

  • 위 사진은… jpg로 된 파일을 임프레스 페이지에 한장씩 붙여 넣는 매크로를 돌리면서 작업을 하는 장면입니다.

그저 부러울 뿐입니다. :o

GUI로 매크로 시켜두는것도 좋은 방법인것 같습니다. 사용자가 수동으로 수정하면 프로그램이 알아서 맞춰주는 부분에 대해 사용자가 대신해야 하고, 오류가 어디서 날지도 모릅니다. 양이 만개를 넘어간다면 수동으로 파일을 수정시키는 것도 좋은 방법일것 같습니다(odg나 odp라면 xml 문법과 문서구조에 대해 알고 있다면 쉽게 zip파일로 풀어 문서를 수정할수 있습니다).

대단하네요!
책 스캔본 작업이신가요??

[quote="may223":3thpcwq6]대단하네요!
책 스캔본 작업이신가요??[/quote:3thpcwq6]

논문 준비를 위한 자료수집 입니다. 일반적으로는 교내 도서관에서 논문출력을 부탁하면 전체 프린트를 해주는데 저 논문은 옛날꺼라 DB에 없더라구요. 복사카드만으로 200페이지 논문을 복사해올 길이 없어 부득이하게 사진으로 담아오게 되었습니다.

사진으로 찍은 것이라 가장자리도 다듬어야 하고, 양면인쇄로 걸어야 하는데 그림파일 뷰어 중에는 인쇄 지원이 잘 되는 어플리케이션이 마땅치 않아 리브레오피스에 한장씩 다듬어 넣어 출력하기로 했습니다.

그런데 노틸러스와 리브레오피스를 오고 가며 사진을 한장씩 붙이는 작업이 만만치 않더라구요. 고민하던 중 xdotool이 생각이 나서 사진 붙이는 단축키를 입력해 넣고, 붙이고 난 사진은 mv로 이름을 바꾸면서 이미 작업한 파일은 중복되지 않게 했습니다.

스크립트를 단축키로 지정한 뒤 실행해보니 사진 한장이 가장자리 편집 모드로 화면 한 가운데 떡 하니 들어오네요. 가장자리만 잘라주고 위치만 잡아준 다음에 단축키를 넣으면 알아서 페이지 넘기고, 다음 사진을 불러와서 화면에다 붙여주고 가장자리 편집 모드까지 딱 해주네요. 저거 어떻게 해야 할까 몇달간 고민만 해왔는데 덕분에 쉽게 해결했어요.

[quote="별님":2r88gttb]GUI로 매크로 시켜두는것도 좋은 방법인것 같습니다. 사용자가 수동으로 수정하면 프로그램이 알아서 맞춰주는 부분에 대해 사용자가 대신해야 하고, 오류가 어디서 날지도 모릅니다. 양이 만개를 넘어간다면 수동으로 파일을 수정시키는 것도 좋은 방법일것 같습니다(odg나 odp라면 xml 문법과 문서구조에 대해 알고 있다면 쉽게 zip파일로 풀어 문서를 수정할수 있습니다).[/quote:2r88gttb]

말씀하신 '사용자 수동 수정’을 약 한 달 전부터 업무에서 사용해보고 있었습니다. 파이썬을 통해 매 주 날짜와 반복적으로 수정되는 부분들을 자동화 시켰는데 말씀하신 것 처럼 프로그램을 통한 수정에 비해 '오류’에 민감해지는 것을 경험해 봤습니다. 초반에 몇 번 버그를 잡고 난 뒤부터는 큰 무리없이 순조롭게 활용되고 있습니다.

xdotool을 통해 GUI매크로를 구현해보는 것은 이번이 처음입니다. 그런데 MS윈도우 환경보다 훨씬 맘에 드네요. 한컴오피스나 MS오피스가 주는 자체 매크로의 편리함은 없지만 cli상에 하나씩 적어 넣으니 오히려 ‘확실한’ 느낌이 드네요. 리브레 오피스에서도 자체 매크로가 지원이 되긴 합니다. 허나 xdotool이 실행되는 위치가 쉘이다 보니, 리브레 오피스뿐만 아니라 다른 터미널 명령이나 다른 소프트웨어를 오고가면서도 명령을 내릴 수 있어 훨씬 강력하게 느껴집니다.

어떤 내용일까 궁금해 하다, 밑의 댓글을 보고 알았네요.
대단 하네요.
스캐너(?)처럼 저 이미지에서 문자를 추출하는 프로그램이 있다면 정말 대박일 것 같네요.

[quote="IceCube":1lt6y92v]어떤 내용일까 궁금해 하다, 밑의 댓글을 보고 알았네요.
대단 하네요.
스캐너(?)처럼 저 이미지에서 문자를 추출하는 프로그램이 있다면 정말 대박일 것 같네요.[/quote:1lt6y92v]
알파벳은 좋은 OCR이 분명히 찾아보면 있을텐데, 어떤지 모르겠네요…
충분히 있을 것 같다는 정도의 (영양가 없고 도움도 안되는 orz) 추측 밖에는 못하겠어요…

[quote="g6123":1akc7owc]충분히 있을 것 같다는 정도의 (영양가 없고 도움도 안되는 orz) 추측 밖에는 못하겠어요…[/quote:1akc7owc]

그래서 찾아봤습니다.

https://code.google.com/p/linux-intelli ... -solution/ https://help.ubuntu.com/community/OCR

…정도에서 테스트해보고 가장 나은 걸 쓰면 될 것 같군요.

[quote="g6123":17ead4y6][quote="g6123":17ead4y6]충분히 있을 것 같다는 정도의 (영양가 없고 도움도 안되는 orz) 추측 밖에는 못하겠어요…[/quote:17ead4y6]

그래서 찾아봤습니다.

https://code.google.com/p/linux-intelli ... -solution/ https://help.ubuntu.com/community/OCR

…정도에서 테스트해보고 가장 나은 걸 쓰면 될 것 같군요.[/quote:17ead4y6]

tesseract가 한국어 인식에 가장 좋다고 합니다. [url:17ead4y6]http://t.lab.naver.com/ocr/[/url:17ead4y6]에서 테서렉트를 체험해볼수 있습니다. 화질이 좋아야 정상적으로 인식되는 것 같습니다. 한글을 인식은 하나 인식률이 매우 떨어지므로 그냥 사용하기엔 무리가 있어 보입니다.

테서렉트에 한글을 적용하려면, [code:17ead4y6]svn checkout -r 309 http://tesseract-ocr.googlecode.com/svn/trunk/ tesstemp; sudo cp testmap/testmap/kor.traineddata /usr/share/tesseract-ocr/tessdata; chmod 755 /usr/share/tesseract-ocr/tessdata/kor.traineddata; chown root:root /usr/share/tesseract-ocr/tessdata/kor.traineddata; rm -r testmap[/code:17ead4y6]을 하신뒤 [code:17ead4y6]tesseract 이미지파일명 저장파일의확장자를제외한이름 -l kor[/code:17ead4y6]의 형식으로 문자해독을 하시면 됩니다.

[quote="별님":7hnqoskh]tesseract가 한국어 인식에 가장 좋다고 합니다. [url:7hnqoskh]http://t.lab.naver.com/ocr/[/url:7hnqoskh]에서 테서렉트를 체험해볼수 있습니다. 화질이 좋아야 정상적으로 인식되는 것 같습니다. 한글을 인식은 하나 인식률이 매우 떨어지므로 그냥 사용하기엔 무리가 있어 보입니다.[/quote:7hnqoskh]
나베르 OCR이 tesseract 기반인 줄은 몰랐네요;; ㅋㅋㅋㅋ
전에 몇 번 써 봤는데, 심지어 캡쳐한 페이지도 한글은 폰트를 타는 것 같더라고요…
한글 OCR은 확실히 뭘 써도 인식률이 떨어지는 모양이에요…