Cat, grep에서 utf-8로 인코딩 된 문서 사용하기

os: ubuntu8.04
locale 확인
LANG=ko_KR.utf8
LC_CTYPE="ko_KR.utf8"
LC_NUMERIC="ko_KR.utf8"
LC_TIME="ko_KR.utf8"
LC_COLLATE="ko_KR.utf8"
LC_MONETARY="ko_KR.utf8"
LC_MESSAGES="ko_KR.utf8"
LC_PAPER="ko_KR.utf8"
LC_NAME="ko_KR.utf8"
LC_ADDRESS="ko_KR.utf8"
LC_TELEPHONE="ko_KR.utf8"
LC_MEASUREMENT="ko_KR.utf8"
LC_IDENTIFICATION="ko_KR.utf8"
LC_ALL=ko_KR.utf8

utf-8로 인코딩된 한글 txt파일을 이용하려 합니다. 옛한글을 포함한 문서인데 이 문서의 문자열을 grep을 통해 검색하는 게 목적입니다.

그런데 vi, gedit를 이용해 해당 파일을 열면 옛한글까지 정상적으로 볼 수 있는데, cat, head, tail을 이용하면 글자가 깨져 화면에 출력됩니다. (파일명은 한글이 잘 표현됩니다)

<����60> ���� �������������� ʣ���������������� ����?����??�� ����ӹ����?�� ���������������� ��ʦ˭������������۰��ե���� ?������ ӣ۰������ �������� ������������ �������� ������ܻ������������ ���������� �����
<����61> �� ίݤ���� �������� ����ʣ������ ��߻���� ުӣީװ��ͦ���� ������������ ������ӹ��ؿ���� ͤ����
�������������������� ��̩���������� ٣���������� ��������ۧͯ�� ��������?���� ߲п���� ��Ѩ���� ذ�
<����62> �� �������������������� ������ ������ ͺ�������������� ����ʦ�������� ��������ʦ�������� �������� ʦ�������� ��������������ܩ եʰ��������к�� ������������ ����������ӹ ��������? ٰͮϷ�� ��ʦ�������
이런 식으로 출력이 됩니다. 터미널의 인코딩은 UTF-8로 설정되어 있습니다.
그리고 vi이나 geditor를 열었을 때도 ㄹ·ㄹ('를’의 양모음 변이형)이 정확히 표현되지 못하고 네모표로 나오는군요.
오픈오피스(OOo2.4.1)로 열었을 때는 인코딩 선택창이 뜨는데 이때 UTF-8로 선택하여 열었으매도 글자가 깨집니다.

그리고 grep을 이용하여 해당 파일의 문자열을 검색하면 전혀 결과값이 나오지 않습니다.

이 문제를 해결할 수 있을까요?

도움 부탁드립니다.

사용하려는 문서 샘플입니다.
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
[head] 世宗御製訓民正音 [/head]

<훈언1a> 世솅宗御製졩訓훈民민正졍音 [note] 製 글 지 씨니 御製 님금 지샨 그리라 訓은 칠 씨오 民 百姓이오 音은 소리니 訓民正音은 百姓 치시논 正 소리라 [/note]

國귁之징語어音이 [note] 國 나라히라 之 입겨지라 語는 말미라 [/note][list:1gb0hv4w][list:1gb0hv4w][/list:u:1gb0hv4w][/list:u:1gb0hv4w]

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

한글 정규식 사용과 관련하여 2004년도에 라이브러리가 개발되었습니다. KLDP사이트에서 확인했는데 이 라이브러리는 프로그램 개발 시에만 사용할 수 있는 것인가요? 사용 예를 보니, #include < >로 되었더군요. 이 라이브러리를 이용하여 grep에서 한글 패턴을 검색할 수 있는 것인가요?

혹시 locale의 문제가 아니라 폰트의 문제가 아닐까 하는 생각이 듭니다… 다른 분들은 어떻게 생각하시는지??

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

응용프로그램 폰트를 은바탕으로 바꾸었지만 효혐을 보지 못했습니다.

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

vi, gedit에서 "ㄹ·ㄹ"이 네모표로 나오던 것은 "네이버사전체" 글꼴을 깔고 시스템>모양새>글꼴에서 응용프로그램 글꼴을 이것으로 변경하여 개선할 수 있었습니다.

지금 제 브라우저에서도 몇몇 글자는 깨져서 보이네요.

말씀하신 것처럼, 옛한글이라서 글꼴에 안들어 있어서 일지도 모르겠네요.

아마 맞을 겁니다. 비슷한 문제로 윈도우즈 피진에서 다국어 채팅을 할때 리눅스들처럼 해당 언어의 다른 폰트로 치환되질 않아서 폰트를 제대로 안 지정해 주면 다 깨지더군요.