블로그 이미지
냉면. 초밥. 맛있는 비빔국수.
遊食

Notice

Recent Post

Recent Comment

Recent Trackback

Archive

calendar

1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
  • total
  • today
  • yesterday
2009. 12. 17. 21:09 카테고리 없음
신영복 '강의' 4장 논어, 160페이지 부근 「공존과 평화」부분에서 생각나는 것을 정리함

1.
소쉬르의 언어학에서 언어의 개별 개념은 각각의 차이를 전제로 의미지어진다고 할 수 있다. 이 때 동양의 대비 기법이야말로 이 차이로부터 개념지어지는 한계성을 극복시킬 수 있다고 말한다. 언어 자체의 한계성을 언어의 특성 수사법이 뛰어넘는다고 말하는 것 자체가 어폐가 있긴 하지만 생각해보아야 할 것은 글의 전체 맥락에서 주요하게 말하는 것과 반대/대치되는 개념의 표현들이 이러한 맥락의 것들일 것이고 이 대비 기법의 표현들을 구분지어 인식하는 메카니즘을 알고리즘화 하여 이해할 수 있는지이다.
카테고리 분류든 클러스터링이든 검색분야든 여느 전산언어학에서 전통적인 복잡한 구문분석 메카니즘을 거치지 않고서 이러한 대비문구의 특징들을 잡아낼 수 있을까. 아니 그런 방법이 존재하기는 할까 궁금하다. 전산언어학이 허투로 발전해온 것은 아닐테니 말이다.

2.
다시 소쉬르의 언어학 이야기로 돌아가보면, 언어가 의미를 갖게되는 본질은 (단어, 구, 문장 어떤 단위에서든간에) 언어의 개체가 다른 개체와 비교되며 특별한 의미를 갖게 된다 (는 것으로 이해하고 있다.)
이것을 기반으로 하여 현재 분류 검색 등의 통계기반 언어처리 메카니즘이 존재한다고 버는 것이 정답일 것이라고 생각하고 있다. 단어 하나하나를 개별의 자질 (feature) 로 두고, 다른 문서나 글과의 차이점을 잡아내는 방법을 기본으로 하고 있기 때문이다.
올해 주로 생각해왔던 의미의 기본 단위 확장에 대한 상념들을 되짚어보면, 단어가 의미의 기본 단위라고 볼 수 있긴 하지만 특정한 의미를 표현하는 기본 단위를 개별 단어 이상의 구 phrase, 문장 sentence, 나아가 문단이나 문서에 이르기 까지 확장할 수 있게 되지 않을까 하는 것이었다. 특히 그 중에서 단어 word 에서 구 phrase 로의 확장을 염두에 둔 것은 가장 작은 확장 단계이기도 하고, 사람들이 주로 사용하는 네이버 쿼리의 모양새가 주로 명사구, 동사구 의 형태로 이루어져있기 때문이기도 하다. 물론 검색 쿼리의 형태가 이런 모양이 된 것은 검색 서비스 자체의 특이점에서 비롯되었다고 보는 것도 가능하겠다. 여튼 단어에서 구 로의 의미단위 확장은 전산언어학에서 오래도록 시도되어왔던 분야이기도 하고 올해 개인적으로 나름 의미있는 발전방향이라고 생각하며 고민해왔던 주제였다.
지금 고민하게 되는 것은, 보통 외국어를 익힐 때 가장 효과적인 학습을 보장하는 방법이라고 알려져 있는 '문장 외우기' 를 생각해볼 때 의미의 기본 단위가 문장 정도까지는 확장 되어야 하고, 그렇다면 앨런이 이야기했던 형태소 분석 > 구문 분석 > 담화 분석 의 구조가 옳다는 것에까지 생각이 미치게 된다. 하지만 이 분석 구조는 하위 구조의 분석 오류를 안고 올라갈 수 밖에 없어서 실제 응용 분야에서 사용하기는 그닥 용이하지 않다는 맹점을 안고 있다. 현재 실제 응용 분야에서 사용하는 방법들은 어찌 보면 전통적인 관점에서는 적절한 휴리스틱의 집합체 정도로 치부되어버리지 않을까. 아니면 가야만 하는 길을 제대로 밟고 가고 있는 걸까. 이러나 저러나 쉽지 않은 길인 것은 분명하다.
Sent from my BlackBerry� smartphone

Posted via email from logieeyore's posterous

posted by 遊食