구글, 새로운 차세대 '즉석 번역' 개발
뉴시스 | 입력 2007.03.29 16:49
【마운틴뷰=로이터/뉴시스】
'구글하다'를 '인터넷 검색'의 동의어로 만들며 세계 최대 인터넷 기업으로 부상한 구글이 다국어 '즉석 번역' 프로그램을 개발, 언어의 장벽에 도전한다.
소위 '통계적 기계 번역'이라고 불리는 이 방식은 언어학자들을 동원해 문법 구조와 어휘를 컴퓨터에 입력했던 종전의 방식과 달리, 사람에 의해 번역된 번역문과 원문을 컴퓨터에 입력해 번역의 패턴을 컴퓨터가 '터득'할 수 있도록 하는 새로운 접근 방법을 사용했다.
이 방식은 말 그대로 '통계적' 방식을 취하고 있기 때문에 번역 전과 번역 후 문건이 더 많이 입력될 수록 정확도가 높아진다. 따라서 외국어로 많이 번역되지 않은 아프리카어와 같은 경우 '번역의 질'은 자연스럽게 떨질 수 밖에 없다.
미 샌프란시스코에 위치한 구글 본부에서 이 프로젝트를 진행하고 있는 프란츠 오치(35) 팀장은 "번역이 아직 완벽하지는 않지만 과거 단순 기계 번역에 비하면 현저하게 나아졌음을 확인할 수 있다"며 "아랍어-영어와 같은 경우 일상 업무를 처리하는 데 별 문제 없을 정도의 번역 수준까지 끌어올렸다"고 자신했다.
현재 그는 번역의 완성도가 높은 유엔 및 유럽연합(EU) 배포 자료들을 중심으로 2개 이상의 언어로 된 같은 내용의 문건들을 수 억 개씩 입력하는 작업을 진행 중이다.
지난해 안식년 기간 동안 이 프로젝트에 참여했던 영국 스코틀랜드 에든버러 대학의 마일스 오스본 교수는 구글의 번역 소프트웨어가 기계번역의 수준을 한 단계 향상시키면서 완성도 높은 번역을 제공하는 것은 틀림없지만 "전문 번역사의 수준을 능가할 수는 없을 것"이라며 한계를 지적했다.
그는 그러나 "구글의 소프트웨어를 통해 언어의 장벽 없이 방대한 자료를 '이해'함으로써 작업의 효율을 극대화할 수 있을 것"이라고 설명했다.
한편 에릭 슈미트 구글 회장은 올 초 열린 회의에서 즉석 번역 개발이 몰고 올 정치적 변화를 역설했다.
그는 "100개의 서로 다른 언어가 실시간 번역된다고 상상해 보라"며 "서로 간의 언어장벽을 통해 정치적 갈등을 겪고 있는 많은 국가들이 서로에 대한 이해와 공감대를 높일 수 있을 것"이라고 말했다.
정진하기자 nssnater@newsis.com