트라도스의 아버지 요헨 후멜이 말하는 번역과 AI의 미래
요헨 후멜(Jochen Hummel)
“번역업계” 약력만 요약할래도 너무 길어서 포기함. ㅋㅋㅋㅋㅋ
다행히 저에게 “나 번역가 하고 싶은데 AI 때문에 번역가 곧 날백수 되는거 아닌가요 ㅠ” 같은 질문을 하는 사람이 더는 없습니다. “맞아요 적어도 너는 날백수 됨”하고 평소에 친절하게 답변한 덕이 아닐까 싶습니다. 안타깝게도 다른 번역가 친구들에게는 아직 저런 질문이 들어오나 봅니다. 사실적시를 딱 해주든지 돈 받고 답변하지 않으면 여름밤 모기처럼 너를 괴롭힐 거라고 해줌.
그런데 고작 동네 자영업자에 불과한 내가 말해봤자 안 믿을 것 아닙니까. 하지만 업계 개척자의 말씀, 그중 아직까지 현업으로 일하시는 트라도스의 아버님께서 AI와 번역의 미래에 대해 좋은 말씀 나누어 주신다면 어떨까요?
마크 로여(트라도스 총괄매니저)와 요헨 후멜(트라도스의 아버지)
트라도스 ELEVATE 2023에서 캡처
1980년대, 본디 번역가이자 IBM 개발자셨던 요헨께서 가라사대, 어느 날 업무에 임하시던 도중 같은 문장을 두 번 번역하기 싫다는 생각이 드셨더라. 이에 번역 메모리를 창안하시었으나, 불신자들이 자신들은 같은 문장을 두 번 번역할 일이 없다 고개를 가로저었느니라. 요헨께서 가라사대, 이에 내가 분석 도구를 만들어 같은 문장이 헤아릴 수도 없이 나오는 것을 눈으로 보게 하자, 그제야 불신자들이 믿음을 가지더라. 요헨 거듭 가라사대, 본인 혼자만이 아닌 여러 IBM 직원이 함께 번역 메모리를 발명했다고 하기보다는 정립하였다 칭하는 것이 마땅하겠다 하시더라.
..........겸손 압색합니다.이후 요헨은 1984년 트라도스, 1992년 멀티텀을 개발하고, 2005년 SDL에 트라도스와 멀티텀을 매각했습니다. 멀티텀 역시 최초의 “개념” 중심 용어집 관리 애플리케이션이라는 점이 혁신적이었는데, 이는 트라도스의 아버지가 진행중인 여러 프로젝트와 연관이 크고 미래 번역가의 역할과 큰 관련이 있는만큼 후술합니다.
SDL은 본래 SDLX를 팔고 있었는데, 경쟁사인 트라도스를 구입한 셈입니다. 웹에서 고대유물의 흔적을 찾을 수 있었습니다.
SDLX로 HTML 파일 번역(2003년 추정)
http://www.softreviews.org/SDL/TRADOS7_SDLX2005_4.html

트라도스 7(개인용) 895달러, SDLX 스탠다드 695달러
20년의 물가상승률을 고려하면 지금 상당히 저렴한 가격에 팔고 있습니다. 2023년 현재 트라도스 내부 버전은 16이니 대략 2년에 한 번씩 부지런히 판갈이를 한 셈입니다.
이후 트라도스 8이 2007년 출시되었고, SDL은 자사 제품 SDLX의 이름을 4분의 1쯤 내다버리고 SDL 트라도스 스튜디오 2009(내부 버전 트라도스 9)로 재출시하였습니다. 이 시점부터는 저도 사용해본 기억이 있는데, 당시 제가 사용하던 컴퓨터 사양과 작업물 분량을 고려하면 인간 메모리의 입출력 속도와 크게 다르지 않았습니다(.......)
제가 SDL 트라도스 스튜디오의 시장점유율이 올라갔다고 느낀 시점은 SDL 트라도스 2014 출시 후입니다. 전에는 번역회사가 CAT툴 작업을 의뢰하는 일 자체가 많지 않았고 트라도스로 작업해달라는 번역회사는 더더욱 없었습니다. 2014 버전이 출시된 이후부터 트라도스 없으면 안 끼워준다는 번역회사가 급격히 늘어났습니다. 한국어로 트라도스를 검색하면 ‘번역회사가 무슨 비싼 걸 사라는데 이거 사기 아닌가요’ ‘비싼 트라도스 말고 플루언시를 써라(절대 따라하지 마세요)’ 따위밖에 나오지 않았던 시절입니다....
다시 트라도스를 막 매각한 2005년의 요헨의 시간으로 돌아올까요. 저같은 소인배에게 그만한 돈이 생기면 방바닥과 혼연일체가 되어 제일 먼저 전화기부터 없애버리고 말 겁니다만.... 세상은 요헨같은 능력자를 그냥 두지 않았던 것입니다. 2006년에는 현실을 본딴 채팅 메타버스 트위니티를 만들었고, 2010년 매각했습니다. 제 추측인데 게임 개발 자체가 목적이 아니라 다양한 언어를 실시간으로 번역하는 방법에 대한 영감을 얻으려던 게 진짜 목적이 아닐까 싶습니다.
현재 트라도스의 아버님께서 하시는 일은...... 번역 기술 개발입니다.
트라도스의 아버지 가라사대, 기술 갖춘 번역가는 번역 메모리와 용어집을 최종 검수하고 기계 번역 결과물을 평가하게 될 것이라고 합니다. 용어집 생성에서 언어와 지식 전문가의 역할은 절대 빼놓을 수 없다고 합니다.
혹시 구글 인공신경망 번역과 챗지피티가 어느날 뿅 하고 나온 것이라 믿으며, 번역가는 앞으로 굶어죽을 것이라 믿고 계신가요? 그러하시다면 Ctrl+W를 누르시어 진정 도움되는 말씀 얻어 가시길 바랍니다.
앞서 멀티텀이 최초의 “개념” 중심 용어집 관리 소프트웨어라는 말씀을 드렸습니다. 이게 뭔 소린가? 과거 원시적인 용어집은 동음이의어를 한 항목에 넣었습니다. 이중 언어일 때는 문제가 되지 않지만 3개국어부터 데이터도 꼬이고 번역가의 삶도 꼬이기 시작합니다.
마침 study라는 좋은 단어가 있으니 예시를 들어 보겠습니다.
영어 study에는 공부, 학문, 서재 등의 뜻이 있습니다. 이중 언어만 번역한다면 이렇게 정리할 수 있지요.
English | Korean |
study | 공부|학문|서재 |
공부는 勉強(べんきょう), 学習(がくしゅう)
학문은 学問(がくもん)
서재는 書斎(しょさい)에 대응합니다.
이 시점에서 저같이 부족한 실력으로 열심히 일하려는 자들은 외워서 해결하려는 뻘짓을 할 것입니다. 그러나 용어가 1개가 아니라 3만개고, 언어가 3개가 아니라 30개라면 어떨까요? 인간의 기억력을 아득히 뛰어넘습니다.
요헨께서는 이 상황을 개념 중심 용어집을 고안하여 해결하십니다. 공부, 학문, 서재를 개념 중심으로 각각 다른 항목으로 만들자는 겁니다.

Korean,공부
English,study
Japanese,勉強|学習

Korean,학문
English,study
Japanese,学問

Korean,서재
English,study
Japanese,書斎
개념 기준으로 정립한 용어는 비슷한 것끼리 분류하고 계층을 나눌 수도 있습니다. 그러면 어떤 장점이 있느냐?
1. 서재라는 점이 명백하면 공부 따위가 아닌 서재만 제안
2. 학문인 경우 유의어나 하위 용어(경제학, 법학, 수학 등)을 제안
이로써 기계번역의 품질을 높이고 번역가의 일을 줄일 수 있습니다.
그러면 번역가가 사라지는 거 아닌가요?ㅠ 어휴 지겨워 넌 사라지니까 오지 말아줘....
https://www.coreon.com/product/multilingual_taxonomy
이 페이지 아래의 Eurovoc을 클릭하고 GATS를 검색하면 요런 화면이 나옵니다.


GATS와 같이 묶인 GATT 등은 각각 상품, 서비스, 지재권협정, 무역투자조치를 뜻합니다. 모두 세계무역기구협정의 하위 협정입니다.
상위 개념으로 trade relations, trade agreement가 있고, 최상위 개념은 law입니다.
관련 개념으로는 trade policy, most favoured nation, developing countries, protective clause 등이 있습니다. most favoured nation은 특정 국가만 가장 좋은 대우를 해주는 것, 즉 최혜국대우입니다. protective clause는 예외조항으로 회원국이 자국 산업 보호를 위해 발동 가능한 조치를 뜻합니다.
이 분류작업을 전부 기계가 한 것일까요?
요헨 가라사대, 분류작업은 인간의 가치판단이 많이 들어가는 영역입니다. ‘최혜국대우’를 ‘불공정’에 넣을 수도, ‘권리’에 넣을 수도 있습니다. 멀리 갈 것도 없어요. 강화도조약의 후속조약인 1883년 조일통상장정에 최혜국대우 조항이 있습니다. 일본 정부에는 권리고 조선 정부에는 불공정인 겁니다.
이런 시나리오도 생각해 볼 수 있습니다. 한국정부 주도로 법률용어집을 제작하는데, 기계만을 써서 분류작업을 합니다. 그런데 기계가 조일통상장정 42관(일본국 최혜국대우)을 권리에 집어넣었다?(....) 실제 웹상에 일영대역이 훨씬 더 많고 일본어 사용자가 1억 2천만, 한국어 사용자 7천만(그중 2천만은 인터넷 접속 불가)이라 충분히 일어날 수 있는 일입니다. 게다가 공공누리집의 영한대역은 .hwp(.....)로 제공되는 것이 많아 크롤링이 어려울 수도 있습니다.
기계가 이래저래서 결과가 이랬다고 변명하면 먹힐까요? 나라 녹 그만 축내라며 욕을 뒤지게 얻어먹고 법무부장관 사퇴 엔딩만이 있을 것입니다.
그래서 요헨은 기계는 도울 뿐, 다 사람이 한땀한땀 손으로 확인해야 한다고 주장하며 앞으로 언어 전문가 및 지식 전문가의 역할이 더욱 기대된다고 합니다. 번밀레 같은 저질스런 단어밖에 생각 안 나니 저는 망했습니다.
트라도스의 아버지가 정리한 랭옵스(LangOps) 15원칙 중 일부를 인용하며 마칩니다.
인공지능 먼저 써라(Try AI first)
인간이 직접 눈으로 확인해라(Respect the human-in-the-loop)
있는 데이터랑 기술 써라(Leverage available data and tech*)
* 트라도스 총괄매니저와 트라도스의 아버지가 ELEVATE 세션에서 which our industry continuously fails to do라고 부연하는 부분이 인상깊어 집구석에서 박수를 치고 말았습니다.
내 번역: 있는 트라도스 안 쓰고 말이야 어차피 우리 못 이길 텐데 자꾸 저질스러운 거 개발해갖고 자원을 낭비하고 앉았어(제 개인적 해석이며 실제 발화자의 의도와 다를 수 있습니다).
출처
Trados ELEVATE 2023
https://twitter.com/JochenHummel
https://www.linkedin.com/in/ceojochenhummel
https://www.semiox.com/
https://blog.coreon.com/
https://www.crunchbase.com/person/jochen-hummel
http://www.softreviews.org/Localize2/sdlx/sdlx.html
http://www.softreviews.org/SDL/TRADOS7_SDLX2005_4.html
https://langops.org/














임윤 대장님은 진짜 갓이다.... (어휘력 부족해서 죄송합니다) 검색능력 갖고 싶어요
여러모로 와
"어휴 지겨워 넌 사라지니까 오지 말아줘"에서 빵 터졌습니다!!! 거시적인 안목으로 업계 동향을 좇을 여력이 없는데 이렇게 무료강의로 풀어 주시니 감사할 따름입니다..ㅜㅜ