컴퓨터는 거들 뿐(트라도스 upLIFT 사용법)
CAT툴
작성자
임윤
작성일
2022-10-17 20:42
조회
3280
몇 년 전 트라도스 로드쇼에 참석했을 때의 기억이 떠오릅니다. 담당자가 저희 제품은 이런 물건입니다~ 소개하고 질문을 받는 시간이었죠. 당시 저만한 딸이 있을 법한 아재 여럿이 그래서 자동번역은 어떻게 하며, 구글 번역이랑 이게 다른 게 무엇이며, 아까 보니까 아래아 한글처럼 사람이 직접 입력하던데 트라도스가 왜 필요하며 등등을 질문하셨습니다. 직원은 유효고객이 아니라고 판단했는지 표정근 하나 안 변하고 저희 책자 보시면 됩니다 하고 다음 내용으로 넘어가던 모습이 인상적이었습니다. (역시 프로는 다름)
저는 트라도스 제작사 RWS와 연관이 없...지는 않고, 트라도스 라이선스가 하나 더 팔리든가 말든가 제 인생에는 한 푼 들어오는 것 없는 자입니다. 하지만 동종상품인 컴퓨터 보조번역 도구(computer aided translation tool, CAT툴) 중 한국어 번역가에게 제일 좋은 물건임은 보증할 수 있습니다. 동의하지 않는 자 고개를 들어 워드패스트를 보라. 오늘은 그 좋은 트라도스에서 몰라서 못 쓰시는 기능 하나를 알려드리겠습니다.
개인 번역 메모리에 번역 유닛이 1천 개 이상 있는 분들, 트라도스 패키지 등으로 받은 번역 메모리에 번역 유닛이 몇십만 개씩 들어있는 분들은 이 글이 큰 도움이 될 것입니다.
저는 번역가가 되고 싶은데 기계번역 때문에 번역가가 사라지면 어떡하죠?라고 생각하시는 분께서는 Ctrl+W를 눌러 주십시오. 기계 뒤에 사람 있습니다.
다음 문장을 트라도스와 번역 메모리의 도움을 받아 번역할 겁니다. 만약 이 문장이 무슨 뜻인지 모르신다면 역시 Ctrl+W를 눌러 주십시오.
트라도스의 upLIFT 기능을 사용할 것이랍니다. 그러면 트라도스가 기존 번역 메모리를 분석하여 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군! 두 개를 연결해 놔야겠다. 인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’...라고 하길 빌어 봅시다.

저 화면으로 들어가서 [조각 얼라인먼트 상태]에서 [사용]을 선택합니다. 회색으로 선택되지 않는 경우 번역 메모리에 번역 유닛이 천 개도 안 되는 것이니 내공을 더 쌓으십시오.
저 화면으로 들어가는 방법을 모르시는 분은 이 글의 대상 독자가 아닙니다. 덧글로 질문하지 마시고 Ctrl+W를 눌러 주십시오.
다음 번역 모델 구축을 누릅니다.


이놈들아 138138개 항목 분석 중, 2400000개 항목 병합됨 이렇게 번역했어야지...... 한국어는 목적어가 앞에 오는 거 모르냐... 플레이스홀더를 제대로 처리하지 못하면 이런 번역이 된답니다. 이해는 됐으니 그러려니 하고 넘어갑니다.
그러면 번역 모델이란 무엇인가 의문이 드실 겁니다. 아까 트라도스가 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군! 두 개를 연결해 놔야겠다. 인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’라고 하길 빌어 보자고 말씀드렸죠? 여기서 [번역 모델 구축]은 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군!’에 해당합니다.
번역 모델 구축이 완료되었으면 [번역 유닛 얼라인]을 누릅니다. 이 작업은 ‘두 개를 연결해 놔야겠다.’에 해당합니다.
이 작업이 끝나면 트라도스가 ‘인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’라고 두근두근 기대하고 있는 상태입니다. 그런데 인간이 설정을 좀 더 해 줘야 합니다. 트라도스는 ‘그래도 최소 2단어나 3단어 정도는 일치할 때 조각 일치를 표시해야지’라고 생각하고 있을 겁니다. 기본값이 그러니까요. 하지만 인간은 cookie, data 등 단어 하나에 대한 조각 일치도 보고 싶습니다. 설정을 아래와 같이 바꿉니다.

[검색]에 들어가서 전체 TU와 TU 조각에 대한 매치 항목의 최소 단어 수, 매치 항목의 최소 주요 단어 수를 모두 1로 설정합니다. 전체 TU(번역 유닛)와 TU 조각에 대해서는 나중에 시간 날 때 설명드립니다.

번역하려는 세그먼트를 선택하면 트라도스가 한땀한땀 나름대로 준비해놓은 조각 일치가 나옵니다. 제 화면과 여러분의 화면이 다른 이유는 번역 메모리가 다르기 때문입니다.
만약 이 단계에서 트라도스가 꺼지거나 멈추면 엄한 트라도스 탓을 하지 말고 장비를 업글하세요.

만약 upLIFT 설정을 하지 않았다면 조각 일치는 아무것도 안 나올 수도 있습니다. 또한 번역어 일관성을 유지하기 위해 매 단어에 콘코던스 검색질을 해야 할 수도 있습니다. 화면은 data를 콘코던스 검색한 모습입니다.

다시 편집기로 돌아와서 컴퓨터의 도움을 받아 번역 작업을 진행합니다. ‘쿠’만 입력해도 상당히 괜찮은 결과가 나옵니다. 위아래 화살표로 ‘쿠키는’을 선택한 후 엔터를 눌러 입력합니다.

아까 트라도스가 일 잘 하기를 ‘빌어 보자’고 했지요. 실제로 완벽한 대응을 보여주지는 못합니다. 화면은 Cookies are가 ‘쿠키를 이용하여’에 대응된 모습입니다. 그래도 여전히 이 기능을 활용할 여지는 많습니다. 조각 일치 목록을 확인하여 콘코던스 검색을 일일히 누르지 않아도 기존 번역과의 일관성을 확인할 수 있습니다. 또한, 한 글자만 입력해도 반자동 완성이 가능하여, 일관성 높은 번역 메모리만 있다면 번역 속도를 엄청나게 높일 수 있습니다.

여기서는 트라도스가 small text files를 ‘작은 텍스트 파일이며’에 대응하였습니다. 대강 보니 체언에 붙은 조사를 별개의 단어로 인식하는 데 어려움을 겪는 듯합니다. 그래도 문맥상 해당 조사를 써도 되는 경우가 많고, 이번에도 그러니 그냥 씁시다. 위아래 화살표로 선택한 뒤 엔터로 입력합니다.

여기서는 data를 ‘데이터에’에 대응한 모습입니다. 물론 여기서 나아가 인간이 트라도스에게 얘 data는 ‘데이터에’ 말고 ‘데이터’에 대응해 주련? 하고 명령을 내릴 수도 있습니다. 이건 다음에 쌔워 봅지요.
저는 트라도스 제작사 RWS와 연관이 없...지는 않고, 트라도스 라이선스가 하나 더 팔리든가 말든가 제 인생에는 한 푼 들어오는 것 없는 자입니다. 하지만 동종상품인 컴퓨터 보조번역 도구(computer aided translation tool, CAT툴) 중 한국어 번역가에게 제일 좋은 물건임은 보증할 수 있습니다. 동의하지 않는 자 고개를 들어 워드패스트를 보라. 오늘은 그 좋은 트라도스에서 몰라서 못 쓰시는 기능 하나를 알려드리겠습니다.
개인 번역 메모리에 번역 유닛이 1천 개 이상 있는 분들, 트라도스 패키지 등으로 받은 번역 메모리에 번역 유닛이 몇십만 개씩 들어있는 분들은 이 글이 큰 도움이 될 것입니다.
저는 번역가가 되고 싶은데 기계번역 때문에 번역가가 사라지면 어떡하죠?라고 생각하시는 분께서는 Ctrl+W를 눌러 주십시오. 기계 뒤에 사람 있습니다.
다음 문장을 트라도스와 번역 메모리의 도움을 받아 번역할 겁니다. 만약 이 문장이 무슨 뜻인지 모르신다면 역시 Ctrl+W를 눌러 주십시오.
Cookies are small text files placed on your device to store data that can be recalled by a web server in the domain that placed the cookie.
트라도스의 upLIFT 기능을 사용할 것이랍니다. 그러면 트라도스가 기존 번역 메모리를 분석하여 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군! 두 개를 연결해 놔야겠다. 인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’...라고 하길 빌어 봅시다.

저 화면으로 들어가서 [조각 얼라인먼트 상태]에서 [사용]을 선택합니다. 회색으로 선택되지 않는 경우 번역 메모리에 번역 유닛이 천 개도 안 되는 것이니 내공을 더 쌓으십시오.
저 화면으로 들어가는 방법을 모르시는 분은 이 글의 대상 독자가 아닙니다. 덧글로 질문하지 마시고 Ctrl+W를 눌러 주십시오.
다음 번역 모델 구축을 누릅니다.


이놈들아 138138개 항목 분석 중, 2400000개 항목 병합됨 이렇게 번역했어야지...... 한국어는 목적어가 앞에 오는 거 모르냐... 플레이스홀더를 제대로 처리하지 못하면 이런 번역이 된답니다. 이해는 됐으니 그러려니 하고 넘어갑니다.
그러면 번역 모델이란 무엇인가 의문이 드실 겁니다. 아까 트라도스가 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군! 두 개를 연결해 놔야겠다. 인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’라고 하길 빌어 보자고 말씀드렸죠? 여기서 [번역 모델 구축]은 ‘원문과 번역문을 잘게 쪼개볼까? small text files는 작은 텍스트 파일로 번역한 적이 많군!’에 해당합니다.
번역 모델 구축이 완료되었으면 [번역 유닛 얼라인]을 누릅니다. 이 작업은 ‘두 개를 연결해 놔야겠다.’에 해당합니다.
이 작업이 끝나면 트라도스가 ‘인간이 small text files를 번역할 때 조각 일치로 보여줘야지!’라고 두근두근 기대하고 있는 상태입니다. 그런데 인간이 설정을 좀 더 해 줘야 합니다. 트라도스는 ‘그래도 최소 2단어나 3단어 정도는 일치할 때 조각 일치를 표시해야지’라고 생각하고 있을 겁니다. 기본값이 그러니까요. 하지만 인간은 cookie, data 등 단어 하나에 대한 조각 일치도 보고 싶습니다. 설정을 아래와 같이 바꿉니다.

[검색]에 들어가서 전체 TU와 TU 조각에 대한 매치 항목의 최소 단어 수, 매치 항목의 최소 주요 단어 수를 모두 1로 설정합니다. 전체 TU(번역 유닛)와 TU 조각에 대해서는 나중에 시간 날 때 설명드립니다.

번역하려는 세그먼트를 선택하면 트라도스가 한땀한땀 나름대로 준비해놓은 조각 일치가 나옵니다. 제 화면과 여러분의 화면이 다른 이유는 번역 메모리가 다르기 때문입니다.
만약 이 단계에서 트라도스가 꺼지거나 멈추면 엄한 트라도스 탓을 하지 말고 장비를 업글하세요.

만약 upLIFT 설정을 하지 않았다면 조각 일치는 아무것도 안 나올 수도 있습니다. 또한 번역어 일관성을 유지하기 위해 매 단어에 콘코던스 검색질을 해야 할 수도 있습니다. 화면은 data를 콘코던스 검색한 모습입니다.

다시 편집기로 돌아와서 컴퓨터의 도움을 받아 번역 작업을 진행합니다. ‘쿠’만 입력해도 상당히 괜찮은 결과가 나옵니다. 위아래 화살표로 ‘쿠키는’을 선택한 후 엔터를 눌러 입력합니다.

아까 트라도스가 일 잘 하기를 ‘빌어 보자’고 했지요. 실제로 완벽한 대응을 보여주지는 못합니다. 화면은 Cookies are가 ‘쿠키를 이용하여’에 대응된 모습입니다. 그래도 여전히 이 기능을 활용할 여지는 많습니다. 조각 일치 목록을 확인하여 콘코던스 검색을 일일히 누르지 않아도 기존 번역과의 일관성을 확인할 수 있습니다. 또한, 한 글자만 입력해도 반자동 완성이 가능하여, 일관성 높은 번역 메모리만 있다면 번역 속도를 엄청나게 높일 수 있습니다.

여기서는 트라도스가 small text files를 ‘작은 텍스트 파일이며’에 대응하였습니다. 대강 보니 체언에 붙은 조사를 별개의 단어로 인식하는 데 어려움을 겪는 듯합니다. 그래도 문맥상 해당 조사를 써도 되는 경우가 많고, 이번에도 그러니 그냥 씁시다. 위아래 화살표로 선택한 뒤 엔터로 입력합니다.

여기서는 data를 ‘데이터에’에 대응한 모습입니다. 물론 여기서 나아가 인간이 트라도스에게 얘 data는 ‘데이터에’ 말고 ‘데이터’에 대응해 주련? 하고 명령을 내릴 수도 있습니다. 이건 다음에 쌔워 봅지요.








전체 0
댓글을 남기려면 로그인하세요.
CAT툴
ㆍ
임윤
ㆍ
2023.04.04
ㆍ
추천
57
ㆍ
조회
1540
CAT툴
ㆍ
임윤
ㆍ
2023.08.21
ㆍ
추천
30
ㆍ
조회
513
CAT툴
ㆍ
임윤
ㆍ
2022.10.17
ㆍ
추천
48
ㆍ
조회
3280