텀베이스가 원활하게 돌아가는 항목 수는 어느 정도일까요?
Author
민트색
Date
2024-07-23 13:32
Views
1389
업체에서 받은 엑셀 용어집을 트라도스 텀베이스로 만드는 시도를 했는데 자꾸 에러가 떠서 들여다 보니 무려 항목이 84만여개나 되었습니다.
그래서 반을 뽀개서 40만개 단위로 돌려보는데 아무래도 실패할 것 같습니다. 이걸 만드는 데 성공하더라도 항목이 많으면 텀베이스가 제대로 작동하지 않을 것 같다는 생각이 들었습니다.
원활하게 텀베이스를 사용할 수 있는 적정 항목 수는 몇 개 정도일까요?
그래서 반을 뽀개서 40만개 단위로 돌려보는데 아무래도 실패할 것 같습니다. 이걸 만드는 데 성공하더라도 항목이 많으면 텀베이스가 제대로 작동하지 않을 것 같다는 생각이 들었습니다.
원활하게 텀베이스를 사용할 수 있는 적정 항목 수는 몇 개 정도일까요?
Total 3,064
Number | Title | Author | Date | Votes | Views |
Notice |
게시판 이용 안내
매니저
|
2019.06.16
|
Votes 12
|
Views 54950
|
매니저 | 2019.06.16 | 12 | 54950 |
3050 |
트라도스 2024 자격증 구매 관련 (2)
뚜뚜
|
2025.05.20
|
Votes 0
|
Views 103
|
뚜뚜 | 2025.05.20 | 0 | 103 |
3049 |
PO를 몰아서 발행하는 경우가 흔한가요? (4)
NY
|
2025.05.19
|
Votes 0
|
Views 119
|
NY | 2025.05.19 | 0 | 119 |
3048 |
사용하는 이름 질문 (2)
크맆
|
2025.05.13
|
Votes 0
|
Views 160
|
크맆 | 2025.05.13 | 0 | 160 |
3047 |
(오늘 오후 5시 납품..) 트라도스, 리뷰 모드, 태그 수정 오류, 세그먼트를 삽입할 수 없습니다...관련 질문 (3)
호미
|
2025.05.13
|
Votes 0
|
Views 150
|
호미 | 2025.05.13 | 0 | 150 |
3046 |
샘플 테스트 응시 관련 질문 (3)
크맆
|
2025.05.13
|
Votes 0
|
Views 145
|
크맆 | 2025.05.13 | 0 | 145 |
3045 |
Xbench 페이팔 결제 방법 (7)
민트색
|
2025.05.08
|
Votes 1
|
Views 264
|
민트색 | 2025.05.08 | 1 | 264 |
3044 |
Phrase (구 멤소스)에서 세그먼트 찾기 (5)
민트색
|
2025.05.08
|
Votes 0
|
Views 156
|
민트색 | 2025.05.08 | 0 | 156 |
3043 |
PM 메일이 피싱 의심 메일로 알람이 떴습니다ㅜㅜ (2)
translayeeseo
|
2025.05.03
|
Votes 0
|
Views 252
|
translayeeseo | 2025.05.03 | 0 | 252 |
3042 |
새 업체와 NDA까지 작성했는데 온보딩 종료 통보를 받았어요ㅜㅜ (3)
applechip05
|
2025.04.30
|
Votes 0
|
Views 294
|
applechip05 | 2025.04.30 | 0 | 294 |
현재 20분째 텀베이스 변환 중
우회법: tm으로 넣고 업리프트를 쓰세요
https://rebtion.net/learnfree/?mod=document&pageid=1&uid=10341
40만개로 뽀개서 집어넣고 있습니다. 부디 100프로까지 무사히.
아 40만개로 뽀갠 게 아니라 40만개 짜리가 되도록 파일을 둘로 뽀개서...ㅎㅎ;;;
경과: 8시간째 켜놓고 있는데 텀베이스 변환 안 됨.
(에러 메시지도 표시되지 않고 그냥 진행이 안 됨)
시도해 본 것
https://www.cerebus.de/glossaryconverter/help/Filesharinglockcountexceeded.html
얻은 오류: couldn't access registry for build version,
제작사 왈, 멀티텀 자체의 구조 오류라서 해줄 수 있는 게 없다
https://community.rws.com/product-groups/trados-portfolio/rws-appstore/f/rws-appstore/44776/glossary-converter-keeps-generating-errors
https://community.rws.com/product-groups/trados-portfolio/rws-appstore/f/rws-appstore/19717/skip-reorganise-sdltb-step-in-glossary-converter
답변에서 RWS 측이 추천하는 제3자 플러그인이 있는데, 판매자가 업무시간이 아님.
http://www.rycat.cn/products/postedit.htm
이 답변을 쓰던 와중 약 18만 항목이 변환된 파일을 딸랑 내놓음.
84만 단어 인식 안됨 > 40만 단어 안됨 > 20만 단어 안됨 > 10만 단어 되는 척 하더니 안됨 > 5만 단어 매우 힘겹게 트라도스에서 열리길래 기본번역메모리 업데이트를 했더니 대부분 들어갔습니다. 몇 개 정도는 유실되었지만...;
크흡... 중간에 응답 없음 삐꾸가 계속 나서 2만5천쌍 단위로 더 뽀개서 재시도 한 결과 TM 1개에 84만여쌍의 번역 유닛을 다 넣을 수 있었습니다...
MaxLocksPerFile 값을 아무리 늘려도 항목 18만개까지밖에 변환이 안 됩니다.
변환 가능한 항목 값을 결정하는 다른 요인이 있는지는 모르겠습니다.
현재로서는 15만개 정도씩 잘라서 변환하는 게 최선이지 않을까 싶습니다. ^^...
전에도 말씀드렸듯, 텀베이스는 전역 일치 검색을 세그먼트가 바뀔 때마다 수행해서 속도가 느린데
번역 메모리는 다음 세그먼트에 표시될 내용을 현재 세그먼트를 작업하는 중에 백그라운드에서 검색해서 속도가 상대적으로 빠르게 느껴지는 편입니다.
다만, 번역 메모리는 텀베이스처럼 트라도스 내부에서 검증을 할 수는 없고, 검증한다 하더라도 텀베이스 하나씩을 재료로 검증해야 합니다.
문제는 텀베이스 1만 개 + 세그먼트 1천개 조합만 돼도 내부 검증에 수 분이 걸립니다.
Xbench를 활용하면 조금 빠르게 진행하실 수는 있는데, 이 역시 추천하지는 않습니다.
멀티텀 쪽의 오래된 오류와 하드웨어 사양의 한계인 듯한데 현재로서는 번역 메모리로 등록해 사용하는 것이 최선인 듯합니다.
(몇년 뒤 이런 문제는 다 해결되고 이 글은 유물로 남았으면 합니다)
번역 메모리의 단어를 텀베이스처럼 활용하려면 uplift를 활성화해야 합니다.
https://rebtion.net/learnfree/?mod=document&pageid=1&uid=10341 글을 참조하세요
84만여개를 통째로 넣었을 때 멀티텀 컨버터 > 멀티텀 데스크탑을 거쳐 파일 가공이 완료된 것 처럼 보였는데 막상 들어가면 항목 수가 0이었어요.
8만개도 버벅대는 게 정상입니다. 일단 변환은 되시나요? 텀베이스 구조상 2개로 쪼갠다고 사정이 나아지지는 않습니다.
중복 항목을 제거하고, 다른 언어가 있으면 제거하고, 바람직하진 않지만 이 경우에는 설명도 제거해야 간신히 작동할 듯합니다. admin@rebtion.net 이메일로 연락주시면 도움 드리겠습니다.
엑셀 파일 자체는 단순하게 English, Korean 항목만 있습니다. 8만개도 버벅거리는군요.;;; 일단 8만개 미만으로 작업을 해보고 여의치 않으면 이메일 바로 드리겠습니다.
라고 써놓고 보니 비상연락망 까똑이 생각남. 까똑으로 연락드렸어요.