텀베이스가 원활하게 돌아가는 항목 수는 어느 정도일까요?

Author
민트색
Date
2024-07-23 13:32
Views
1389
업체에서 받은 엑셀 용어집을 트라도스 텀베이스로 만드는 시도를 했는데 자꾸 에러가 떠서 들여다 보니 무려 항목이 84만여개나 되었습니다.

그래서 반을 뽀개서 40만개 단위로 돌려보는데 아무래도 실패할 것 같습니다. 이걸 만드는 데 성공하더라도 항목이 많으면 텀베이스가 제대로 작동하지 않을 것 같다는 생각이 들었습니다.

원활하게 텀베이스를 사용할 수 있는 적정 항목 수는 몇 개 정도일까요?
Total Reply 12

  • 2024-07-23 14:18

    현재 20분째 텀베이스 변환 중
    우회법: tm으로 넣고 업리프트를 쓰세요
    https://rebtion.net/learnfree/?mod=document&pageid=1&uid=10341


    • 2024-07-23 14:40

      40만개로 뽀개서 집어넣고 있습니다. 부디 100프로까지 무사히.

      1.jpg


      • 2024-07-23 14:41

        아 40만개로 뽀갠 게 아니라 40만개 짜리가 되도록 파일을 둘로 뽀개서...ㅎㅎ;;;


  • 2024-07-23 21:41

    경과: 8시간째 켜놓고 있는데 텀베이스 변환 안 됨.
    (에러 메시지도 표시되지 않고 그냥 진행이 안 됨)

    시도해 본 것
    https://www.cerebus.de/glossaryconverter/help/Filesharinglockcountexceeded.html
    얻은 오류: couldn't access registry for build version,

    제작사 왈, 멀티텀 자체의 구조 오류라서 해줄 수 있는 게 없다
    https://community.rws.com/product-groups/trados-portfolio/rws-appstore/f/rws-appstore/44776/glossary-converter-keeps-generating-errors
    https://community.rws.com/product-groups/trados-portfolio/rws-appstore/f/rws-appstore/19717/skip-reorganise-sdltb-step-in-glossary-converter

    답변에서 RWS 측이 추천하는 제3자 플러그인이 있는데, 판매자가 업무시간이 아님.
    http://www.rycat.cn/products/postedit.htm

    이 답변을 쓰던 와중 약 18만 항목이 변환된 파일을 딸랑 내놓음.


    • 2024-07-23 22:07

      84만 단어 인식 안됨 > 40만 단어 안됨 > 20만 단어 안됨 > 10만 단어 되는 척 하더니 안됨 > 5만 단어 매우 힘겹게 트라도스에서 열리길래 기본번역메모리 업데이트를 했더니 대부분 들어갔습니다. 몇 개 정도는 유실되었지만...;


      • 2024-07-24 01:01

        크흡... 중간에 응답 없음 삐꾸가 계속 나서 2만5천쌍 단위로 더 뽀개서 재시도 한 결과 TM 1개에 84만여쌍의 번역 유닛을 다 넣을 수 있었습니다...


  • 2024-07-27 07:21

    MaxLocksPerFile 값을 아무리 늘려도 항목 18만개까지밖에 변환이 안 됩니다.
    변환 가능한 항목 값을 결정하는 다른 요인이 있는지는 모르겠습니다.
    현재로서는 15만개 정도씩 잘라서 변환하는 게 최선이지 않을까 싶습니다. ^^...
    전에도 말씀드렸듯, 텀베이스는 전역 일치 검색을 세그먼트가 바뀔 때마다 수행해서 속도가 느린데
    번역 메모리는 다음 세그먼트에 표시될 내용을 현재 세그먼트를 작업하는 중에 백그라운드에서 검색해서 속도가 상대적으로 빠르게 느껴지는 편입니다.

    다만, 번역 메모리는 텀베이스처럼 트라도스 내부에서 검증을 할 수는 없고, 검증한다 하더라도 텀베이스 하나씩을 재료로 검증해야 합니다.
    문제는 텀베이스 1만 개 + 세그먼트 1천개 조합만 돼도 내부 검증에 수 분이 걸립니다.
    Xbench를 활용하면 조금 빠르게 진행하실 수는 있는데, 이 역시 추천하지는 않습니다.

    멀티텀 쪽의 오래된 오류와 하드웨어 사양의 한계인 듯한데 현재로서는 번역 메모리로 등록해 사용하는 것이 최선인 듯합니다.
    (몇년 뒤 이런 문제는 다 해결되고 이 글은 유물로 남았으면 합니다)


  • 2024-07-23 13:36

    84만여개를 통째로 넣었을 때 멀티텀 컨버터 > 멀티텀 데스크탑을 거쳐 파일 가공이 완료된 것 처럼 보였는데 막상 들어가면 항목 수가 0이었어요.


  • 2024-07-23 13:39

    8만개도 버벅대는 게 정상입니다. 일단 변환은 되시나요? 텀베이스 구조상 2개로 쪼갠다고 사정이 나아지지는 않습니다.
    중복 항목을 제거하고, 다른 언어가 있으면 제거하고, 바람직하진 않지만 이 경우에는 설명도 제거해야 간신히 작동할 듯합니다. admin@rebtion.net 이메일로 연락주시면 도움 드리겠습니다.


    • 2024-07-23 13:41

      엑셀 파일 자체는 단순하게 English, Korean 항목만 있습니다. 8만개도 버벅거리는군요.;;; 일단 8만개 미만으로 작업을 해보고 여의치 않으면 이메일 바로 드리겠습니다.


    • 2024-07-23 13:42

      라고 써놓고 보니 비상연락망 까똑이 생각남. 까똑으로 연락드렸어요.


Total 3,064
Number Title Author Date Votes Views
Notice
게시판 이용 안내
매니저 | 2019.06.16 | Votes 12 | Views 54950
매니저 2019.06.16 12 54950
3050
트라도스 2024 자격증 구매 관련 (2)
뚜뚜 | 2025.05.20 | Votes 0 | Views 103
뚜뚜 2025.05.20 0 103
3049
PO를 몰아서 발행하는 경우가 흔한가요? (4)
NY | 2025.05.19 | Votes 0 | Views 119
NY 2025.05.19 0 119
3048
사용하는 이름 질문 (2)
크맆 | 2025.05.13 | Votes 0 | Views 160
크맆 2025.05.13 0 160
3047
(오늘 오후 5시 납품..) 트라도스, 리뷰 모드, 태그 수정 오류, 세그먼트를 삽입할 수 없습니다...관련 질문 (3)
호미 | 2025.05.13 | Votes 0 | Views 150
호미 2025.05.13 0 150
3046
샘플 테스트 응시 관련 질문 (3)
크맆 | 2025.05.13 | Votes 0 | Views 145
크맆 2025.05.13 0 145
3045
Xbench 페이팔 결제 방법 (7)
민트색 | 2025.05.08 | Votes 1 | Views 264
민트색 2025.05.08 1 264
3044
Phrase (구 멤소스)에서 세그먼트 찾기 (5)
민트색 | 2025.05.08 | Votes 0 | Views 156
민트색 2025.05.08 0 156
3043
PM 메일이 피싱 의심 메일로 알람이 떴습니다ㅜㅜ (2)
translayeeseo | 2025.05.03 | Votes 0 | Views 252
translayeeseo 2025.05.03 0 252
3042
새 업체와 NDA까지 작성했는데 온보딩 종료 통보를 받았어요ㅜㅜ (3)
applechip05 | 2025.04.30 | Votes 0 | Views 294
applechip05 2025.04.30 0 294