Options -> Terminology Recognition Options 对话框
在 Workbench 中,重用原有翻译内容的手段之一就是术语识别和重用,在使用 Workbench 时结合 Trados 的 MultiTerm 组件就可以实现这一功能,而本对话框就是用于设置此类功能的。由于此部分内容涉及到了 MultiTerm 组件,所以整个内容拟分为三部分:
一、Terminology Recognition Options 对话框设置 二、在翻译过程中使用 MultiTerm 术语库的简要说明
三、将 Excel 格式的术语表导入 MultiTerm 术语库
一、Terminology Recognition Options 对话框设置
Terminology Recognition Options 对话框包含有两个选项卡:Termbase 和 Settings,Termbase 选项卡用于指定所要使用的 MultiTerm 术语库以及索引语言,而 Options 具体设置查询术语时的一些操作行为。由于设置都比较简单明了,以下仅做简要介绍:
Termbase 选项卡
Terminology provider 区域
指定所要使用的 MultiTerm 术语库的类型(或版本)。
默认情况下,在 Workbench 6.5 中,MultiTerm version: 后面的下拉列表中会自动包括 MultiTerm 5 (TRADOS 5) 选项。而如果安装了 MultiTerm 6.x 或 MultiTerm 7,下拉列表中也会包含 MultiTerm 6.x 或 MultiTerm 7 选项。
Termbase location 区域
指定 MultiTerm 术语库的具体位置。如果在 Terminology provider 区域选中了 MultiTerm 5 (TRADOS 5) 选项,则单击 Browse... 将打开文件选择对话框,可以在其中指定要使用的 .mtw(MultiTerm 5 的术语库文件格式)文件;如果选中的是 MultiTerm 6.x 或 MultiTerm 7,则单击 Browse... 后会显示一个 MultiTerm 6.x 或 MultiTerm 7 风格的术语库选择对话框,可在其中指定术语库。如果选中的是 MultiTerm 7,单击 Browse... 后会显示如下所示的 Open Termbases 对话框:

(TRO-1)
单击加号按钮将打开 Select TermBase 对话框,选中 Local TermBase,下面的列表就会显示当前本地存在的所有 MultiTerm 7 术语库,可从中进行选择。如果使用的是远程术语库,可选择下面的 Remoter termbases 选项,然后进行相应的设置。有关 Open Termbases 对话框中其他按钮的使用,请参考对话框中按钮的提示信息或查询帮助。
Language selection 区域
选定术语库后,会在该区域显示术语库中的索引语言。对于“英-中”对照的双语术语库,索引语言就是指“英语”和“中文”。Source language: 和 Target language: 下拉列表会显示索引语言,可以对这两个对话框进行调整,但切记,在 Source language 下拉列表中选择的语言应与当前 TM 的源语言一致。
Setings 选项卡
Tuning 区域
用于设置查询的具体行为。
①、Minimum match value% - 指定查询术语时的最低匹配率,默认为 70%
②、search depth (10-999) - 指定最多可以显示多少条符合 Minimum match value% 的术语,默认为 20。
③、Default Settings - 单击该按钮可以将 Minimum match value% 和 search depth (10-999) 重置为默认值。
Run terminology recognition in the background 选项
在使用术语库的情况下,打开翻译单元时,Workbench 会同时执行两个操作:①、搜索 TM 数据库;②、搜索术语库。只有这两个操作都完成之后,才会正式打开相应的翻译单元。一般来说,搜索术语库的操作耗费的时间比搜索 TM 数据库要长,当句子中包含较多的术语或通过网络使用术语库时更是如此。如果选中此选项,则会将这两个操作分开独立进行,Workbench 在执行完搜索 TM 数据库的操作后即会打开翻译单元,即使搜索术语库的操作尚未完成也是如此,这样就可以加快打开翻译单元的速度。默认情况下,该选项处于选中状态。
二、在翻译过程中使用 MultiTerm 术语库的简要说明
在文档中针对某个句子打开翻译单元时,如果该句中包含当前术语库中的术语词汇,Workbench 窗口上部的“文档 Source”窗格显示的 Source 中会使用红色的括线标注这些术语,其中第一个术语使用较粗的括线标注,右侧的“术语”窗格中会显示该术语条目,如下图所示:

(TRO-2)
将鼠标指针放到任一括线的上方,指针会变成手型,单击该括线会在“术语”窗口中显示括线下方的术语条目,单击后的括线将变粗,表示“术语”窗格当前正在显示其下方的术语条目。“术语”窗格中只会显示索引语言内容,比如对于“英-中”双语术语库,只会显示英文术语和对应的中文翻译。某些术语库的结构比较复杂,除了包含必要的索引语言内容之外,每个条目还会包含其他的一些定义性或说明性的信息。如果要查看完整的术语条目信息,可单击“术语”窗格中术语条目左侧的“字典”图标,此操作将打开 TRADOS MultiTerm 窗口,其中会显示每个条目的完整信息。
在具体操作中,当打开包含术语的翻译单元后,可以使用 Workbench 的术语按钮(如下图所示)或使用相应的快捷键将术语的翻译内容复制到文档翻译单元的译文部分中光标所在的位置,使用“取下一个术语”(Get Next Term)或“取上一个术语”(Get Previous Term)可以在不同的术语间切换,这样可以免去使用鼠标在 Workbench 的“文档 Source”窗格中点选相应的术语。

(TRO-3)
三、将 Excel 格式的术语表导入 MultiTerm 术语库(适用于 MultiTerm 6.2 之后的版本)
从 MultiTerm 6 开始,MultiTerm 只接受 XML 格式的文件作为数据源,因此,使用外部数据源生成 MultiTerm 术语库的过程可以简单分为三个过程:
①、将外部数据源转换为相应的 XML 文件,这可通过 MultiTerm 自带的 MultiTerm Convert 工具来完成; ②、在 MultiTerm 中创建 MultiTerm 术语库(也可使用已有的术语库);
③、将步骤 1 生成的 XML 文件导入步骤 2 中生成的术语库。
下面就以从 Excel 术语表生成 MultiTerm 术语库为例来具体说明这些过程。有关如何从 MultiTerm 5 术语库升级到 MultiTerm 6 或 MultiTerm 7 术语库的步骤,可以查看 MultiTerm 附带的 Tutorail 教程,而从 .csv 文件和 txt 文件生成 MultiTerm 术语库的过程与 Excel 文件差别不大,且不具有典型性,此处就不做说明了。
过程 1 - 生成 XML 文件
下图是要导入的 Excel 术语表,该表分为三列,分别为“英文术语”、“中文翻译”和“定义”内容,在第一行设置了 3 个列标题 - English、Chinese 和 Definition:

(TRO-4)
(以下步骤中的蓝色部分为说明文字,可略去不看。)
a、打开 MultiTerm Convert 工具,单击 Next。
b、选择 New conversion session。
如果希望下次重用此次的设置,可以选中 Save conversion session 并指定相应文件路径来保存设置,下次操作时,选择 Load existing conversion session 并进行相应指定即可。单击 Next。
c、在 Available conversion options 中选中 Microsoft Excel format,单击 Next。
d、单击 Input file 文本框右侧的 Browse... 按钮指定要转换的 Excel 文件。
指定 Excel 文件后会默认将生成的 XML 文件、xdt 文件和 log 文件保存在该 Excel 文件所在的同一目录,当然可以单击下面的 Browse... 按钮修改相应的保存路径。需要说明的是,在将外部数据源(包括 MultiTerm 5 术语库、.csv、.txt 和 .xls)转换为 XML 文件时,会生成一个 XML 文件和一个 xdt 文件,XML 文件保存外部数据源的内容,而 xdt 文件保存所生成的 XML 文件的结构,在创建 MultiTerm 术语库时会使用到 xdt 文件。选择数据源后单击 Next。
e、这一步设置“索引字段”和“描述字段”。MultiTerm 的每个术语条目至少要包含两个“索引字段”,分别对应术语的两种语言表述,比如这里的“English”和“Chinese”,此外,条目中还可以包含其他说明性信息,比如这里的“Definition”。左侧的 Available column header 列表中列出了前面所选择的 Excel 表的列表题(English、Chinese 和 Definition),需要在此指定它们的字段类型。从 Available column header 列表选中 English,将其指定为 Index field,然后在下面的语言列表中选择 English (United States);选中 Chinese,将其指定为 Index field,然后在下面的语言列表中选择 Chinese (PRC);选中 Definition,将其指定为 Descriptive field,然后在下面的列表中将其文本类型设置为 Text(如下图所示)。单击下一步。

(TRO-5)
f、左侧的 Entry stucture 列表简要显示了要生成的 XML 的基本结构,但未包含 Definition 字段。单击 Entry stucture 列表中的 Entry level,然后从右侧列表中选中 Definition,点击 <<Add,将其插入到结构表中与 English 和 Chinese 同级的结构位置(如下图所示)。单击 Next。

(TRO-6)
g、确认设置,然后单击 Next。
h、进行转换,结束后会显示转换结果。单击 Next,然后单击 Finish 完成转换过程。
可查看生成的 log 报告来确认转换结果。
至此,完成了从 Excel 表到 XML 文件的转换。需要说明的是,MultiTerm 6 的某些版本不支持中文路径,因此 Excel 表要存放在英文路径下,但 MultiTerm 7 则无此限制。另外,应确保术语表位于 Excel 的第一个工作表。
过程 2 - 创建 MultiTerm 术语库
从 Excel 表成功生成 MultiTerm 术语库的关键是保证,转换后的 XML 文件的结构与所创建的 MultiTerm 术语库的结构一致。为了确保一致,在创建术语库时,可以使用在上一过程中生成的结构定义文件 .xdt 来设置术语库的结构,使得所创建的 MultiTerm 术语库在结构上与 XML 文件一致,这是最方便的办法。如果要完全自定义术语库的结构,则需要注意一些细节。以下先介绍如何使用 .xdt 文件设置术语库的结构,然后再具体说明在自定义术语库结构时如何保证结构的一致性。
a、打开 MultiTerm,从 Termbase 菜单选择 Create Termbase...,在随后的对话框中指定术语库的保存路径,然后单击“确定”。
b、在随后打开的 Termbase Wizard 欢迎界面中,会列出创建 MultiTerm 术语库的主要步骤。单击 Next。
c、指定如何创建术语库的结构。
若要自定义术语库结构,请选择 Create a new termbase definition from scratch;若要利用 MultiTerm 提供的模板来创建,请选择 Use a predefined termbase template;若要使用 xdt 文件来创建,请选择 Load an existing termbase definition file,然后选择生成 XML 文件时附带生成的 xdt 文件。这里使用 xdt 文件来创建,
选中 Load an existing termbase definition file 选项,指定 xdt 文件,然后单击 Next。
d、指定术语库的名称、描述信息和版权信息。
该名称将显示在 Workbench 的术语库选择列表中。单击 Next。
e、可以看到,在所显示的 Available index fields 列表中,已列出了 XML 文件中的索引字段。如果是自定义设置术语库,则需要指定这些索引字段。接受 xdt 文件所指定的索引字段而不做修改,单击 Next。
f、Available descriptive fields 列表中已列出了 XML 文件中的描述字段,如果要设置其他描述字段,可以在左侧文本框中指定,然后单击 Add>>。单击 Next。
g、可以看到,Entry structure 列表中显示的术语库结构与过程 1 的步骤第 f 处列出的结构一致,只是,这里用 Index level 表示那里的 English 和 Chinese(如下图所示)。单击 Next。

(TRO-7)
h、单击 Finish,完成术语库的创建。
过程 3 - 将 XML 文件导入术语库
a、在 MultiTerm 窗口左下方的窗格中选中刚刚创建的术语库。从 Termbase 菜单选择 Import Entries...,打开 Import 选项卡。可以看到术语库的很多操作都集中于此。
b、在 Import 选项卡中,单击右侧的 Process... 按钮。在打开的下一个窗口中选择要导入的 XML 文件并指定 log 文件的保存位置,然后单击 Next。
c、指定 Exclusion 文件。
该文件用于保存 XML 文件中由于不符合术语库结构而无法导入的那些条目。下面有一个 Ignore sublanguage 选项,将在后面进行说明。单击 Next。
d、单击 Next。开始导入术语条目。
完成后会显示导入结果。如果出现错误信息,可查看在步骤 b 中指定的 log 文件。
e、单击 Next,单击 Finish。关闭 Import 选项卡。
至此导入完毕。这时可看到,MultiTerm 的右侧窗格中已列出了导入的第一个条目的内容。然后,即可关闭 MultiTerm,转到 Workbench 来设置使用已创建的 MultiTerm 术语库。
回顾以上所有过程,有关 Excel 表中的标题、术语库的条目结构以及 Workbench 的 Terminology Recognition Options 选项卡的索引语言可用以下图示关系来说明:

(TRO-8)
如果是自定义术语库的结构,则需要确保 Excel 表的索引标题与术语库的定义一致,如下图所示:

(TRO-9)
图 TRO-9 中,左上角显示的是创建术语库结构时设置索引字段的界面,右侧是要转换的 Excel 表,左下方是转换后的 XML 文件的一部分内容。由图 TRO-9 中的 Available index fields 列表可以看到,在自定义术语库结构时,我们选中了 Languages 下拉列表框下面的 Show sublanguages 选项,此时,Languages 列表框中就出现了子语言选项(所谓子语言,即指某种语言下面的语言分支,比如中文 Chinese 有 Chinese <HongKong S.A.R.>、Chinese <PRC>、Chinese <Singapore> 和 Chinese <Taiwan> 等子语言),在此选择了 English (United States) 和 Chinese (PRC) 作为索引字段,如图 所示(当然也可以不使用子语言,此处只是为了说明起见)。
从上图可以看到,每个索引字段包含两部分,比如英语索引字段由 EN-US 和 English (United States) 两部分组出,这里暂分别将其称为“语言标记”和“语言类型”。Excel 表的语言标题部分即对应这里的“语言类型”。因此,为了保证 XML 结构与术语库的一致性,要求 Excel 表中的语言标题内容必须与自定义术语库时选择的“语言类型”完全一致(文本内容、空格、全角半角格式和大小写格式都必须一致),否则,导入 XML 文件时会由于结构不一致而失败,这也是通过自定义方式来创建术语库的关键所在。
而如果是使用 xdt 文件来定义术语库的结构,因为这相当于将 XML 文件的结构完全复制到术语库结构,则不存在这类问题,你可以在 Excel 表的标题“胡乱”输入任何内容,甚至在转换时可以随意选择任何语言,都不会影响你使用术语库,但需要注意的是,你的 Workbench 的 Terminology Recognition Options 选项卡的索引语言所显示的内容将与 Excel 表的语言标题一致。
总之,如果选择自定义术语库或者使用已存在的术语库,则必须保证 Excel 表的语言标题、在转换 Excel 表的步骤 e 中指定的索引语言与术语库的设置完全一致。另外需要说明的是,MultiTerm Convert 工具所提供的索引语言列表中,某些语言(比如中文和英文)仅提供了子语言选项。而在自定义术语库时,即可以使用语言选项,也可以选择使用子语言选项。如果在自定义术语库时,也是指定子语言选项,则当然没有任何问题。但如果指定的是语言大类而不是具体的子语言,或者现有的术语库已指定了语言大类而非子语言,则也不必担心,在导入过程的步骤 c 可以选中 Ignore sublanguage 选项,这样只要属于同一语言类别就都可以导入。