翻译记忆库
存储源语言文本及其译文的数据库
翻译记忆库是计算机辅助翻译(CAT)工具的核心组成部分,通过数据库存储源语言文本段及其对应的目标语言译文,实现翻译成果的复用。其工作原理是将文档分割为句段单元,自动匹配历史翻译内容并提供参考,新译文可实时入库更新。区别于机器翻译的自动生成,翻译记忆库强调人机交互效率提升,常与术语管理、语料对齐等技术协同应用。在专业翻译、本地化工程及翻译教学中发挥基础作用,并支持定制化机器翻译模块集成。
技术原理
翻译记忆库基于句子级双语对齐技术构建初始数据库,通过分词算法将翻译文档拆分为句段单元。在翻译过程中,系统运用模糊匹配算法检索库内相似度最高的历史译文,支持译员直接调用或修改后存储新译文。其“越用越聪明”特性源于动态更新的语料积累机制,包含语义相似度计算、数据筛选等关键技术模块。
技术特征
应用领域
工程翻译与本地化: 在软件本地化、产品说明书多语种版本维护等场景中,翻译记忆库通过复用已有译文降低项目成本;专业翻译教学: 利用ParaConc等工具实现学生译文与记忆库的对比分析,辅助翻译能力评估与教学反馈;非遗术语规范化: 应用术语提取工具构建专业领域翻译记忆库,确保文化遗产外译的术语一致性。
学术价值
翻译记忆库作为计算机科学技术名词,与机器翻译、平行语料库并列为计算机辅助翻译三大技术支柱。其技术路径推动了翻译学研究的技术转向,促进翻译工具使用能力成为现代译者核心素养。基于翻译记忆库的语料对齐与术语管理方法,为跨学科研究如计算语言学自然语言处理提供基础技术支持。
参考资料
蒋丽平:非物质文化遗产汉英平行语料库的创建与应用 .中国艺术研究院中国非物质文化遗产网·中国.2022-07-06
国内计算机辅助翻译综述.首都师范大学.2023-07-19
最新修订时间:2025-10-16 07:16
目录
概述
技术原理
技术特征
应用领域
参考资料