翻译中心
新闻公告  
中心概况  
翻译团队  
翻译研究  
实习实训  
交流合作  
翻译园地  
特别推荐  
翻译园地 首页 > 翻译中心 > 翻译园地 > 正文

“把语料变为数据,让数据创造价值”——记上海翻译技术沙龙第十四期活动

2016-05-12 海上技客
    2016 年 5 月 7 日,上海翻译技术沙龙第十四期活动在上海对外经贸大学成功举办。沙龙活动首次来到松江大学城,吸引了包括大学城七所高校在内的上海众多高校师生以及业界领军人士、翻译和翻译技术爱好者约180人。




沙龙活动现场


 
    本次沙龙活动主题为“把语料变为数据,让数据创造价值”,由上海翻译技术沙龙主办,上海对外经贸大学国际商务外语学院和Tmxmall公司承办。上海对外经贸大学国际商务外语学院温建平书记以及沙龙发起人同济大学外国语学院李梅教授共同主持了沙龙活动。上海交通大学《当代外语研究》编辑部主任管新潮副教授、Tmxmall联合创始人兼CEO张井先生分别作了精彩纷呈的专题演讲,主讲人嘉宾与听众进行了热烈的互动和讨论。来自上海强生、UTH国际、翻译学堂、上海傲译、华东政法大学、上海海事大学的企业界人士和老师同学们纷纷抛出了许多专业而又富有挑战性的问题。在思维的碰撞中,大家彼此分享着观点和智慧!


    温书记首先代表上海对外经贸大学致欢迎词,对参加此次沙龙活动的高校师生、企业界人士的到来表示热烈的欢迎,对上海翻译技术沙龙发起人和组织者表示衷心的感谢。


 


温建平书记致欢迎词



上海对外经贸大学国际商务外语学院副院长司耀龙教授组织并出席活动


 
    上海交通大学外国语学院管新潮副教授围绕“语料库创建与管理”为大家带来一场图文并茂、风趣幽默的演讲。管老师分别从语料库设计、语料库制作、语料库管理三大板块进行讲解。他认为语料库设计之初需明确语料库使用目的,了解语料库使用原则与标准。在语料库制作板块,管教授详细介绍了一整套语料库制作流程。他将制作流程分成语料选取、语料降噪、语料对齐、格式转换以及语料库技术五个步骤。管教授认为,在网上选取语料时,关键在于语料质量,同时要注重语料时间性原则、专业分类原则以及规模原则。在语料降噪这一环节,管教授详细讲解了诸如WORD、EmEditor等强大降噪工具的使用方法,并提出从PDF→WORD→TXT→WORD的降噪流程。在对齐工具这一环节,管老师介绍了诸如TRADOS、ABBYY Aligner和Tmxmall在线对齐工具的使用。管老师认为,就对齐效果而言,段落对齐好过整篇对齐,就对齐效果而言,ABBYY Aligner和Tmxmall效果较好。语料的格式转换则可利用TRADOS等CAT工具、ParaConc双语检索工具、WordSmith单语检索工具等工具实现。管老师在语料库制作板块总结时提出,尽管语料库技术挑战高,但是对于多变的世界,万变不离其宗,各类软件其中逻辑相同,我们要学会自己学习,创新性解决问题。

 


管新潮老师倾囊相授


 
    在语料库管理这一板块,管老师主要从语料库管理目的和适用范围、语料库文档管理、语料库翻译应用以及语料库数据挖掘四个分主题讲解。在管老师看来,适用于文学等语料库小于1%,而适用于经济、商务、法律等应用文语料库大于90%。因此,我们应明确语料库管理目的。在语料库文档管理这一方面,管教授建议根据不同主题、不同专业命名子语料库及文档。而高质量、细分类的语料库不仅可以为我们翻译省时省力,更可以让我们的研究如虎添翼。通过语料库,我们可以研究译者风格、专业词汇选择、翻译数字对比等等方面。最后,管老师介绍了上海交通大学的《当代外语研究》杂志开辟的国内首个翻译技术专栏,并欢迎各位翻译技术专家学者踊跃投稿。

 


李梅教授主持嘉宾演讲


 
    Tmxmall联合创始人兼 CEO 张井先生开始了题为“互联网+时代的语料大数据共享新模式”的讲座。张井首先介绍了翻译记忆(TM)的演变流程。传统模式下,本地TM以单机版的形式存在,不能很好地实现共享。随着互联网技术的发展,基于局域网的TM能够实现部分共享的功能,但是受限于布置硬件的价格、读写速度、共用的人数等因素。随着互联网技术和云技术的兴起,翻译记忆移动到云端,开启了基于云端的翻译记忆共享模式(Cloud-based TM Sharing)。

 


张井先生激情演讲


 
    随后,张总介绍了国外两大翻译记忆共享平台的概念和发展情况:TAUS(Translation Automation User Society) data和MyMemory。接着,张总着重介绍了国内最大的翻译记忆平台 Tmxmall 的产品概念、发展模式、实际应用以及公司在TM共享和交易领域的探索实践。Tmxmall云翻译记忆管理平台包含语料生产、语料管理、语料开放和语料交易等应用,所对应的产品分别为:Tmxmall在线对齐工具,公有云,私有云,语料输出API以及语料商城。

    张井介绍了公有云的概念:用户可自行上传(获得积分)和下载翻译记忆文件(消耗积分),同时,将公有云平台的语料编辑权限开放给平台用户,即通过Tmxmall的在线编辑功能,用户可不断优化检索出的翻译结果,形成语料的正向质量循环机制。

    Tmxmall在线对齐工具应用广泛,同时与私有云打通了对齐生产语料和利用语料的环节,对齐的语料可同步到私有云。关于在线对齐工具的进一步功能拓展,张总提到会与语帆术语宝合作,推出双语术语一键提取功能。


 


上海海事大学申冠军就Tmxmall对齐工具向张井先生提问



华东政法大学郭书谏就对齐算法与张井先生交流


 
    关于私有云,张总分享了其语料管理和应用的强大功能:通过在云端,通过私有云账号自行管理语料。私有云能够实现多种功能:语料在线检索,翻译记忆导入导出,格式转化,通过API输出语料到CAT工具以及其他翻译工具和管理系统,分享语料检索权限等。

    而Tmxmall 的私有云实时写功能,利用云端的 TM server,降低了团队协作翻译的门槛和成本。同时,通过开放的API和云翻译记忆技术,解决了不同CAT端用户在不同CAT工具之间交换和共享TM的问题。通过Tmxmall私有云实现云翻译记忆的集中式应用和管理。


 


上海傲译徐军谈到语料交易问题


 
    关于Tmxmall 语料商城,张总提到,提供了语料的交易平台,旨在建立共赢的模式:卖家在商城发布语料,让语料升值;买家检索和购买语料,降低翻译成本,简单说:就是帮翻译公司接更多单子,帮客户找到更好的语料。可以通过分析用户翻译数据库来比对客户需求,进行评级并进行推荐。国内语言服务行业内平台“频出”,Tmxmall语料商城也是探索一种方式以TM切入,对接需求方和供应方。

    关于数据安全性问题,张总提到:数据安全是企业的一个核心。Tmxmall把用户的数据安全摆在第一位。就大家特别关注的语料版权问题,张总提到目前可行的两种解决方案:敏感词过滤以及文档碎片化,这在一定程度上可以规避知识产权问题。更多模式,还有待业内共同探索。


 


上海外国语大学研究生提出数据安全的疑问



 
    Tmxmall自始至终都在不断探索语料的应用、语料共享与交易、利用TM的垂直领域机器翻译、以及翻译服务需求方与供应方的对接等,并倡议语言服务企业一起努力,更好地服务这个行业。

 


翻译学堂周俊博


 
    沙龙活动最后环节,陶友兰老师详细介绍了上海翻译技术培训班的情况,回顾第一期培训班学员的所学所获所感。2016年7月15-16日,第二期上海翻译技术沙龙培训课程将在上海理工大学外语学院机房开办,主要教授板块包括:TRADOS操作、术语提取与管理、语料库创建以及翻译项目管理。现场反应热烈,纷纷向老师询问课程情况。有兴趣的技客可关注登陆上海翻译技术沙龙的微信公众号“海上技客”了解详情并进行报名。

 


陶友兰教授介绍上海翻译技术培训班


 
    讲座结束之后,南京航空航天大学王孝存教授热情为本次沙龙赋诗两首,为本次沙龙活动划上了完美的句号。

 






沙龙活动现场2


 
   上午活动结束后,大家相约来到了松江风景优美的泰晤士小镇,漫步,畅谈。让我们一起期待上海翻译技术沙龙第十五期活动。

 


泰晤士小镇雨中情



泰晤士小镇雨中情


 
朱小二/陈亚芹撰稿