语言桥集团自2000年成立以来,其技术革新之路见证了翻译行业的巨大变迁。从最初引入计算机辅助翻译(CAT)工具,到自主研发机器翻译系统(MT),再到拥抱大语言模型(LLM)的新时代,每一步都凝聚着企业的智慧与勇气。
故事始于2017年的一个冬日,语言桥集团董事长朱宪超赴沈阳拜访了东北大学的朱靖波教授,同时也是小牛翻译的创始人。两位同姓朱的同年人因缘际会,共谋翻译技术的未来。次年春天,他们在成都成功举办了机器翻译论坛,汇聚了来自两岸三地的众多自然语言处理领域的专家学者,这一盛况预示着机器翻译春天的到来。
2017年,Google Brain团队发表的《Attention Is All You Need》论文,为自然语言处理领域带来了革命性的变化。Transformer模型的提出,摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),仅凭注意力机制便取得了卓越成效。这一创新不仅奠定了后续BERT、GPT等大模型的基础,也推动了计算机视觉、语音等多领域的进步。
语言桥早期便敏锐地察觉到了翻译技术的重要性。从电子词典到CAT系统的广泛应用,再到自研LanCAT平台的诞生,每一步都体现了企业对技术创新的执着追求。2015年,面对高昂的Trados软件费用和复杂的操作,语言桥决定自主开发CAT系统,经过两年多的努力,LanCAT于2017年底在公司内部全面部署使用。
与此同时,机器翻译技术也在悄然进步。从基于规则和统计的机器翻译,到神经网络机器翻译(NMT)的兴起,翻译质量实现了质的飞跃。2018年成都会议后,语言桥加大了技术投入,不仅扩大了技术团队规模,还与电子科技大学、西湖大学等科研机构展开了深入合作。2021年底,语言桥自主研发的LanMT系统问世,并在WMT国际机器翻译大赛中取得了优异成绩。
LanMT的成功,离不开语言桥丰富的语料积累和专业的翻译审校团队。技术团队与审校团队紧密合作,形成了机器与专家协作的闭环,实现了人机交互的及时反馈和技术的快速优化。莱博智2023年度的《机器翻译报告》也指出,主流MT引擎之间的差距逐渐缩小,预示着MT技术的成熟与稳定。
然而,NMT的发展并未止步于此。2022年,大语言模型的兴起,特别是ChatGPT的推出,再次刷新了人们对AI的认知。ChatGPT以其强大的语言生成能力和广泛的知识储备,迅速赢得了全球用户的喜爱。语言桥也紧跟时代步伐,将AI系统与专家系统相结合,提出了“让AI系统更智能,让专家系统更可靠”的理念。
在AI系统的加持下,语言桥不断优化工作流程,提出了MT+PE(机器翻译+人工审校)的模式,并逐步向AI系统+专家系统的模式转型。AI系统包括CAT、MT、OCR、LLMs等工具和平台,而专家系统则根据不同领域、语种和背景进行分类。两者相互依存、协同工作,共同构成了语言桥的核心竞争力。
面对外界对机器翻译的质疑,朱宪超董事长总是耐心解释语言的多样性和场景的复杂性。他认为,翻译工作依然需要人类的参与和把关,人机协同将长期存在。同时,他也坦言,大模型的兴起对翻译行业带来了前所未有的挑战和机遇。
从CAT到NMT,再到LLM,技术的每一次进步都在重新定义人机工作的内容和边界。语言桥作为翻译行业的佼佼者,始终站在技术的前沿,不断探索和实践。他们用“AI系统+专家系统”的理念,为翻译行业探索了一条可持续发展的道路,也为其他企业提供了宝贵的经验和启示。