CT理论与应用研究

翻译应用再+1,网易、科大讯飞正在挖掘的AI+动漫 

来源:CT理论与应用研究 【在线投稿】 栏目:综合新闻 时间:2021-04-25

文/ 智能相对论

作者/ 离离

“由于汉化组成员身体抱恙,本周暂时停止更新。”看到这样的消息,小武叹了口气,默默退出应用程序。这已经是他喜欢的动漫在两个月内的第三次停更了。

环视四周,上下班时间的公交和地铁上,随处可见戴着耳机盯着手机屏幕、利用碎片时间追番看剧的年轻人。在步调紧凑的现代生活中,观看影视剧和动漫已经成为不少上班族的日常娱乐消遣。

信息传播的日渐便利,让人们有机会在网络上观赏更多来自不同国家地区、各式各样题材的影视动漫作品。但在那之前,字幕、对话的翻译与排版,以及改漫作品的图像绘制可是一项耗费人力物力及时间的大工程。一些较少人关注的小众作品经常因为翻译问题而无法及时更新。

“像我喜欢的一些动漫及小说、影集改漫作品,可能受众太少吧,大型平台没有引进,只能通过特定的粉丝论坛和网站收看。但这些网站的汉化时间与翻译质量十分不稳定,有时也挺糟心的。”即便作品内容可以及时更新,但缺少了汉化翻译,像小武这类没有日文基础的读者根本无法理解剧情发展。

随着科技进步,人工智能已经能在文本、图像的识别与翻译方面发挥不少作用,应用及商业化也早已成熟,Google、微软等不少互联网及科技公司都曾推出相关的服务。

“智能相对论”看到, 国内的互联网公司也推出了不少AI翻译产品,并已取得不错的商业成果。如百度大脑AI开放平台就推出了在线通用文本翻译业务,可实现两百个以上的语种在线互译,做到实时文本翻译及译文语音合成,能应用于移动端、PC网站及各类智能硬件。

其文档翻译及图片翻译功能则可识别不同档案及图片格式,在不改变文档格式的前提下完成翻译工作。去年三月,百度翻译的每日翻译量已达到千亿次;也为沪江网校、OPPO、海淘1号等不同领域的企业提供通用文本翻译服务。

网易的有道智云平台也提供实时语音翻译、文本翻译、图片翻译及部份语言离线翻译等服务,支持超过110个语种的自动识别与互译,能为直播、录播视频提供实时字幕转写翻译。腾讯云也推出了机器翻译产品,可实现文本翻译、语音翻译、图像翻译等多种功能,支持API方式接入。

科大讯飞则基于语音识别技术推出了一个视频译制智能协作平台,这款A.I.视频字幕制作应用具备自动创建视频字幕、字幕机器翻译、在线校对、译后编辑和团队协作等功能,可利用人工智能机器翻译,自动为外国视频添加中文字幕,目前累计用户为105万。

即便现有的AI翻译产品种类多样,但漫画的表现形式与一般文本不同,其翻译嵌字问题并非一般的翻译软件就能解决。

来自不同角色的对话、拟声词、文字注解、旁白等主体和作用不同的文字都会出现在同一幅图片中,一页漫画中的文字通常包含多种字体、大小,且漫画中的对话框文本排版并无规律。面对此类特殊的表现形式,普通的翻译软件往往无法完整地读取、识别所有需要翻译的文字。

“之前我曾经试过将原文漫画图片上传翻译软件,但效果不佳。翻译出来的文字经常超出对话框,一些手绘、异形及不同大小的文字经常没法识别,整体而言作用不大,试过一次就没再用了。”小武告诉“智能相对论”。

为了帮助像小武这类的读者即时看到翻译完成的作品,并解决民翻盗版问题。去年,一家专门从事漫画的机器翻译技术公司完成了一款从识别、翻译到嵌字都能自动完成的AI自动翻译系统“Mantra Engine”。

AI汉化组coming

漫画的翻译工作主要可分为文本转录识别、对话框内及背景文字翻译、翻译后的文本排版三个步骤。

在文本识别方面,Mantra的研究团队开发了专门用于漫画字符识别的OCR引擎,可定位识别来自不同角色的对话、拟声词、文字注解、旁白等主体和作用不同的异形文字,即便漫画图片十分拥挤也能够辨识。

在内容翻译上,这款应用程序针对漫画常出现的,因角色转换或画面连贯造成的主宾语衔接或缺位口语对话模式,以及传统商务翻译中少见的口吃与结巴等特殊句式加强训练。

通过文本分组、文本阅读顺序、提取视觉语义三种方式,结合对话语意和角色情绪、动作,实现多模态的上下文感知,帮助翻译出最符合角色人设、表情与情感的多语言译文。

作为一套AI自动化翻译引擎,Mantra可自动擦除原文字符,并于图像上嵌入符合译文语言形态的文字排版,包含对话框的增减、拆分与文字对齐等功能。为漫画翻译中耗时最久、人力成本最高的嵌字工作提供更加快速有效的自动化解决方案。

上一篇:媒体大咖到访超高清小镇,坦言新技术要落实到
下一篇:没有了