在线文本翻译能力新增14个直译模型,打造以中文为轴心语言的翻译系统

在线,文本,翻译,能力,新增,直译,模型,打造,中文,轴心,语言,系统 · 浏览次数 : 238

小编点评

## HMS Core 机器学习翻译功能概述 HMS Core 提供多种在线文本翻译模式,满足多种应用场景: * **日常场景:** 应用出行购物、网络社交等。 * **办公文档:** 协助员工完成工作任务。 * **视频字幕:** 支持多种语言视频字幕提取。 **在线文本翻译能力支持 15 国语种中文互译,包括:** * 中文 * 英文 * 日本 * 中国 * 印度 * 阿拉伯语 * 法语 * 葡萄牙语 * 西班牙语 * 瑞典语 * 印地尼西亚语 * 马來语 * 越南语 * 孟加拉语 * 阿拉伯语 * 泰国语 **主要特点:** * **速度快:** 每秒并发 300字符,翻译速度小于 150ms。 * **质量优:** 针对中文特色词、俚语的翻译结果更地道。 * **个性化:** 支持自定义参数配置。 * **安全性可靠:** 使用安全认证技术确保翻译数据的安全。 **使用 HMS Core 语种翻译功能的步骤:** 1. 创建一个 MLRemoteTranslateSetting 对象,指定源和目标语言代码。 2. 创建 MLRemoteTranslator 对象,使用设置创建翻译器。 3. 调用 translate 方法进行在线文本翻译。 4. 释放资源,防止资源泄漏。 **其他功能:** * 语言选择器,根据用户设备语言自动检测语言。 * 权限设置,控制用户对翻译数据的控制范围。 * 错误码处理,提供详细的信息,方便开发者分析问题。

正文

经济全球化的今天,人们在工作和生活中经常会与外语打交道。相较传播性较广的英语而言,其他语种的识别和阅读对大多数人来说是一件难事,此时就需要借助语言翻译软件来帮助理解。

华为 HMS Core 机器学习服务(ML Kit)翻译功能提供了多种翻译模式,不仅可以满足应用出行购物、网络社交等日常场景,还提供办公文档、视频字幕等专业翻译服务,满足多种语言和场景应用。其中在线文本翻译能力支持15国语种中文互译,满足邮件翻译、语音翻译、浏览器翻译、同传翻译等场景。

当前主流的翻译模式大都以语料资源较为丰富的英文作为中间语言进行“桥接”翻译,但是经英文转移后翻译精度有所损失,且计算资源加倍执行效果降低。

基于此,HMS Core机器学习服务对在线文本翻译能力进行升级,在原有的8国语言上又新增中意、中阿、中波、中荷、意中、阿中、波中、荷中 、中马、中泰、中越、越中、泰中、马中十四个直译模型,支持TOP15语种中文互译。相较于英文桥接翻译,中文直译模型可实现每秒并发300字符,端到端翻译速度小于150ms,翻译时延降低100%,翻译速度更快;针对中文特色词、俚语的翻译结果更地道,翻译质量更优。在线文本翻译能力分批次打造可信中文直译系统,确保中文和TOP语种的互译效果优于友商,打造差异化竞争力,可以满足中企出海或外企入华等对翻译要求更高场景的需求。

产品优势

个性化术语翻译

用户可自行提供术语以优化翻译结果,华为术语翻译引擎提供可定制的个性化术语翻译能力。

中文为轴心的机器翻译

支持TOP15语种中文互译,让翻译时延更低,质量更优。在WMT 2021 国际机器翻译大赛三角翻译任务中,获得俄到中翻译第一名。

响应实时稳定

全流程毫秒级响应,译文结果精准流畅。全球四大站点部署,助力品牌出海无忧。

多语言翻译质量领先

依托先进的机器翻译技术,结合各垂域大数据优势,满足用户在多领域、多场景下的翻译需求。在IWSLT 2020国际翻译大赛中,获得中到英字幕翻译第一名。

开发步骤

开发准备

在进行开发之前,您需要完成必要的开发准备工作,同时请确保您的工程中已经配置HMS Core SDK的Maven仓地址,并且完成了本服务的SDK集成

在线文本翻译能力集成

  1. 请参见云端鉴权信息使用须知,设置您应用的鉴权信息。

  2. 创建在线文本翻译器。可以通过文本翻译器自定义参数类MLRemoteTranslateSetting创建翻译器。

// 使用自定义的参数配置创建文本翻译器。
MLRemoteTranslateSetting setting = new MLRemoteTranslateSetting
    .Factory()
    // 设置源语言的编码,使用ISO 639-1标准(中文繁体使用BCP-47标准)。此设置为可选项,如果不设置,将自动检测语种进行翻译。
    .setSourceLangCode("zh")
    // 设置目标语言的编码,使用ISO 639-1标准(中文繁体使用BCP-47标准)。
    .setTargetLangCode("en")
    .create();
MLRemoteTranslator mlRemoteTranslator = MLTranslatorFactory.getInstance().getRemoteTranslator(setting);
  1. 可通过下面的方法查询在线翻译所支持的语种。

异步方法示例代码:

MLTranslateLanguage.getCloudAllLanguages().addOnSuccessListener(
    new OnSuccessListener<Set<String>>() {
        @Override
        public void onSuccess(Set<String> result) {
            // 成功获取在线翻译所支持的语种。
    }
});

同步方法示例代码:

try {
    Set<String> result = MLTranslateLanguage.syncGetCloudAllLanguages();
    // 成功获取在线翻译所支持的语种。
} catch (MLException e) {
    // 获取在线翻译所支持的语种出现异常。
}
  1. 进行在线文本翻译(错误码信息可参见:机器学习服务错误码)。

异步方法示例代码:

// sourceText是待翻译的文本,长度需小于5000个字符。
final Task<String> task = mlRemoteTranslator.asyncTranslate(sourceText);
task.addOnSuccessListener(new OnSuccessListener<String>() {
    @Override
     public void onSuccess(String text) {
         // 识别成功的处理逻辑。
   }
}).addOnFailureListener(new OnFailureListener() {
     @Override
     public void onFailure(Exception e) {
         // 识别失败的处理逻辑。
         try {
             MLException mlException = (MLException)e;
             // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。
             int errorCode = mlException.getErrCode();
             // 获取报错信息,开发者可以结合错误码,快速定位问题。
             String errorMessage = mlException.getMessage();
         } catch (Exception error) {
           // 转换错误处理。
         }
     }
 });

可选:同步方法示例代码:

try {
    String output = mlRemoteTranslator.syncTranslate(sourceText);
    // 识别成功的处理逻辑。
} catch (MLException e) {
    // 识别失败的处理逻辑。
    // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。
    int errorCode = e.getErrCode();
    // 获取报错信息,开发者可以结合错误码,快速定位问题。
     String errorMessage = mlException.getMessage();
}
  1. 翻译完成后,释放资源。
if (mlRemoteTranslator!= null) {
    mlRemoteTranslator.stop();
}

了解更多详情>>

访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHubGitee

关注我们,第一时间了解 HMS Core 最新技术资讯~

与在线文本翻译能力新增14个直译模型,打造以中文为轴心语言的翻译系统相似的内容:

在线文本翻译能力新增14个直译模型,打造以中文为轴心语言的翻译系统

经济全球化的今天,人们在工作和生活中经常会与外语打交道。相较传播性较广的英语而言,其他语种的识别和阅读对大多数人来说是一件难事,此时就需要借助语言翻译软件来帮助理解。 华为 HMS Core 机器学习服务(ML Kit)翻译功能提供了多种翻译模式,不仅可以满足应用出行购物、网络社交等日常场景,还提供

任务拆解,悠然自得,自动版本的ChatGPT,AutoGPT自动人工智能AI任务实践(Python3.10)

当我们使用ChatGPT完成某些工作的时候,往往需要多轮对话,比如让ChatGPT分析、翻译、总结一篇网上的文章或者文档,再将总结的结果以文本的形式存储在本地。过程中免不了要和ChatGPT“折冲樽俎”一番,事实上,这个“交涉”的过程也可以自动化,AutoGPT可以帮助我们自动拆解任务,没错,程序能

games101-3 BRDF101

BRDF101 概述 本文基于知乎Maple对brdf的文章,在此基础又收集了一些其它来源的关于brdf的文章,希望能够完全理解记忆相关知识 关于Jakub Boksansky的文章,看的过程中又去搜集了很多其它文章来理解,发现已经超出了我目前的知识厚度,因此只会简单的翻译一下我能理解的部分,感兴趣

升讯威在线客服系统的并发高性能数据处理技术:对接百度自动翻译

我会通过一系列的文章详细分析升讯威在线客服系统的并发高性能技术是如何实现的,使用了哪些方案以及具体的做法。本文将详细的介绍百度翻译接口的注册、开通、对接全过程,以及 源代码 ,希望对你有用。

如何成为一名全职创作者——程序员篇

哈喽大家好,我是咸鱼 今天跟大家分享一篇文章,这篇文章的作者 **Gergely Orosz** 是一名程序员,他从 Uber 辞职以后,就当起了全职创作者 他通过写文章、卖课程、做视频等谋生,今天这篇文章是他对这种商业模式的思考,我把它主要部分翻译了出来(想要看全文的原文链接在文末) **译文如下

基于EF Core存储的国际化服务

前言 .NET 官方有一个用来管理国际化资源的扩展包Microsoft.Extensions.Localization,ASP.NET Core也用这个来实现国际化功能。但是这个包的翻译数据是使用resx资源文件来管理的,这就意味着无法动态管理。虽然官方有在文档中提供了一些第三方管理方案,但是都不太

[转帖]【翻译】理解 TCP/IP 网络栈

https://cizixs.com/2017/07/27/understand-tcp-ip-network-stack/ TL;DR [TOC] 译者注:很久没有翻译文章了,最近在网络看到这篇介绍网络栈的文章非常详细,正好最近在看这方面的内容,索性翻译过来。因为很多文章比较长,而且很多内容比较专

[转帖]深度学习和机器学习的区别

最近在听深度学习的课,老师提了一个基本的问题:为什么会出现深度学习?或者说传统的机器学习有什么问题。老师讲解的时候一带而过,什么维度灾难啊之类的,可能觉得这个问题太浅显了吧(|| Д)````不过我发现自己确实还不太明白,于是Google了一下,发现一篇很棒的科普文,这里翻译一下,分享给大家:翻译自

如何翻译 Markdown 文件?-2-几种商业及开源解决方案介绍

近期在搭建英文博客:e-whisper.com, 需要对现有的所有中文 Markdown 翻译为英文。试了好几款翻译,结果发现效果都不理想。 翻译 Markdown 文件有哪些难点?对应的解决方案有哪些? 本文是第二篇,重点介绍我了解过的几种商业及开源解决方案。

.NET周报 【3月第4期 2023-03-24】

国内文章 .NET应用系统的国际化-多语言翻译服务 https://www.cnblogs.com/tianqing/p/17232559.html 本文重点介绍了多语言翻译服务的设计和实现。文章描述了如何通过多语言翻译服务,将临时存储在数据库中的多语言词条,按支持的语言翻译成多语言词条。作者设计了