为翻译软件提供云端语料库支持,Tmxmall 瞄准了语言领域的大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

当个人用户习惯了使用有道、谷歌等翻译工具满足日常的语言转化需求时,企业级的 “语言资产与管理” 却依旧是一个亟待关注的朝阳产业。由于企业级用户对翻译资料的需求大、垂直性专业要求高,一般都会将翻译业务外包给翻译公司去做,或者借助一些计算机辅助翻译软件(CAT)完成翻译,比如市面上惯用的企业服务翻译软件SDL trados、Memoq、译马网等。

而现在,一家名为上海一者信息科技的公司打算追溯到翻译语言的上游,其旗下推出的云端翻译记忆库 Tmxmall 能够将其中流通的语言信息通过云平台的方式重新集结、利用,现面向 CAT 厂商等 B 端用户主要推出的业务有:

语料交换:提供包含 3000 万中英比照的句型翻译记忆库检索与共享平台,用户(企业、翻译公司)可以在公有云中上传更多翻译内容,以换取积分使用更多翻译资源。

私有云:支持存储海量翻译记忆库,构建企业级用户私有语料库搜索引擎,帮助译者高效利用自己的记忆库,降低记忆库管理成本和利用成本,同时保护企业自身数据隐私。

在线对齐工具:在进行语料回收工作后,Tmxmall 推出的智能在线对齐工具可以将原本杂乱的中英对照文章按照句式进行翻译文本的归类,方便后来的使用者进行调取查找。

翻译交易平台:除了进行机器配对比照的翻译工作, Tmxmall 上还提供人工翻译员的匹配,以及翻译文本的众包编辑,而当平台上的语料资源越加充足之后,一部分稀缺的垂直领域翻译资源可以在交易平台 “语料商城” 中进行发布、检索、购买。

Tmxmall 目前通过企业私有云的搭建,以及语料商城中收取服务费来实现营收,目前平台上日均 API 查询已达十万次,语料商城中拥有 20000 余名兼职翻译员,并为 50 余家翻译公司提供了私有云解决方案,同时与北京语言大学等高校合作了语料管理系统。

不过,Tmxmall 目前还只提供语料库的相关解决方案,而具体的翻译动作还是需要与之合作的 CAT 软件进行,目前已接入 SDL Trados、memoQ、VisualTran、transmate 和译马网等主流 CAT。公司创始人兼 CEO 张井告诉 36 氪:“市面上 CAT 软件已经很多,我们再做已没有优势,而通过不断升级语料库的技术和数据,才能够形成相应的竞争壁垒。”

融资方面,目前 Tmxmall 已获得来自北京云识图信息技术有限公司的 200 万天使轮融资;团队方面, Tmxmall 共有员工 12 人,公司创始人兼 CEO 张井之前曾就职于百度钱包;CTO 陈件曾就职于华为、百度担任资深互联网架构师。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
9月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
SQL 分布式计算 算法
大数据Hive数据查询语言DQL
大数据Hive数据查询语言DQL
108 0
|
SQL 存储 分布式计算
大数据Hive数据操纵语言DML
大数据Hive数据操纵语言DML
144 0
|
SQL 存储 大数据
大数据Hive数据定义语言DDL
大数据Hive数据定义语言DDL
152 0
|
29天前
|
存储 数据采集 分布式计算
大数据是什么?用浅显的语言揭开神秘面纱
大数据是什么?用浅显的语言揭开神秘面纱
82 11
|
9月前
|
安全 Java 大数据
大数据软件基础(1)—— Linux
大数据软件基础(1)—— Linux
82 0
|
7月前
|
分布式计算 大数据 Java
大数据开发语言Scala入门
大数据开发语言Scala入门
|
7月前
|
IDE 大数据 Java
「AIGC」大数据开发语言Scala入门
Scala,融合OOP和FP的多范式语言,在JVM上运行,常用于大数据处理,尤其与Apache Spark配合。要开始学习,安装Scala,选择IDE如IntelliJ。基础包括变量、数据类型、控制结构、函数。Scala支持类、对象、不可变数据结构、模式匹配和强大的并发工具。利用官方文档、教程、社区资源进行学习,并通过实践提升技能。
101 0
|
7月前
|
运维 监控 大数据
部署-Linux01,后端开发,运维开发,大数据开发,测试开发,后端软件,大数据系统,运维监控,测试程序,网页服务都要在Linux中进行部署
部署-Linux01,后端开发,运维开发,大数据开发,测试开发,后端软件,大数据系统,运维监控,测试程序,网页服务都要在Linux中进行部署
|
9月前
|
大数据 Linux 虚拟化
大数据软件基础(3) —— 在VMware上安装Linux集群
大数据软件基础(3) —— 在VMware上安装Linux集群
145 0