引发热议的AI翻译歧视,是理所应当的事么?

本文涉及的产品
图片翻译,图片翻译 100张
文本翻译,文本翻译 100万字符
文档翻译,文档翻译 1千页
简介:
本文来自AI新媒体量子位(QbitAI)

长假期间,Twitter上有个消息火爆一时。

呐,就是下面这张图了。

47562d11c1b2f45e07e339dbec96d8c625167721

这张图被当做AI有歧视的证据。简而言之,神经网络在背后提供支持的Google翻译,在把一句性别中立的语言(此处是土耳其语)翻译成英文时,会出现非性别中立的情况。或者说,Google翻译会猜测主语的性别。

在这个案例中,Google翻译的结果是:

她是一个保姆
他是一个医生

这条Twitter获得了上万的转发,也引发了本文作者Jecelyn Yeen的注意。Jecelyn是马拉西亚华人,所以她用马来语和中文进行了几次测试,其中马来语是性别中立的语言,而中文是混合的。

下面咱们看看她的测试。

马来语测试

这是一个简单的三级测试,测试对象是Google翻译和微软翻译。

Level 1:不交代语境

马来语->英语

Google翻译和微软翻译都给出同样的结果,如图所示:

8240273df728aaf72495333b608899f2fb6b0f6e

Level 2:交代语境

这次特意在前一句中交代了性别。不过没什么用,测试结果同上。

982d98dcef2182ce0b8fc5e334b3cd9c5f7ec578

Level 3:句号换逗号

这次有一个微小的调整,两个句子之间的连接,使用了逗号,代替了句号。

结果显示:Google翻译更胜一筹,完美地翻译对了主语的性别。

87778323a84cea364e93e3e258c6aea646192b1a

但是微软翻译表现不佳,第二句话还是没有翻译对。

8fa646df94c2f9ff81285fc69af2aa26aa895c30

中文测试

大多数情况下,中文的代词一般都表明了性别,所以翻译结果相对准确。

测试结果略。

所以,这是个问题么?

人工智能(AI)存在性别偏见么?我觉得不是。AI从数据中学习,给予人类设计的模型返回更符合逻辑的结果。所以,我认为机器翻译在统计学上是正确的。数据如下。

比方说上述测试中提到的程序员(Programmer)。来自Stack Overflow今年的数据显示,参与调查的开发者或程序员中有88.8%是男性。

bb61633a4a55706f6fda043b64d2c43b71548064

还有护士(Nurse)。网站Minoritynurse的数据显示,其上282万注册护士中,只有9.1%为男性。

9ce9dd325835ad8e95bd919010b06970e11a2b96

从这个角度讲,AI给出的翻译结果是有道理的。

但对我来说,这是一个问题,是一个需要改进的方面,统计学上的正确并不意味着它是正确的。

那么如何改善?

坦白讲我不知道。

b9c85def2aae788f9d6efc0a6eecb2230cf55709

Charles Wheelan在《赤裸裸的统计学》一书中,谈到了统计歧视和理性歧视。他提到即便我们建了一种模型,能以80%的正确率识别出毒贩,那还有20%无辜的人会被反复骚扰。“我们有时计算正确,但却导向了一个危险的方向”。

在翻译领域,AI会存在歧视,如果在其他领域呢?

1c8785be0968ee476fd8ae0e5de2b5ab7e980d8e

本文作者:Jecelyn Yeen 千平
原文发布时间:2017-10-09 
相关文章
|
1天前
|
人工智能 自然语言处理 开发工具
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
Languine 是一款面向开发者的 AI 翻译工具,支持 100+ 种语言,自动化翻译流程,提升多语言应用开发效率。
26 15
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
|
7天前
|
人工智能 自然语言处理 决策智能
DRT-o1:腾讯推出专注于文学翻译的 AI 模型,擅长理解比喻和隐喻等修辞手法,在翻译时保留原文的情感色彩
DRT-o1 是腾讯研究院推出的文学翻译系列 AI 模型,通过长链思考推理技术显著提升翻译质量,特别擅长处理比喻和隐喻等修辞手法。
34 2
DRT-o1:腾讯推出专注于文学翻译的 AI 模型,擅长理解比喻和隐喻等修辞手法,在翻译时保留原文的情感色彩
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
111 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
1月前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
73 10
|
Web App开发 人工智能 API
工具推荐:一款强大的AI翻译插件
工具推荐:一款强大的AI翻译插件
1122 0
工具推荐:一款强大的AI翻译插件
|
4月前
|
存储 数据采集 人工智能
外滩大会热议:AI时代数据价值转变,如何打造下一代智能数据体系?
9月5日,2024 Inclusion·外滩大会举办“从DATA for AI到AI for DATA”论坛,蚂蚁集团、上海交通大学和复旦大学联合主办,探讨AI时代数据价值的转变。中国工程院院士郑纬民和新加坡工程院院士颜水成等专家参会,分享了数据技术变化趋势及与AI融合的最新进展。论坛强调大模型对数据技术的需求推动了存储、生产和加工等各环节的技术革新,并探讨了合成数据和智能数据体系的重要性。
|
8月前
|
人工智能 JavaScript API
一个接口白嫖四个AI平台, 五个翻译平台
薅夷长技以制夷, 要大薅,快薅,多薅,苦薅,实薅,加油薅,没有了薅字,薅仔就不配当薅仔。薅字当头,薅就完了,就薅
345 4
|
8月前
|
机器学习/深度学习 人工智能 监控
【AI 现况分析】AI 算法偏见和歧视分析
【1月更文挑战第27天】【AI 现况分析】AI 算法偏见和歧视分析
|
人工智能 JavaScript API
AI 加成?翻译贼 6?deepl 踩坑记
昨儿个老板突然让把某官网文档翻译成英文,文档是 markdown 写的,好像有上百篇吧,人工翻译是不可能了,所以找到了 deepl 的 API,打算让我脚本快速翻一下。所以就成功让我水出了本篇。
|
8月前
|
人工智能 前端开发 PyTorch
构建自己 AI 翻译助手取代谷歌翻译
构建自己 AI 翻译助手取代谷歌翻译
201 0