如何洞察特殊需求?搜狗输入法无障碍的研发实践与思考 | 卓越技术团队访谈录

简介: 你有没有想过,在设计应用时、开发应用时把无障碍功能场景和需求也考虑进来?

你有没有想过,在设计应用时、开发应用时把无障碍功能场景和需求也考虑进来?

信息无障碍是指任何人(无论是健全人还是残疾人,无论是年轻人还是老年人)在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。

在当下的数字时代,并不是所有人都能毫无障碍、顺利地使用各种数字产品和工具,甚至不少人仍难以上网。据世界卫生组织估计,全球目前约有 15%的人口患有残疾,超过 10 亿人。

如果开发者能将无障碍设计集成到应用中去,将能够帮更多的障碍人士使用到这些产品。近日,InfoQ 有幸与腾讯旗下搜狗输入法无障碍产品专家赵义涛就搜狗输入法无障碍适配及开发等相关话题进行交流,希望本文能让读者对数字技术和无障碍的关系有进一步了解。

无障碍输入

自个人电脑在国内普及后的多年以来,如果说装机必备的产品有哪些,“输入法”类别的软件往往占据着一席之地。

Wikipedia 对“输入法编辑器”如此定义道:键盘击键或鼠标移动翻译成字符来输入的操作系统组件。键盘原在打字机时代为英文字母而设计,但键盘只有一百来键,在没有软件的帮助下它是无法输入中文或其他大型形意文字的语言。

因此,针对不同语言往往需要有相应的输入法软件去进行信息处理,在中文世界,这个软件就是中文输入法。

然而,在大多数网民对输入法的存在已经习以为常的当下,对于障碍人士来说,输入法却存在着各式各样的痛点。

2019 年 11 月,“脑瘫女孩寻求破解鼠标打字输入法,黑客大神暖心帮助”一事引起热议,让障碍人士的需求得以走进大众视野。事件背景是一位名叫方瑜的脑瘫女孩在网上进行求助,方瑜全身只有双脚可以活动,多年来她一直使用一款冷门特殊的输入法产品“鼠标打字·高级版 III”,用脚控制鼠标写博客,但该软件很久没更新,方瑜购买的正版序列号也已经过期,于是她在换新电脑之后便发现自己已经无法继续正常使用原先的软件打字。

image.png

因此,方瑜在网上发出求助帖,希望网友能为其联系该鼠标输入法产品的开发者,却得悉软件的开发者(李经冀、李经颂两兄弟)都已经相继患癌症去世。所幸的是,一次善意接力行动也随之展开,前有技术人士连夜帮方瑜破解软件,后有搜狗输入法团队接棒研发这款输入法。

负责接棒的是赵义涛所在小组,其团队很快联系到开发者的家人,并购买了这款产品的专利。同年 12 月 19 日,一款新的专为特殊人群研发的输入工具正式对外发布,名为“点点输入”。

到用户身边去观察

“点点输入”面向的是不方便使用键盘打字的这部分人群,不管是通过鼠标还是触控屏打字,这与当前主流的键盘打字方案还是有很大的差异。

现在要想做出像李家兄弟所研发的鼠标输入法这类产品,赵义涛认为主要困难不是在于开发和代码逻辑之类的技术问题,而是产品设计——如何设计出一套与市面上主流方案不一样的良好的方案。

“通过鼠标点击交互,背后有很多的问题要解决,如何让效率最大化,让产品更易用,让用户一看就能懂,这其实是一个全新的产品设计。”于赵义涛而言,他作为产品经理必须要代入用户的操作流程去思考:若是用手去模拟鼠标操作还稍微容易些,但像方瑜这样只能用脚去交互的话,是不是会更困难?

“其实不是特别容易想清楚。”赵义涛说,有时候面向一个人群,这个人群有某个特征,但其实他们可能还会有些隐藏特征。

“比如说面向盲人群体,我们之前以为所有的盲人都会盲文,就想着说要不要设计一个盲文输入法,结果去跟相关从业人员聊的时候,我们才发现好多盲人其实没有学过盲文。而且我们做一些面向视障用户的产品的时候,会发现用户不一定是全‘盲’,有可能是视力不够好,这里面也是有差异的。”

赵义涛进一步指出,理解人群的特征这件事本身就有一定的难度,但是,如果没有理解清楚目标人群的特征,那做出来的产品可能就适配不了目标人群的某个常见场景,只能适配到自己想象的个体或者一小部分场景。

从“鼠标输入”到“点点输入”
虽然点点输入是在已有的鼠标输入产品的基础上,重构原版代码再制作新版,并非一个从 0-1 的产品。但在开发前和正式发布前,搜狗输入法团队还是与方瑜进行了大量沟通,为的是深入了解需求、理解需求。

“如果想要了解一群你原来不是很熟悉的人,最好的方式是,到他们身边去观察。”事实上,在接触方瑜之前,赵义涛也从未做过无障碍产品。

他先是上网搜索“脑瘫”,得知脑瘫的症状有很多种,大的症状下面也有许多不同的小症状,面对这个情况,他陷入苦思:”会是什么样的场景和情况,以至于会需要这么一款产品,这款产品有没有其他需要优化的点,我们是不是把人家产品复刻一遍就 OK 了?”

为了找寻答案,团队决定去宁波拜访方瑜,面对面去观察方瑜对鼠标输入法产品的使用场景:她是怎么用输入法,怎么用鼠标,用来做什么......“只有真正了解真实的场景和用户诉求之后,才能大概梳理出比较清晰的产品需求。”

复刻、升级优化、迭代
确定需求之后,便是研发、上线、不断反馈和再优化的过程。从接触方瑜到把“点点输入”做出来,搜狗输入法团队前后仅花了 8 天。据介绍,第一版“点点输入”主要复刻了原来那版鼠标输入法的交互逻辑和核心能力,并在这基础上做优化和升级。比如,新增了一些快捷键能力,把一些常用的快捷键(复制粘贴、翻页、Page Up、Page Down 等)梳理出来并放进点点输入。此外,点点输入也接入了搜狗输入法的庞大词库。

image.png

从 2019 年年底发布至今,经过两年的发展,点点输入用户数已经突破 10 万,这个量级听上去虽然不小,但对比搜狗输入法动辄几个亿的用户量来说,却微不足道。尤其是,点点输入能收获的有效产品反馈鲜少,从产品迭代的角度来看,这需要团队成员更多地把自己代入使用场景,并基于前期对用户的理解去找一些可以优化的点,继而做出尝试。

比如考虑到用点点输入的人大概率是经常会用它,团队做了输入法皮肤的优化,推出深色皮肤、护眼皮肤。

无论是原先的鼠标输入法还是后来的点点输入,均支持两种输入模式,分别是部首输入和拼音输入。

其中,部首输入是方瑜所熟悉的模式,点点输入并没有改变这部分逻辑,还是沿用原来的策略。而拼音输入则有所迭代。汉语拼音大概有 400 个合法音乐,在一个键盘上完全显示并不现实。后来,赵义涛在将自己代入用户、反复用鼠标打字后想出了“声母+韵母”的方式,其中“韵母”部分是指声母之外的其他字母,虽然不符合标准语法但效率有所提升——用户两次点触就能精准地找到自己所需要的拼音串。

无障碍产品的开发流程

由于输入法技术的成熟性,点点输入的研发相对来说并不复杂。但事实上,大多数无障碍产品的设计和研发往往不那么轻松。

赵义涛举例,有用户提出希望 PC 端有一个好用的语音转文字的产品,这时候就需要把需求转给相应的团队,让他们去做产品方案和评估。如果是给听障人群做语音转文字识别功能,那么对企业的语音识别能力显然是有要求的,因为听障人群可能有时候面临的环境比较嘈杂,有时候可能在一些特殊环境中,在不同环境的语音识别需求均存在着差异。

因此,无障碍产品跟场景、用户的需求和当前相关技术的发展都息息相关。其主流程和一般的 C 端通用产品无异:收集需求、做产品设计(需求产品化)、开发、测试、将产品交付给用户试用和体验,根据反馈再优化......

不过,细究起来,在收集需求以及产品化的过程,无障碍产品还是和普通产品存在一定的差异。

产品化
赵义涛表示,无障碍产品收集需求的渠道很少,多数时候需要自发去寻找用户进行沟通,又或者通过一些人脉关系来接触目标用户。

收集需求之后,下一步是把需求抽取出来,从中找到一些共性、能够采用通用方案解决的需求,再去输出相应的产品方案。在这过程中,需要结合产品需求、用户需求去考虑落地周期是否乐观,是否能结合自有的产品和技术能力来实现。另外,无障碍领域也会更看重产品的易用性。

但要真正理解障碍人士背后的需求并非易事。“产品化的过程中,(无障碍产品)和常规产品的差异在于,你需要反复去跟用户聊,因为有可能在你收集完需求之后,你当时是理解了,但在产品化的过程中,随着理解不断深入,你可能会疑惑为什么他当时要这么想,这里面是不是还有一些特殊的原因,这过程很可能需要反复地再去跟用户确认。”

他进一步说道,当产品负责人对于需求的理解足够清晰,并设计好产品之后,就进入交付开发流程,后续的产品研发期也跟常规产品的研发流程相差不多。但是,当产品出来后,由于无障碍面临的用户群体相对小众,很难像大众化产品那样通过线上灰度测试来观察数据,甚至没有灰度目标,往往只能把产品给到一些他们认为比较符合产品需求的目标用户。

协调资源
赵义涛目前在腾讯旗下搜狗输入法负责无障碍产品。但事实上,“无障碍”并不是作为一个独立的团队在运作,也就是说,搜狗输入法部门并没有专门负责无障碍产品的团队,而是各个业务线基于业务线的能力特征和用户诉求,去做一些无障碍相关工作。

“因为其实很难做到真正意义上的独立,它(无障碍)是被放到我们所有团队的日常工作中。如果大家在工作中,发现有些地方可以去做无障碍的优化,或者说觉得这块应该在“无障碍”设计下一些力气的话,那我们就可以自觉去做一些相关的事情。”

因此,相比常规业务开发,在资源的划分上,无障碍产品能获得的资源则不那么明确,需要相关负责人去灵活调配资源。但随着互联网行业对履行社会价值的重视,技术与公益相结合的项目也越来越多了。

据了解,早在 2015 年,搜狗输入法团队就开始探索和障碍人士的一些常用软件进行适配。比如读屏软件(屏幕阅读器),这是一种辅助技术,适用于视力障碍人士,可以阅读和说出屏幕上显示的文本、图像和按钮。

除了一些基础适配,目前搜狗输入法也在积极主动研发更多针对障碍人群不同输入需求场景的解决方案,预计年内上线。今年 1 月,他们还发布了“眼动输入”解决方案,该方案主要借助一款内置眼球追踪技术的眼控仪,让残障用户通过眼球转动和凝视,即可操作电脑完成文字输入。

挑战与希望
无障碍设计概念是由联合国组织于 1974 年提出的设计主张,强调在科学技术高度发展的现代社会,一切有关人类衣食住行的公共空间环境以及各类建筑设施、设备的规划设计,都必须充分考虑具有不同程度生理伤残缺陷者和正常活动能力衰退者(如残疾人、老年人)的使用需求。

随着过去数十年来互联网的普及,障碍人士若想顺利通过互联网获取信息和实现交流,这需要互联网产品进行信息无障碍的优化,但目前这方面还有不小的挑战。

“我们现在整个互联网从业人群,真正意义上的残障用户是很少很少的,尤其是产品研发这个方向,大家更是把自己深度很难代入到用户场景中,毕竟不是生活在这样的场景里。比如说视障用户市场,用户的生活实际上是什么样子的,我到现在也没有完全清楚。”

“我们可以自己模拟,就是暂时性的失明,把眼一闭就看不见了,但是他们也会有一些辅助工具,有一些失明的用户会用读屏产品,那在用这些辅助工具和通用的一些解决方案的时候,用户又在中间遇到了什么问题?另外,面向先天性盲人,他对世界的认知可能跟我们对世界的认知存在差异,以及对一些软件交互的认知也是有差异的,你甚至很难去理解。”

“对我个人而言,(无障碍产品设计)最大的挑战其实还是对用户的理解。这是最难的一点。”赵义涛感慨,目前业内仍主要以局外人的视角从外部观察,通过观察尽可能地理解用户,理解之后才有可能设计出一款比较适配他们需求的产品。

好消息是,在与障碍人士的连接上,有了新的通道。

2022 年 1 月 13 日,一项名为"众声"的无障碍输入公益计划正式发布,该计划由中国残疾人联合会直属中国残疾人辅助器具中心指导,腾讯旗下搜狗输入法、深圳市信息无障碍研究会、全国残疾人用品开发供应总站共同发起。

据悉,"众声"计划的核心是把搜狗输入法和腾讯技术公益所沉淀的无障碍输入技术和相关解决方案,都免费开放给全行业。这些技术,除了点点输入,还有视障输入、长辈输入、OCR 读图、AI 手语翻译等,还有前面提及的用眼球转动就可以打字的眼动输入。

原本赵义涛团队要接触无障碍目标用户,往往是通过点对点的方式去认识,又或者通过合作单位去对接。而"众声"计划发出后,他认为技术提供方和用户之间的通道有望被打通,如此一来,大家便能听到更多贴近用户的真实声音,也有利于产品需求的收集和反馈,把产品做好的概率也就更大。

“互联网,应该是要连接所有的人,但如果有一群人被遗漏了,那它是不完善的。”赵义涛希望,行业内有越来越多的人关注无障碍设计,提升对无障碍的认知,并付诸行动,共同建设更完善的无障碍环境,让障碍人士都能在网上自由冲浪。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
3月前
|
数据可视化 安全 前端开发
低代码开发究竟藏着怎样的神秘力量?它为何能成为加速软件创新的关键利器?
【8月更文挑战第21天】在数字化时代,低代码开发作为新兴方式,通过可视化界面与预建组件加速软件创新。它提高了开发效率,降低了成本与门槛,使非专业人员也能参与。但其灵活性受限且需重视安全稳定性。随着技术进步,低代码将成为推动软件快速发展的重要力量。
33 0
|
13天前
|
人工智能 算法 程序员
程序员如何借势AI提高自己:从高效工作到技能升级的全面指南
【11月更文挑战第4天】程序员可以通过以下几个方面借势 AI 提升自己:1. 日常工作效率提升,包括智能代码编写与补全、自动化测试与调试、项目管理与协作;2. 技能学习与升级,涵盖基础知识学习和深入技术研究;3. 思维拓展与创新能力培养,激发创意灵感和培养批判性思维。
|
1月前
|
机器学习/深度学习 人工智能 开发框架
企业内训|提示词工程师高阶技术内训-某运营商研发团队
TsingtaoAI 近期为某运营商技术团队提供了为期两天的提示词工程师高级技术培训。课程涵盖深度学习前沿理论、大模型技术架构设计与优化,以及提示词工程在电信行业的应用。通过技术探讨、案例分析和实战操作,学员将掌握最新的 LLM 技术和提示词工程技巧,提升在复杂业务环境中设计、优化和部署大模型解决方案的能力。课程强调技术深度与业务场景结合,适合具有一定深度学习基础的专业人员。
77 14
|
3月前
|
搜索推荐 数据挖掘 BI
问卷调查软件精选,效能与易用双赢
本文推荐了四款问卷调查软件:ZohoSurvey、SurveyMonkey、GoogleForms和Typeform。ZohoSurvey功能全面,性价比高,适合中小企业和个人;SurveyMonkey功能强大,适合大型企业和科研机构;GoogleForms免费易用,适合预算有限的用户;Typeform注重用户体验,适合需要高参与率的调查。选择时需综合考虑功能、易用性和品牌信任度等因素。
45 2
|
3月前
|
人工智能 安全 测试技术
开发者迎来提效“利器”?中兴星云研发大模型太强了
开发者迎来提效“利器”?中兴星云研发大模型太强了
59 4
|
6月前
|
视频直播 UED
提升开发体育直播系统平台价值的创新之道:赛事数据与用户体验的完美融合
随着科技的不断进步,体育直播系统平台已经成为观众近距离感受精彩比赛的窗口渠道。然而,如何进一步提升平台的价值,使用户体验更加丰富和深刻,已经成为业内关注的焦点。在这个背景下,小编参考“东莞梦幻网络科技”体育直播系统成品源码如何结合赛事数据成为创新的关键点之一。
|
消息中间件
热饭的测开成果盘点第三期:全端自动化平台翻版
本系列是回忆下 博主从事测试以来打造过的所有工具/框架等,算是大盘点。
热饭的测开成果盘点第三期:全端自动化平台翻版
|
人工智能 自然语言处理 测试技术
热饭的测开成果盘点第十九期:移动端自动化智能平台
本期介绍的是移动端app智能架构平台,效果和上期一样,也是直接根据用例 来直接执行,它的初衷是可以简单的对我们测试环境几千条用例全部自动执行的框架。在具体稳定和速度上可能不如原始写法,但是对付这种上千条的大需求,是有奇效的。
热饭的测开成果盘点第十九期:移动端自动化智能平台
|
存储 监控 IDE
年终力荐:网易一站式的自动化测试解决方案
年终力荐:网易一站式的自动化测试解决方案
457 0
|
人工智能 Kubernetes 数据可视化
专注低代码 17 年,Mendix 公司如何在“争议”中继续前行 | 卓越技术团队访谈录
“任何平台只要是图灵完备的、逻辑自洽的,并且可以做到从无代码、低代码、全代码三种开发方式无缝衔接的都不能把它称为毒瘤。”Mendix 公司中国研发中心上海团队的技术负责人周勇说道。
288 0