在手机上长按文字进行选择,其背后的技术不简单

简介: 本文介绍联邦学习技术在手机文字复制功能上的应用。

打开手机,选择文本,长按复制

长按文字进行选择,相信大家在手机上进行此类操作应该是非常频繁的。细心的同学会发现,假如你想选择一个叫做“文本”的名词时,无论你将手指放在“文”字或者“本”字上,手机都会自动将这两个字都进行选择。

下图是我用荣耀20手机的记事本做的测试(白色圆圈为触屏操作):
在这里插入图片描述

再比如说,当我们在文本框中选中地址时,它自动会出现地图导航的标志;当我们在文本框中选中手机号码时,它自动会出现拨号的标志。(地址和手机号均为随机输入)

在这里插入图片描述

智能文本选择技术

没错,这就是我们今天要说的智能文本选择技术,其作为Android O的一部分于2017年推出,是Android最常用的功能之一。可通过预测用户点击所需的词或词集,帮助用户轻松、快速地选择、复制和使用文本,并自动适当扩展选择。通过这个功能,选择会自动扩展,对于定义了分类类型的选择,例如地址和电话号码,用户可以通过一个应用程序打开选择,从而节省用户更多的时间。

在这里插入图片描述

让联邦学习来提高文本选择的智能性吧

今天,我们描述如何通过使用联邦学习来训练神经网络模型来提高智能文本选择的性能,同时保持用户的隐私。这项工作是Android新的私有计算核心(Private Compute Core)安全环境的一部分,使我们能够在某些类型的实体上提高模型的选择精度高达20%。

用于词类选择的服务器端代理数据

智能文本选择与智能关联背后的技术相同,它不是任意预测的,而是关注定义良好的词类,比如地址或电话号码,并试图预测这些类别的选择范围。在没有多词实体的情况下,训练模型会只选择单个词,以减少多词错误选择的频率。

智能文本选择功能最初是使用来自网页的代理数据来训练的,我们使用schema.org网站提供的注释数据进行训练。然后,这些词类被嵌入到随机文本的选择中,模型被训练为只选择已知词类,而不溢出到周围的随机文本中。

虽然这种使用schema.org提供的数据的培训方法可以工作,但它有几个限制。这些数据与我们期望用户在设备上看到的文本非常不同。例如,带有schema.org注释的网站词类的格式通常比用户在手机上输入的格式更合适。此外,用于训练的词类嵌入的文本样本是随机的,不能反映设备上的现实上下文。

用于联邦学习的设备反馈信号

有了这个新的技术,模型不再使用代理数据进行跨度预测,而是在设备上使用联邦学习对真实交互数据进行训练。这是一种机器学习模型的训练方法,在这种方法中,一个中央服务器协调模型训练,在许多设备中分离,而使用的原始数据保持在本地设备上。一个标准的联邦学习培训流程如下:

  • 服务器从初始化模型开始。
  • 然后,开始一个迭代过程,

    • 手机设备得到一个初始化模型
    • 手机设备使用其本地数据改进模型
    • 手机设备只发送改进的模型,而不发送用于训练的数据。
  • 最后,服务器平均它收到的更新,以创建在下一次迭代中发送的模型。

对于智能文本选择,每当用户点击选择文本并修正模型的建议时,Android就会得到精确的反馈,了解模型应该预测的选择范围。为了保护用户隐私,这些选择被暂时保存在设备上,服务器端不可见,然后通过应用联邦学习技术来改进模型。这种技术的优点是可以用推理过程中看到的同一类型数据来训练模型。

联邦学习与隐私

联邦学习方法的优点之一是它支持用户隐私,因为原始数据不会暴露给服务器。相反,服务器只接收更新后的模型权重。尽管如此,为了防范各种威胁,我们探索了保护设备上数据、安全地聚合梯度和降低模型记忆风险的方法。

训练联邦智能文本选择模型的设备上代码是Android的私有计算核心安全环境的一部分,这使得它特别适合安全地处理用户数据。这是因为Private Compute Core中的训练环境与网络是隔离的,并且只有在应用联邦和其他隐私保护技术时才允许数据出口。除了网络隔离之外,私有计算核心中的数据还受到策略的保护,这些策略限制了数据的使用方式,从而防止恶意代码进入设备。

为了聚合由设备上的训练代码产生的模型更新,我们使用Secure Aggregation,这是一种加密协议,允许服务器计算联邦学习模型训练的平均更新,而无需阅读单个设备提供的更新。除了由Secure Aggregation单独保护,更新还由传输加密保护,从而创建了两层防御网络攻击的防御层。

最后,我们研究了模型记忆。原则上,训练数据的特征可以编码到发送给服务器的更新中,在聚合过程中幸存下来,最终被全局模型记住。这使得攻击者可以尝试从模型中重建训练数据。我们使用了Secret shareer的方法,这是一种分析技术,可以量化模型无意中记忆训练数据的程度,以经验验证模型没有记忆敏感信息。此外,我们使用了数据屏蔽技术,以防止某些类型的敏感数据被模型所看到。

结合起来,这些技术有助于确保联邦智能文本选择以一种保护用户隐私的方式进行训练。

实现卓越的模型质量

最初尝试使用联邦学习来训练模型,但没有成功。损失没有收敛,预测基本上是随机的。调试训练过程是困难的,因为训练数据是在设备上,没有集中收集,所以无法检查或验证。事实上,在这种情况下,甚至不可能确定数据是否符合预期,这通常是调试机器学习管道的第一步。

为了克服这个挑战,我们仔细地设计了高级的度量标准,使我们能够理解模型在训练期间是如何表现的。这些指标包括训练示例的数量、选择的准确性以及每种实体类型的召回率和精度指标。这些指标是在联邦训练期间通过联邦分析收集的,类似于模型权重的收集过程。通过这些指标和许多分析,我们能够更好地理解系统的哪些方面工作得很好,以及哪里可能存在漏洞。

在修正了这些错误并进行了额外的改进之后,例如对数据实现了设备上的过滤器,使用了更好的联邦优化方法,并应用了更健壮的梯度聚合器,模型得到了良好的训练。

结果

使用这种新的联合方法,我们能够显著地改进Smart Text Selection模型,其程度取决于所使用的语言。在多词选择准确性方面,典型的改进幅度在5%至7%之间,而单词的性能没有下降。正确选择地址(支持的最复杂的实体类型)的准确性提高了8%到20%,这取决于所使用的语言。这些改进导致每天为用户自动扩展数百万个额外的选择。

国际化

这种联合学习方法对于智能文本选择的另一个优点是它能够扩展到其他语言。服务器端培训需要对每种语言的代理数据进行手动调整,以便使其更类似于设备上的数据。虽然这只在某种程度上起作用,但每增加一门语言都需要付出巨大的努力。

然而,联邦学习管道训练的是用户交互,而不需要这样的手动调整。一旦这个模型在英语上取得了很好的效果,我们就把同样的管道应用到日语上,并且看到了更大的改进,而不需要专门为日语选择调整系统。

我们希望这个新的联合方法能让我们将智能文本选择扩展到更多的语言。理想情况下,这也可以在不需要手动调优系统的情况下工作,这使得它甚至可以支持低资源语言。

结论

Google开发的一种基于用户交互的学习预测文本选择的联邦方法,从而大大改进了智能文本选择模型,并部署到Android用户中。这种方法需要使用联邦学习,因为它不需要在服务器上收集用户数据。此外,Google还使用了许多最先进的隐私保护方法,如Android的新的私有计算核心、安全聚合和秘密共享方法。结果表明,在训练模型时,隐私不一定是一个限制因素。相反,其设法获得了一个明显更好的模型,同时确保用户数据保持私有。

相关文章
|
4月前
|
移动开发 Android开发 数据安全/隐私保护
移动应用与系统的技术演进:从开发到操作系统的全景解析随着智能手机和平板电脑的普及,移动应用(App)已成为人们日常生活中不可或缺的一部分。无论是社交、娱乐、购物还是办公,移动应用都扮演着重要的角色。而支撑这些应用运行的,正是功能强大且复杂的移动操作系统。本文将深入探讨移动应用的开发过程及其背后的操作系统机制,揭示这一领域的技术演进。
本文旨在提供关于移动应用与系统技术的全面概述,涵盖移动应用的开发生命周期、主要移动操作系统的特点以及它们之间的竞争关系。我们将探讨如何高效地开发移动应用,并分析iOS和Android两大主流操作系统的技术优势与局限。同时,本文还将讨论跨平台解决方案的兴起及其对移动开发领域的影响。通过这篇技术性文章,读者将获得对移动应用开发及操作系统深层理解的钥匙。
122 12
|
5月前
|
网络协议 程序员 5G
IM开发者的零基础通信技术入门(十三):为什么手机信号差?一文即懂!
本系列文章尽量使用最浅显易懂的文字、图片来组织内容,力求通信技术零基础的人群也能看懂。但个人建议,至少稍微了解过网络通信方面的知识后再看,会更有收获。如果您大学学习过《计算机网络》这门课,那么一定不要错过本系列文章。
66 0
|
6月前
|
机器学习/深度学习 人工智能 供应链
智能进化:AI技术如何重塑智能手机体验
【7月更文第31天】随着人工智能(AI)技术的飞速发展,智能手机已经成为AI应用的重要平台之一。本文将探讨AI如何改善智能手机的用户体验,分析AI技术在手机硬件中的具体应用案例,并讨论AI技术如何帮助智能手机制造商应对市场挑战。
230 2
|
7月前
|
移动开发 开发框架 JavaScript
技术心得记录:手机Web开发框架
技术心得记录:手机Web开发框架
84 0
|
7月前
|
JavaScript
技术心得:根据不同访问设备跳转到PC页面或手机页面
技术心得:根据不同访问设备跳转到PC页面或手机页面
84 0
|
8月前
|
数据采集 人工智能 自然语言处理
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
【5月更文挑战第16天】微软发布 Phi-3 技术报告,介绍了一个拥有3.8B参数的新语言模型,超越GPT-3.5,成为最大模型之一。 Phi-3 在手机上运行的特性开启了大型模型移动应用新纪元。报告强调数据清洗是关键,通过优化设计实现高效运行。实验显示 Phi-3 在多项NLP任务中表现出色,但泛化能力和数据隐私仍是挑战。该模型预示着AI领域的未来突破。[[论文链接](https://arxiv.org/pdf/2404.14219.pdf)]
101 2
|
8月前
|
人工智能 算法 搜索推荐
慧鲤携手联发科技亮相MWC,端侧LoRA融合技术助力手机大模型技能扩充
慧鲤携手联发科技亮相MWC,端侧LoRA融合技术助力手机大模型技能扩充
|
8月前
|
前端开发 JavaScript Android开发
【web前端技术】判断是否是手机端
【web前端技术】判断是否是手机端
130 0
|
SQL 安全 前端开发
保护隐私安全,springboot手机号脱敏技术助你无忧通信
尊重用户隐私一直是我们在开发应用程序时应重视的问题。在当今移动互联网时代,手机号码作为个人重要信息之一,泄露可能导致隐私侵犯和骚扰问题。为了保护用户的手机号安全,我们可以借助Spring Boot框架提供的强大功能,实现手机号脱敏的有效保护,让通信更加安心无忧。
239 0
保护隐私安全,springboot手机号脱敏技术助你无忧通信
|
机器学习/深度学习 人工智能 自然语言处理
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天(2)
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
231 0