《中国人工智能学会通讯》——11.57 基于扩展信息的移动App分类方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.57节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.57 基于扩展信息的移动App分类方法

移动 App 在移动用户的日常生活中扮演着十分重要的角色,通过研究其使用记录可以帮助深入理解用户的兴趣偏好,并且能够促成许多潜在的智能应用服务,例如移动 App 推荐、移动用户定向广告、移动用户市场分析等。

然而,我们在实践中发现,直接来自于移动App 的信息通常非常有限并且语义模糊。例如一个用于分析用户偏好的模型很难清晰地理解 App 使用记录:“用户正在玩 Angry Birds”,除非相应的App 能够被识别为一个预先设定好的语义类别:“动作游戏”。事实上,由于移动 App 巨大的数量,以及快速的增长速度,我们十分迫切地需要一种自动化的有效方法来实现移动 App 的语义分类。尽管如此,一种可能的实现方法是直接利用移动 App 分发平台(例如 Apple Appstore 等)自带的分类体系作为原子数据(Metadata),并用其对移动 App 进行自动化识别。但是,这些原始的分类数据通常不够精确,很难准确地描述用户在使用这些 App 时的潜在语义,因而无法帮助我们精确地理解用户。

事实上,移动 App 分类不是一个简单的工作,一直尚未被深入研究。在实践中,一个最主要的挑战来自于缺乏充分的显式分类特征进行分类模型训练,这是因为移动 App 本身所具有的上下文信息非常有限。具体来说,给定一个移动 App,其唯一可用的显式分类特征就是其名称中包含的单词。然而,通过分析发现这些单词通常非常少且非常稀疏。

基于上面的挑战,我们提出一种基于扩展信息的移动 App 分类方法,能够同时利用来自于 Web和情境日志的辅助信息扩展移动 App 本身缺乏的分类特征。根据近年来一些最新的短文本分类研究成果[10-11] ,一个用于扩充原始稀疏文本特征的有效方法是利用来自于 Web 的语义知识。受此启发,我们提出使用 Web 搜索引擎来获取某个给定移动 App的搜索摘要(Search Snippet),并以此作为辅助信息扩展移动 App 的文本分类特征。但是,对于一些不流行或者刚开发的新 App,有时通过搜索引擎无法获取足够的 Web 描述信息构建分类特征。在这种情况下,我们提出利用另一种有效的信息,即来自于真实世界的情境信息去构建 App 的分类特征。根据近年来一些关于情境感知的研究成果[9] ,用户对于移动 App 的使用通常是情境感知的。例如,和商业相关的 App 通常会在工作的情境下被使用,而一个游戏App则很有可能在休闲娱乐的情境下被使用。相比于来自于 Web 的辅助信息,这些来自于真实世界的情境信息能够很好地帮助分析那些新开发的或者不流行的移动 App,因为这些 App 的使用记录可以从之前所提到的用户情境日志中获得。因此,我们提出使用真实世界的情境信息来扩充移动 App 的分类特征,并训练相应的分类器。图 2 展示了所提分类算法的具体框架。image

相关文章
|
7月前
|
人工智能 自然语言处理 物联网
GEO优化方法有哪些?2025企业抢占AI流量必看指南
AI的不断重塑传统的信息入口之际,用户的搜索行为也从单一的百度、抖音的简单的查找答案的模式,逐渐转向了对DeepSeek、豆包、文心一言等一系列的AI对话平台的更加深入的探索和体验。DeepSeek的不断迭代优化同时,目前其月活跃的用户已破1.6亿,全网的AI用户规模也已超过6亿,这无疑为其下一阶段的迅猛发展提供了坚实的基础和广泛的市场空间。
|
机器学习/深度学习 人工智能 算法
智创 AI 新视界 -- 提升 AI 推理速度的高级方法(16 - 2)
本文深度聚焦提升 AI 推理速度,全面阐述模型压缩(低秩分解、参数量化)、硬件加速(GPU、TPU)及推理算法优化(剪枝感知推理、动态批处理)。结合图像识别等多领域案例与丰富代码示例,以生动形象且专业严谨的方式,为 AI 从业者提供极具价值的技术指南,助力突破 AI 推理速度瓶颈,实现系统性能跃升。
|
8月前
|
人工智能 数据安全/隐私保护 异构计算
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
1261 8
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
|
8月前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
575 4
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
2662 8
|
8月前
|
运维 iOS开发 Windows
windows电脑备案ios APP获取公钥和证书指纹Sha-1值的方法
在阿里云进行APP备案、在备案IOS端的环节的时候,发现需要我们将p12证书安装在电脑上,再用xcode或或钥匙串访问来获取这个证书的公钥和sha-1值。 但是大部分开发uniapp应用的同学们,或者进行发布的运维人员的电脑都是windows,无法按照阿里云的教程来获取ios的公钥和sha-1。备案就被卡主了。 这里介绍下另一个方法,就是使用香蕉云编来在线上传证书获取。如下图所示,打开香蕉云编后,找到下图这个功能
1165 0
|
7月前
|
人工智能 小程序 搜索推荐
【一步步开发AI运动APP】十二、自定义扩展新运动项目2
本文介绍如何基于uni-app运动识别插件实现“双手并举”自定义扩展运动,涵盖动作拆解、姿态检测规则构建及运动分析器代码实现,助力开发者打造个性化AI运动APP。
|
9月前
|
人工智能 JSON 监控
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
AI Agent的评估需覆盖其整个生命周期,从开发到部署,综合考量事实准确性、推理路径、工具选择、结构化输出、多轮对话及实时性能等维度。LangSmith作为主流评估平台,提供了一套全面的评估框架,支持12种评估技术,包括基于标准答案、程序性分析及观察性评估。这些技术可有效监控Agent各组件表现,确保其在真实场景中的稳定性和可靠性。
3692 0
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解

热门文章

最新文章