寻找全球最强算法!通过手机安装的 App,从二十万人中挑出你

简介:
    
   如果你走在咖啡馆外面,服务员就知道你每周三早上8点15分一定会准时来这儿,并提前准备好你最喜欢的玛奇朵,这种感觉一定很棒。

这段话写在全球知名预测建模与分析平台 kaggle 的 TalkingData 全球算法大赛介绍页面上。

Kaggle 平台的注册用户现在已经超过60万,来自于全球194个国家,具有各行各业的背景,Kaggle 平台因为赛制的科学和开放的态度,也成为了很多重要数据科学竞赛的支持平台。目前,在 Kaggle 算法众包平台上一共举办了超过1200场比赛,多数比赛来自于工业界,提供了很多数据科学的解决方案。

从另外一个角度而言,这个平台类似于一个江湖武林排行榜,有一些人会借此一战成名。

2012年,美国制药公司默克(Merck)在 Kaggle 上发布了一项为期60天的挑战赛,由参赛者通过15种药物的各种数据预测它们的生物活性,如药物的靶点和非预期靶点(off-target)等等。结果,一个来自加拿大多伦多大学的5人团队 gggg 获得了第一。

如果直接介绍这支队伍,大家可能要翻一个白眼——这是谁?,但是他们背后的人却来头不小。相信很多从事数据科学的人都不陌生,他就是 Geoffrey hinton 。

三大牛 Yann LeCun、Yoshua Bengio 和 Geoffrey Hinton 在深度学习领域的地位无人不知,吃瓜群众可以看看,他长这样。

寻找全球最强算法!通过手机安装的 App,从二十万人中挑出你

说了这么多,意思就是,kaggle 很牛X,不服就来参加个比赛试试。

在 kaggle 这个牛气的平台上,中国第三方移动数据平台 TalkingData 和机器学习公司 Turi 联合举办了一场全球算法大赛。这场比赛在7月11日开始,9月5日结束。

按照 TalkingData 数据科学部直接负责大赛的科学家路瑶告诉雷锋网的信息,原本在国内看上去稀松平常的一个算法大赛,应该是搞不出一个什么大新闻的,但是, 最终的比赛经过账号排重之后,居然有1689支队伍参加,囊括了1961个选手,一共有24000多次提交。

而且,路瑶还盘点了这次大赛上有意思的一些事儿,在勾起大家的兴趣前,先说说这是个什么样的比赛。

牛!感觉不会再爱了

本次大赛的挑战题目是通过移动设备行为数据来预测设备使用者的性别和年龄分组。

大赛提供了约20万用户的脱敏数据,分成了12组,比如,男性,22到25岁,女性,30到35岁等。同时也提供了用户行为属性,比如,时间点、地理位置、手机品牌、机型等,选手要通过这些信息推测用户属于哪一个组。

嗯,看上去有点难。

大赛的评估方式是——选手需算出用户在不同分组上的概率,一个用户只能在一个分组,理想状态下,如果能算出概率是1,其他为0的话,那么就是没有任何概率损失,但他们的答案一般是在不同的分组上,这个用户以不同的概率属于这个组别,这时就有概率损失,大赛的评估指标就是概率损失。

再看一次,很复杂对不对?好吧,我们可以再复杂一些。

寻找全球最强算法!通过手机安装的 App,从二十万人中挑出你

表格里的数据首先是年龄性别分组,每个用户用是一个ID表示。一个用户的行为是在一系列的事件里,每一个事件里的信息包括:ID在什么时间点出现在哪个经纬度上,安装了哪些APP、使用了哪些APP,手机品牌和机型。

当然,APP 的 ID,包括经纬度等都进行了严格和科学的脱敏。

然而,APP 上呈现的只是脱敏后的 ID,选手对 APP 本身没有什么概念,为了让选手更好地解读数据,主办方给 APP 贴了一些标签,比如社交、游戏等,一共有1000多个标签。

围观群众表示,看样子像大海捞针对不对?

可对这些数据的解读仅仅是成功的第一步,下一步是特征工程。

选手提取了哪些特征?比如,用户是在什么时间活跃?休息日还是工作日?白天还是晚上?

数据还包括海外数据,有时差的问题。用户有了轨迹,轨迹分布是怎样?是聚集在某一块?还是聚集在几个点?之间距离有多远?常出现的位置是在中国的东南沿海还是在西北地区?这些地点又有什么样的特性。

另外,安装的APP哪些是安装了但是好长时间没有用?这又能提供什么样的信息。

天了噜,十万个为什么?不可否认的是,这些特征取值很有学问,是取01值还是更具体的权重,完全是个技术活。

路瑶一边介绍,一边冒出“星星眼”。因为在比赛中出现了非常有想象力的做法,而她在做项目过程中根本没有想到!

当你预测出结果之后,结果是不是可以作为特征反馈到模型?比如,预测年龄和性别的分组,性别相对是好预测的,准确率高一些,预测后把性别特征返回来是不是可以提高年龄的预测?年龄准确率会低一些,但是一些特殊的年龄段特征比较明显。如果把这些找出来之后再返回到模型里面,是不是也能提高整体的结果?

做完特征工程之后,进入到调模型的环节,这也是考验数据科学家经验和技巧的活。单一模型下调参数的时候,最简单的初始参数怎么选?是给一个随机值,还是给一个特别值?对于收敛速度可能会有很大的影响。

在模型集成上,学问就更多了。以神经网络为例,在神经网络里设计神经元,要知道每一层有多少个、有多少层,在模型集成里面也要有类似的思想。这些模型分成几层,谁和谁是并联、谁和谁是串联关系,如果是串联关系,下一层要处理上一层什么样的信息,是直接处理结果,还是误差或是什么。

有了好模型、好特征,提交了结果,在排名上很靠前,是不是这个事就搞定了,就可以拿到奖金了?

呵呵哒,真不一定。

还有一个大敌叫过拟合。

过拟合的方法在特定数据集里会表现非常好,但是这个数据集稍微一变,模型性能就迅速下降。

此次比赛分测试集和训练集,训练集是把所有的信息都告诉了选手,然后在测试集里要推测分组。

选手可以看到的是提交结果后的公开榜单,但私密榜单却只有管理员能看到,但比赛结果却是由私密榜单决定的,公开榜单仅供参考。

公开榜单的测试集只包括了1/4~1/3的数据,而 Kaggle 又不限制提交次数,如果你在公开榜单排名靠前,那么呵呵,有可能在私密榜单排名很惨。

寻找全球最强算法!通过手机安装的 App,从二十万人中挑出你

如何解决这个问题,Kaggle 的老司机告诉你,永远要做交叉验证!!!!拿小本本记下来!!

迄今为止,虽然大赛还未正式公布获奖名单,但是在kaggle该大赛主页上,私密榜单已经出炉!我们来看一下——

寻找全球最强算法!通过手机安装的 App,从二十万人中挑出你

这次比赛也有几个有趣的点,可以简单扒一扒!

1.TalkingData 首席数据科学家张夏天告诉雷锋网(公众号:雷锋网),虽然数据量比较小,只有约20万组,但是却是“稀疏”数据,即拿来真实数据进行脱敏后,有些数据可能维度不齐全,相比于一些比赛提供的标签齐全的数据,意思是,难度加大,你开心就好。

2.在 Kaggle 社区,第一次出现 TalkingData 中国的数据,上面的大神对此很感兴趣,甚至把kaggle 排行榜上所谓的“上古神兽”炸出来不少,Kaggle 比较牛的那些人玩的时间长了,兴趣不大,已经不太爱在平台上出现。Kaggle榜单前10名里有7名参加TalkingData 的比赛,前20名中有14名。是的,中国就是个神秘的国度……

3.最后有70多个国家的参赛选手提交了结果,选手最多的不是中国……是美国。那第二呢?第二依然不是中国,是印度,第三才是中国,含台湾、香港地区,第四是俄罗斯,第五是英国。

4.在 kaggle 的 TalkingData 大赛社区里,由于数据来自中国,很多选手需要讨论中国国情,最热衷给大家科普中国国情特征的是一个法国兄弟……

 
  本文作者: 李勤

本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
缓存 监控 Android开发
App Trace 快速安装解析(开发者视角)
App Trace 是一款应用性能监控工具,可追踪启动时间、方法耗时及卡顿等指标,助力开发调试与性能优化。支持 Android 和 iOS 平台,提供依赖引入、初始化配置和自动化脚本等快速安装方案,同时包含采样率、本地缓存等高级配置选项。集成后可通过日志检查与测试事件验证功能,注意在发布版本中使用 no-op 版本以减少性能影响,并确保隐私合规。
|
监控 测试技术 Android开发
App Trace技术解析:传参安装、一键拉起与快速安装
本文从开发者视角解析App Trace技术的关键功能与实现方法,涵盖传参安装、一键拉起和快速安装技术。详细介绍了Android和iOS平台的具体实现代码与配置要点,探讨了参数丢失、跨平台一致性及iOS限制等技术挑战的解决方案,并提供了测试策略、监控指标和性能优化的最佳实践建议,帮助开发者提升用户获取效率与体验。
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
16006 81
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
11月前
|
存储 人工智能 Android开发
为什么微信发送的APP安装不了,.apk转化为.apk.1
微信发送的APP文件常被改为.apk.1格式导致无法安装,推荐使用夸克或QQ浏览器解决。
1788 14
|
存储 前端开发 JavaScript
仿真银行app下载安装, 银行卡虚拟余额制作app,用html+css+js实现逼真娱乐工具
这是一个简单的银行账户模拟器项目,用于学习前端开发基础。用户可进行存款、取款操作,所有数据存储于浏览器内存中
|
10月前
|
编解码 数据安全/隐私保护
手机录制脚本自动执行, 免root屏幕录制脚本,自动脚本精灵app【autojs】
自动创建保存目录确保路径存在 动态生成带时间戳的文件名避免重复
|
安全 测试技术 开发者
银行转账模拟器手机版app, 银行转账凭证生成器app,用autojs实现效果【逼真效果】
本内容展示了一套基于Auto.js的银行APP自动化测试脚本和框架,用于学习和研究移动应用测试技术。脚本涵盖登录、转账等功能测试
|
11月前
|
存储 移动开发 监控
App Trace功能实战:一键拉起、快速安装与免提写邀请码的应用实践
App Trace系统通过一键拉起、快速安装和免提写邀请码三大功能,显著提升用户转化率、安装成功率和邀请注册率。结合深度技术实现与优化,助力公司用户增长,成为移动端核心基础设施。
|
存储 人工智能 编译器
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
1087 11
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
|
数据采集 人工智能 编解码
算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
BlueLM-V-3B是由vivo与香港中文大学共同研发的多模态大型语言模型,专为移动设备优化。它通过算法和系统协同优化,实现了高效部署和快速生成速度(24.4 token/s),并在OpenCompass基准测试中取得优异成绩(66.1分)。模型小巧,语言部分含27亿参数,视觉编码器含4000万参数,适合移动设备使用。尽管如此,低端设备可能仍面临资源压力,实际应用效果需进一步验证。论文链接:https://arxiv.org/abs/2411.10640。
682 9

热门文章

最新文章