菜鸟网络高级专家章天锋:用大数据把夜晚还给分拣员

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:
WOT2015"互联网+"时代大数据技术峰会于2015年11月28日于深圳前海华侨城JW万豪酒店盛大揭幕,42位业内重量级嘉宾汇聚,重磅解析大数据技术的点睛应用。秉承专注技术、服务技术人员的理念。

 

本次峰会涵盖九大技术主题,分别是:互联网金融、O2O电商架构、医疗应用、商业创新、移动大数据、技术创业、社交网络、数据安全、广告数据技术。DBA+社群作为本次大会合作方,将通过图文直播为大家全程跟踪报道这场技术盛宴。

 

在惨烈的11.11厮杀中,谁能在用户体验上出奇制胜,谁就拥有了主战场。因此,电商间的比拼已不仅局限于价格,物流、售后都决定着这场战役最终的成败。

 

 

【WOT2015"互联网+"时代大数据技术峰会】现场,菜鸟网络高级专家章天锋为大家分享探究如何通过对大数据技术的运用,做好快递领域和末端最后一公里。

 

>>>>

怎样在14分钟完成双11首单配送

 

 

很多消费者只有在收获环节才会与物流人员产生直接接触。据报道,在菜鸟网络的助力下,今年天猫双11全球狂欢节第一单仅用14分钟就实现了成功配送。章天锋说,大概有170万的快递员在整个平台上帮助阿里巴巴产生的包裹消费者送包裹。在包裹增长60%的情况下还能送这么快,是整个技术团和合作合伴共同做努力的结果。为了应对11.11的压力,菜鸟帮助物流公司分拨中心进行智能化升级,应用物流分单系统让整个包裹的快速流转。

在中国做物流离不开地址,在菜鸟网络的技术团队中专门设有地址库团队。菜鸟认为,只有地址数据这个基础实现稳定,才能可能建立智能的物流体系做更多事情。通过地址名单的构建,商家的发货速度比原来纸制名单快了四到六倍,促使整体发货速度提高30%。

 

>>>>

把夜晚还给分拣员

 

 

菜鸟在国内物流公司中首先构建了和分拨中心没有分单系统。原来双11的时候50万个包裹需要1500个人,我们反观UPX,50万个包裹大概只需要500个人。这里面仍有很多优化空间。章天锋告诉记者,包裹从进去到出来需要40个节点。很多分拣员都是晚上通宵干活的。以前没有系统时,分拣员只能天天对着地址去背,一个分拣员基本上要背三个月才能正式上岗。而通过对大数据技术的运用,可以将地址数据分词绝对化。菜鸟有将近20亿的地址,把20亿的地址进行标准化的集中数据,同时有1000万的分词,并通过关建词标记的方式,将字段存储成相应的纬度,根据具估地址解析成不同尾段匹配包裹,最后告诉快递员、分拣员到哪网点。

 

章天锋告诉记者,菜鸟最初只有数据,对物流公司网点的坐标一无所知,只能通过数据的方式,第一个方案是通过历史数据匹配,把所有的历史数据的包裹、网点、分拨中心全部算出来,之后理清了地址可以很快的收上来。一开始方案选择的地址完全匹配,发现这种方案的覆盖率只有50%,因此菜鸟及时做出调整,将不规则的地址补充上,算法用分词结构化存储:将20亿地址进行结构化处理,每个地址拆成了大概五到六个标准的地址。今天的菜鸟有100亿的历史库,除非这个订单历史从来没有交易过,否则任何地址都能够通过算法获得。

 

>>>>

未来的分拨中心不需要人

 

 

谈及大数据技术与物流体系结合的发展趋势,章天锋透露菜鸟正在更深一层的尝试和探索。包括在分拨中心的尝试、动态路由的尝试,还将引进引器人分拣配送包裹,我们希望让快递员生活得更加快乐一点。快递人员送得轻松,用户收得满意。真正解决最后一公里的配送问题,“未来包裹的配送就像今天的汽车制造。就像你知道的汽车有N只手在那儿造,以后包裹肯定也会是这样。”

本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2015-12-01

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
11月前
|
网络协议 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
|
1月前
|
分布式计算 NoSQL 大数据
MaxCompute产品使用合集之自定义udf连接云上vpc网络的redis获取数据的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1月前
|
机器学习/深度学习 人工智能 安全
网络安全专家指出恶意AI将开始泛滥
网络安全专家指出恶意AI将开始泛滥
|
2月前
|
负载均衡 安全 网络架构
|
2月前
|
运维 监控 Linux
【专栏】Linux中的ping命令不仅用于基础网络连通性检查,Linux 中这些高级 ping 命令可以提高工作效率!
【4月更文挑战第28天】Linux中的ping命令不仅用于基础网络连通性检查,还有许多高级功能。了解如`-c`(设置数据包数量)、`-i`(设置间隔时间)和`-w`(设置超时时间)等选项能提升效率。进阶技巧包括自定义数据包大小(`-s`)、详细统计信息(`-v`)、持续ping(`-t`)、指定源地址(`-S`)和多目标ping。这些在网络性能测试、故障排查和监控中极其有用。注意权限、参数选择,并结合其他工具以准确解读结果。提升网络管理技能,善用ping命令的全部潜力。
|
2月前
|
分布式计算 DataWorks NoSQL
MaxCompute资源问题之网络不通如何解决
DataWorks数据集是指在阿里云DataWorks平台内创建、管理的数据集合;本合集将介绍DataWorks数据集的创建和使用方法,以及常见的配置问题和解决方法。
|
2月前
|
机器学习/深度学习 数据采集 监控
基于yolov2深度学习网络的车辆检测算法matlab仿真,包括白天场景和夜晚场景
基于yolov2深度学习网络的车辆检测算法matlab仿真,包括白天场景和夜晚场景
|
11月前
|
数据可视化 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
|
11月前
|
大数据 数据挖掘 Go
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(一)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控
|
2月前
|
大数据 BI
阿里十年大数据专家谈“云上数据中台之道”含内部PPT
从大数据的概念被正式提出,到马云老师预言人类正从IT时代走向DT时代,大数据浪潮迭起。大数据同仁共同认知的一点是,大数据会对社会创新、产业变革、业务创新及每个人的角色定位产生近乎决定性的影响。