开发者社区> 云雷> 正文

日志系列--行车轨迹日志的统计分析

简介: 简介 出租车公司记录了每一次载客交易发生的信息细节,包括上下客时间、经纬度、路程距离、支付方式、支付金额、缴税额等信息。详细的数据,为出租车公司的运营提供了极大的帮助,例如,了解哪些时间段比较热门,对应增加运行车次;哪些地区需求比较广泛,调度更多车辆前往。
+关注继续查看

简介

出租车公司记录了每一次载客交易发生的信息细节,包括上下客时间、经纬度、路程距离、支付方式、支付金额、缴税额等信息。详细的数据,为出租车公司的运营提供了极大的帮助,例如,了解哪些时间段比较热门,对应增加运行车次;哪些地区需求比较广泛,调度更多车辆前往。这些数据,使得乘客的需求得到了及时的响应,而驾驶员的收入也得到了提高,进而整个社会的效率得到了提高。

出租车公司把载客日志保存在阿里云日志服务上,利用日志服务可靠的存储,以及快速统计计算,挖掘日志中有用信息。本文将展示出租车公司如何使用阿里云日志服务来挖掘数据中的信息。

数据样例:

RatecodeID:  1VendorID:  2__source__:  11.164.232.105    __topic__:  dropoff_latitude:  40.743995666503906    dropoff_longitude:  -73.983505249023437extra:  0    fare_amount:  9    improvement_surcharge:  0.3    mta_tax:  0.5    passenger_count:  2    payment_type:  1    pickup_latitude:  40.761466979980469    pickup_longitude:  -73.96246337890625    store_and_fwd_flag:  N    tip_amount:  1.96    tolls_amount:  0    total_amount:  11.76    tpep_dropoff_datetime:  2016-02-14 11:03:13    tpep_dropoff_time:  1455418993    tpep_pickup_datetime:  2016-02-14 10:53:57    tpep_pickup_time:  1455418437    trip_distance:  2.02

trip_data_sample.png

查询链接

常见的统计

  1. 分时段乘车人次,查看哪些时段比较热门

    *| select count(1) as deals, sum(passenger_count) as passengers,    
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time        
    group by (tpep_pickup_time %(24*3600)/3600+8)%24 order by time limit 24

passenger_deal_per_hour.png

从结果中可以看出,上午上班时间,以及晚上下班后,是乘车需求最旺盛的时候,出租车公司可以相应的调度更多的车辆。
  1. 分时段平均乘车里程

    *| select  avg(trip_distance)  as trip_distance, 
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time         
    group by  time order by time limit 24

    distance_per_hour.png

某些时刻,对乘车里程的需求也挺旺盛,出租车公司在对应的时候也需要准备更多的车辆。

  1. 分时段平均乘车分钟数,单位里程需要的秒数,看看哪些时段比较堵

    *| select  avg(tpep_dropoff_time-tpep_pickup_time)/60  as driving_minutes, 
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time  
      group by (tpep_pickup_time %(24*3600)/3600+8)%24 order by time limit 24

    driving_minute.png

    *| select  sum(tpep_dropoff_time-tpep_pickup_time)/sum(trip_distance)  as driving_minutes, 
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time        
    group by time order by time limit 24

    seconds_per_mile.png
    一些时刻特别堵,需要准备更多车辆来应对需求。

  2. 分时段平均乘车费用,看看哪些时间赚的多

    *| select  avg(total_amount)  as dollars, 
    (tpep_pickup_time %(24*3600)/3600+8)%24 as time 
    group by time order by time limit 24

    dollars.png

    凌晨4点钟的客单价比较高,有经济压力的驾驶员可以选择在这个时候提供服务。

  3. 看看账单范围分布情况

    *| select case when total_amount < 1 then 'bill_0_1'  
    when total_amount < 10 then 'bill_1_10' 
  4. total_amount < 30 then 'bill_20_30'
  5. total_amount < 40 then 'bill_30_40'
  6. total_amount < 50 then 'bill_10_50'
  7. total_amount < 100 then 'bill_50_100'
  8. total_amount < 1000 then 'bill_100_1000'
  9. 'bill_1000_' end
    as bill_level , count(1) as count group by
    bill_level
    order by count desc

     
    ![bill_range.png](http://ata2-img.cn-hangzhou.img-pub.aliyun-inc.com/272f5a5a89f580e587355a12175a8a88.png)
    从成交金额的成交区间,可以看出大部分的成交金额在1到20(美元)之间。

dashboard

日志服务提供dashboard展示和分享所有的指标
image.png
dashboard链接

试用日志服务

查询链接
dashboard链接
以下5个子帐号供试用,请随机选择一个登录,若登录不成功请换一个子帐号尝试:

登录地址 用户名 密码
链接 sls_reader1@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader2@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader3@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader4@1654218965343050 pnX-32m-MHH-xbm
链接 sls_reader5@1654218965343050 pnX-32m-MHH-xbm

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
日志系列--前端访问日志的统计分析
简介 很多个人站长在搭建网站时使用nginx作为服务器,为了了解网站的访问情况,一般有两种手段: 使用CNZZ之类的方式,在前端页面插入js,用户访问的时候触发js,记录访问请求。 分析nginx的access log,从日志中挖掘有用信息。
4406 0
查看oracle归档日志路径2
<div id="content" class="bigfont mycontent" style="zoom:1; line-height:23.8px; margin:18px 28px; font-family:'lucida Grande',Verdana,'Microsoft YaHei'; clear:both; min-height:200px; height:auto!im
1771 0
精益化运营:10款移动统计分析工具推荐
移动应用和游戏的运营离不开大量用户数据的支持。目前国内市场的移动应用分析领域的公司则有友盟、Talking Data、App Annie、百度等,都是开发者比较熟悉的平台。相对来说,国外有哪些靠谱的移动应用分析工具呢?我们从中整理了10款,希望对开发者有所帮助。
1612 0
揭秘友盟+全域数据统计分析平台技术架构演进
如何搭建一个高可用、高安全、高性能、高稳定的全域数据统计分析数据平台架构,成为技术人首先需要考虑的问题。
306 0
基于Numpy的统计分析实战
标题中的英文首字母大写比较规范,但在python实际使用中均为小写。 2018年7月27日笔记 学习内容: 1.从文件中读取数据 2.将数据写入文件 3.利用数学和统计分析函数完成实际统计分析应用 4.掌握数组相关的常用函数 1.文本文件读写 1.1使用numpy.savetxt方法写入文本文件 numpy.savetxt方法需要2个参数:第1个参数是文件名,数据类型为字符串str; 第2个参数是被写入文件的nda数据,数据类型为ndarray对象。
1188 0
PostgreSQL · 特性分析 · 统计信息计算方法
一条SQL在PG中的执行过程是: ----> SQL输入 ----> 解析SQL,获取解析后的语法树 ----> 分析、重写语法树,获取查询树 ----> 根据重写、分析后的查询树计算各路径代价,从而选择一条成本最优的执行树 ----> 根据执行树进行执行 ----> 获取结果并返回
1764 0
+关注
云雷
日志计算驱动业务增长 让天下没有难分析的日志
104
文章
2
问答
来源圈子
更多
阿里云存储基于飞天盘古2.0分布式存储系统,产品包括对象存储OSS、块存储Block Storage、共享文件存储NAS、表格存储、日志存储与分析、归档存储及混合云存储等,充分满足用户数据存储和迁移上云需求,连续三年跻身全球云存储魔力象限四强。
+ 订阅
相关文档: 混合云容灾服务 混合云备份服务 日志服务
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载