开发者社区> 问答> 正文

关于第一题数据

仔细拜读了比赛说明和demo,有以下几个关于数据源的问题需要确认下:


1. 比赛时的数据是阿里2015.11.11当前的全集数据(脱敏后)吗?基于这个,我们可以预设所有createTime都在2015.11.11当天吗?预估支付量都在数亿,总交易额在数百亿?


2. 比赛时的数据是预先存在了rocketmq,是严格按时间先后排序的吗?还是粗略有顺序或是完全无序?


3. 金额类型为double,是不是所有订单金额及支付金额都精确到0.01?


这些都决定我们算法设计时的细节,希望官方确认下。

展开
收起
windpicker 2016-05-26 12:33:26 5518 0
7 条回答
写回答
取消 提交回答
  • 回 10楼玄弟的帖子
    交易金额的单位是以分为单位还是元?
    2016-06-15 17:09:02
    赞同 展开评论 打赏
  • 回 8楼玄弟的帖子
    我还有个问题,这个准确性的计算是在全部执行完后计算吗。

    所以可以认为准确性是20分钟杀掉拓扑后tair最后的结果,耗时是指从拓扑提交开始到每个key最后在tair写入/更新的时间。

    不知道我理解的对吗?
    2016-06-10 02:07:53
    赞同 展开评论 打赏
  • 回 3楼玄弟的帖子
    关于这个数据还有一个问题 就是数据是 包含了双11当天24个小时的信息 对吧?

    -------------------------

    回 3楼玄弟的帖子
    不好意思,,,还想确定一个问题 就是 每个order在payment里多有对应 而且保证金额是一致的 对吧?
    2016-06-03 09:30:10
    赞同 展开评论 打赏
  • Re关于第一题数据
    能否具体说明一下,准确率和实时性的评分标准. 是各自占一定的比例,还是说先按照准确性来排,再考虑实时性.
    2016-05-31 15:31:06
    赞同 展开评论 打赏
  • 回 2楼(windpicker) 的帖子
    有的,和demo一样的。但是准确性只是一个评分指标,还有实效性。就是你要尽可能快将每条数据写到tair

    -------------------------

    仔细看下赛题,我们有说清楚的。先按照准确性排名,准确性一致按照时间排名。因为参赛的选手太多,我们集群资源有限。我们只会给出一部分数据出来,所以我们只会让选手程序在集群里跑20分钟,20分钟一过我们会杀掉选手任务。单我们可以保证给出的数据量,程序在20分钟内一般可以消费完的。

    -------------------------

    是这样理解的

    2016-05-26 19:55:51
    赞同 展开评论 打赏
  • Re关于第一题数据
    根据题目描述“我们将脱敏后的双11交易数据存储在RocketMQ中”,貌似所有时间戳都限定在一天内,这个决定了是否可以用数组来临时存储一天内连续的每分钟的计数。(数组大小最多24*60)

    另外再补充个问题:实际比赛时,rocketmq是否有类似demo里的读取结束标志?还是拉不到数据就算完了?
    2016-05-26 18:09:18
    赞同 展开评论 打赏
  • I like to program and write stuff, making things a reality always make me excited. Now, I am a Apache committer.
    你好:

    第一个问题我们先暂时不回答,也许不会回答。

    第二个问题,根据时间有大致的顺序,不做有序保证。

    第三个问题,金额是精确到0.01的。

    -------------------------

    回 5楼(carrotuestc) 的帖子
    不一定是24小时到数据,可能只是一部分!
    2016-05-26 17:05:35
    赞同 展开评论 打赏
滑动查看更多
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
交易风控数据的海量存储与多种离线计算处理 立即下载
交易风控数据的海量存储于实时访问 立即下载
数据无边界:非结构化数据在MaxCompute上的处理 立即下载

相关实验场景

更多