三位创业者解答:大数据创业的价值、模式和挑战

简介:

近几年来,大数据的应用场景扩展到几乎每一个垂直行业。在得到资本青睐的同时,也面临着如何将数据的价值最大化利用,如何面对信息监管等诸多问题。

在日前IT桔子·腾讯云沙龙“对话垂直行业大数据×创业”活动中,三位大数据方向的创业者解读了大数据创业者的动力和迷茫,也回答了诸多大家关心的问题。

本文根据现场提问环节整理,有删减。

大数据到底有哪些价值?如何通过产品和技术将这些价值最大化?

白冬立<热云数据>:我是三位当中,唯一一个专注在移动互联网用户行为的大数据创业者。我们有足够多用户行为的数据,这些数据也许有非常多的价值,但是我们对很多的行业并不了解,就很难发掘这些数据背后的价值。

所以我们愿意把我们的数据最大程度的开放给合作伙伴,尤其是一些热门的领域,比如征信、金融、电商、直播等。如果说数据最后没有落地到一个行业,不解决具体行业的客户需求,我认为数据就没有价值,这是我们的经验。

李超<黑格科技>:我也认为数据本身的价值需要落地在某一个场景下,这个场景可以有很大的想象空间。如何用大数据创造更多价值,实际上数据量积累到一定程度,就会产生质变的结果,就会切入到更新的领域。大数据的价值非常多,但是想最终变现,就要切入非常好的场景。

谷熠<星图数据>:对于场景化和行业化的聚焦是毋庸置疑的。仅仅拥有海量的数据并没有特别的价值,你需要跟行业的应用场景结合,需要看在这个行业里面,不管是个人或者是企业的实际操作者,它需要什么,你的数据是不是能够真正解决这些工作场景里面的问题,这是非常重要的。

数据最基础的本质是信息,它让你能够有更多的决策依据。如果仅仅就数据而说数据,你的价值其实仅限于此。

所以你需要往上走,比如通过一些预测或建模预算的方式,真正帮助企业或用户在做选择和做决策时提供更多的可选方案。

如果你真的能够通过大数据或人工智能的方式代替他做决策,这个又上升一步。所以做大数据是不希望就数据讲数据的,我们要跟行业做垂直的结合和应用,通过更先进的技术手段和更先进的思维方式,去思考如何把人从实际的工作和实际的抉择里面解脱出来。

大数据创业如何优化自己的商业模式?

谷熠<星图数据>:怎么优化商业模式?其实很多投资人置疑我们离钱远。面对这个问题,我们也有一些思考和探索,比如我们帮助企业做产品的设计和策划。如果说按照最传统的方式来讲,无非是我收一个年费或者项目费。

现在我们的收费模式发生了进一步的变化,我们帮助企业设计或者是策划一款新的产品。前期我们收一定的成本,后期我们更倾向于按照销售结果付费的方案。通过收入分成的模式,企业的信心也会进一步加强,因为他认为既然你跟我签了分成的模式,你就会全力以赴做这个事情,前期支付的成本也不高,所以他们敢于尝试,我们在推广客户的时候也会有一定的帮助。

李超<黑格科技>:在优化商业模式上, 首先要确定你的产品是2B还是2C的。我们公司是做2B的,在2B的商业模式中,首先在早期你先要明确哪些客户可能用你的产品,包括你的产品在客户的业务生态里面能占多大的作用。

第二,你也要很早考虑变现和规模化,一开始不需要你对这个事情带来很高的回报。但是你需要在一个场景或者在一个比较标杆的客户下,产生了比较大的作用,未来才很有可能规模化。

白冬立<热云数据>:关于商业模式,我觉得有两点。

第一是如何优化满足你的客户需求的过程。在这个过程当中,你是在帮客户创造价值,是在帮客户节约成本,是帮他做决策,还是节省了他的时间,这几点钟你抓住一个点,去优化你的产品,优化你的服务。

我们做的事情主要是优化我们的技术与产品的结合。其实说白了就是优化我们的产品,因为我们的产品主要是帮助客户去做决策,节省时间和沟通的成本。所以我们花了大量的时间去跟客户沟通,了解他们的需求。2B的公司有一个特点,它不像2C的企业,可能三到五个月就能估值好几十个亿。我们做的事情,需要有缓慢的积累,这样你的公司肯定是往上走的,

第二点是找到更多变现的方式。我们找到了一个能够挣钱的事情后,不管这个挣钱的事情能够帮助你创造多少利润,你要做的事情都是如何找到第二个能赚钱的产品或者是能赚钱的路。所以现在我们做的事情,就是怎么能让我们自己两条腿走路,第一条产品能帮我们找到客户,第二条产品能帮我们盈利。

大数据创业过程中,最大的困难是什么?

白冬立<热云数据>:这个过程当中我们遇到两个最大的问题 ,第一个是关于人的问题,因为创业公司其实不像大公司有光环和背景,招人很容易,在这个过程当中为了吸引更好的人才其实是非常困难的。

第二个问题是关于中立性,因为我们做的事情是中立的第三方公司,我们往左边倾斜,可能就是赚很多钱,但是我们就不中立了,往右边倾斜可能我们就是一家不赚钱的公司,所以如何在离钱近和离钱远找到一个空间,这是我们目前遇到最大的挑战。

李超<黑格科技>:关于遇到的困难,其实创业过程当中困难非常多,包括技术、客户、资金等等。我们公司在发展的过程中一直存在着可能的风险,比如在于 不确定的监管因素,所以我们在设计产品的时候都尽量避免和监管上靠的比较敏感的地方,尽量能保证我们的产品长期是比较安全的状态。

谷熠<星图数据>:关于困难,我觉得大数据各个环节和流程目前都不太成熟。举一个简单的例子,星图自己做数据供应链全流程,从数据的收集到数据的清洗、挖掘、建模、分析,到最后产品化的应用和交付,全流程我们只能自己做,就因为现在我们没有很好的大数据环境,我们无法更方便的获取数据源。

另外,每一个公司自己的业务场景需求其实是不一样的,现在也没有很好的通用化的产品和工具能够帮助你真正解决实际问题。比如说数据的可视化呈现,但是到实际应用场景里面能不能用好,这是一个问题。

第三,一定要坚定自己的认知和想法,不要跟着资本和媒体舆论的方向走,从我们的角度来讲,星图非常庆幸,我们一上来就认清了自己的方向和策略。等风转过来的时候,正好跟我们的方式相匹配。所以一定要认清自己最重要的目标客户群体是谁,不要因为外面的风向或者是困难发生摇摆。

不同垂直行业大数据之间有哪些融合的点和机会?

白冬立<热云数据>:大数据行业的模式基本是两个, 一是服务营销,既如何帮你在花钱的过程当中省钱。第二个就是决策,我到底要做什么,怎么做。

所以我们的目标是做通用型的产品,但是我们发现很难,做通用型的产品你就飘在上面不落地,离钱远,一旦你落地了就垂直了,但是就没有办法通用了。其实我们很欢迎跟其他领域的公司合作,因为我们那些数据不跟他们合作的话一分钱不值。

每一家大数据公司都有自己的壁垒和特点,开放、供应、多多探讨,未来才能探索出大数据未来的价值到底是什么。目前行业当中也缺乏标准,比如数据是如何定价的。所以我觉得大家多去交流和合作,才能知道你到底应该怎么通用,还是说应该怎么垂直。

李超<黑格科技>:因为我们公司做的本身就比较垂直,所以没有太往通用型考虑。我觉得做通用型平台,它底层的技术或者是各个方面在早期要做很大的投入,尤其是很长一段时间内可能看不到钱。

关于不同垂直行业的融合,其实目前在电商和金融领域,它的融合已经非常深入了。比如消费金融,因为做电商和支付的公司,先天就有很强的获客渠道,大家通过这个可以知道哪里要用钱,大家平时喜欢买什么东西,这时我来提供金融服务是非常简单和自然的事情,这样的形式可以在很多行业里面碰撞出一些火花来。所以我觉得未来这种不同行业的大数据或者是不同行业的机会融合会非常多。

谷熠<星图数据>:从星图的角度来讲,我们做的数据无非是两个维度,第一个维度是跟商品相关的,包括商品的基础属性,以及商品的售卖过程;第二个维度是人,就是跟消费者相关的,包括购买习惯,收货后评价的语义分析等等,在这两个维度上,我觉得其实是有想象空间和延展空间的。

从结合的角度来讲,未来一定有更多的结合空间,我们希望让更多专业的事情交给更多专业的人做,我们会自己的精力专注地放在主营业务上。

优秀的大数据公司其核心竞争力是什么?

李超<黑格科技>:创业公司要建立自己的壁垒:

首先,当这个市场不太成熟时,空白的机会要抓住;

第二,技术一定也是壁垒。这就是互联网公司和传统公司之间的差别,互联网公司更喜欢利用这些数据和技术,或者是用机械化的方法来做决策和辅助;

第三,壁垒就是你这块业务做到一定的量或者你的用户量达到一定的数量,你对这个行业和商业模式有了全新的认识时,你的壁垒就会非常的重。因为技术方面大家都看明白了,随着时间的推移大家最终都能做起来。

谷熠<星图数据>:从我自己的角度来讲,我觉得2B最大的门槛就是懂行业,其他的都不足以或者不那么足以构成门槛。因为你的技术牛,可能有人比你技术还牛,你算法厉害,可能有别的科学比你算法还厉害。

举个例子,2C相对来讲容易,因为我可以把我自己模拟成用户,我可以把我的亲戚朋友模拟成用户,只要他在我的目标群体用户圈子里面。但是企业不行,假设说我是美的,你假设不了;假设我是蒙牛,你也假设不了。如果你并不真的懂得他们的日常运转流程、工作场景、需求和问题,是没有办法拍脑袋做产品和服务的。所以我认为2B企业来讲最重要的门槛和核心竞争力就是懂行业,这是我个人的观点。

白冬立<热云数据>:我认为一个行业当中有壁垒的公司,除了刚才两位说的几点以外,我认为还有两点很重要, 第一点是资源。

因为大数据公司它能够生存,一定有它特有的东西。比如征信公司能拿到运营商数据,是需要资源的;拿汽车违章的数据,可能也要有政府相关的资源。所以如果你在垂直领域做大数据的话,你在这个领域一定有独特的数据资源。

此外,你的数据也应该数量足够多,广度足够广或者是深度足够深,这个都能够让你在这个增面建立壁垒。

第二个是品牌,现在大数据垂直领域的公司已经非常多了。在这个领域建立起品牌,将是非常大的壁垒。当品牌做好后,比如突然间有一家公司说我要做征信,第一个想到的就是黑格,而不是其他的征信公司,这就是是非常好的壁垒的方式。所以一家2B的公司花很多钱到营销和品牌建设上去是有道理的。

个人数据属于隐私范畴未来的法律法规是否有利于这个行业的发展?

白冬立<热云数据>:关于隐私,我们碰到过这样的公司,我只能说真的很牛,但是我不知道这个怎么放到我们的模式当中做。因为我们是在台面上,在桌面上,虽然说他们有数据,但是没有办法拿出来用。所以说你未来要做什么样的企业,你的定位是怎么样的,你是要做大,还是要盈利和赚钱。

所以这个跟企业的定位有关,很多大数据公司可能都会有很多隐私数据,但是要明确涉及到隐私的事情我们是不能做的。未来监管是怎么样的不好说,只不过现在我们就拉一条红线,这条红线坚决不能碰,那就是售卖个人隐私数据。

李超<黑格科技>:数据安全方面,我们国家在这块的监管确实不是很完善,包括数据行业都是比较早期,包括我刚才说的征信涉及到很多隐私的数据,行业也比较混乱。

首先企业之间需要自律,你有很多的数据,你怎么拿它赚钱,企业要有道德标准,如果只是为了赚钱,数据投入到黑市倒卖肯定能赚很多钱。所以希望行业能有一个比较好的环境,包括一些标杆的企业,它能够建立自己的自律心态。但是这个事情可能需要两方面驱动,一方面是国家政策和法规能够逐渐完善,第二方面是这些企业能够形成比较好的标杆。

谷熠<星图数据>:关于个人数据的风险问题, 一个是国家法律层面,一个是企业自律。其实很难讲,因为企业永远有自觉和不自觉的。个体的数据一定要授权,客户允许哪部分的数据你才可以收集。

不是个体的,我们要看这个数据怎么脱敏,比如说我把30岁男性住在北京的,喜欢买电子产品的这一群人的特征拿出来分析,我分析这些人除了买电子产品还喜欢买什么,这个不牵扯到隐私,但是张三、李四喜欢买电子产品,还喜欢买什么,这牵扯到隐私,这中间的规则其实很重要。虽然国家没有现成开放的标准,但是我相信企业自己,尤其是那些有良心、有道德的企业有自己企业的标准,未来我们也希望市场越来越规范。

未来大数据发展趋势是怎样的?

白冬立<热云数据>:记住马云一句话, 谁有足够多的数据,谁就有未来。

李超<黑格科技>:对创业公司来讲,本身是没有能力创造数据的,数据基本上都在BAT、政府、银行和运营商手里面,创业公司只是通过技术采集到数据,把数据再做一次分析。现在大数据行业可能在数据层面还是以偏交易、采集为主,然后在这样的数据上逐渐有一些商业模式,能够给让企业提高它的销售和策略。 未来我觉得会和企业内的商业模式或跟服务企业的业务更加深入的融合。

谷熠<星图数据>:我个人觉得有三点:

一是未来大的数据环境越来越开放,现阶段大家为了获取一些基础的原始数据负担很大的成本,浪费很多的精力。但是我觉得未来大家获取数据的成本会越来越低,拿到数据的手段会越来越多。在先进和发达的地区,不管是北美还是欧洲,这样的趋势已经越来越明显了。

二是关于整个数据的监管和立法,我觉得未来整个市场会越来越规范,相关的法律法规,以及规范和准则也会越来越成熟。

三是真正能够意识到或者是了解到数据的价值,然后真正把数据变成驱动,不管是个人或者是企业的原动力会越来越多。大家对于数据的认知会越来越深刻和越来越具体。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
8月前
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
|
数据采集 机器学习/深度学习 人工智能
大数据分析案例-用RFM模型对客户价值分析(聚类)
大数据分析案例-用RFM模型对客户价值分析(聚类)
1014 0
大数据分析案例-用RFM模型对客户价值分析(聚类)
|
11天前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之大数据计算MaxCompute如何实现通过离线同步脚本模式
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
8月前
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
|
5月前
|
分布式计算 大数据 调度
大数据计算MaxCompute怎么将一个Quota的资源优先供给给标准模式的生产库调度使用?
大数据计算MaxCompute怎么将一个Quota的资源优先供给给标准模式的生产库调度使用?
35 2
|
7月前
|
分布式计算 资源调度 Kubernetes
大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案
大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案
|
8月前
|
分布式计算 资源调度 Java
大数据Spark部署模式DeployMode
大数据Spark部署模式DeployMode
98 0
|
11月前
|
数据采集 缓存 大数据
大数据数据采集的数据采集(收集/聚合)的Flume之数据采集流程的Selector的多路复用模式
在大数据处理和管理中,数据采集是非常重要的一环。为了更加高效地进行数据采集,Flume作为一种流式数据采集工具得到了广泛的应用。其中,Flume的Sink Processor模块是实现数据输出和处理的核心模块之一。本文将介绍Flume中的Selector多路复用模式,讲解其数据采集流程。
113 0
|
11月前
|
数据采集 缓存 大数据
大数据数据采集的数据采集(收集/聚合)的Flume之数据采集流程的Selector的复制模式
在大数据处理和管理中,数据采集是非常重要的一环。为了更加高效地进行数据采集,Flume作为一种流式数据采集工具得到了广泛的应用。其中,Flume的Sink Processor模块是实现数据输出和处理的核心模块之一。本文将介绍Flume中的Selector复制模式,讲解其数据采集流程。
83 0
|
Java 大数据 Scala
大数据开发基础的编程语言的Scala的模式匹配和正则
Scala是一种支持模式匹配和正则表达式的编程语言,它提供了强大的字符串处理和数据解析功能。本文将介绍Scala中模式匹配和正则表达式的概念和用法,帮助开发者更好地理解和应用这门语言。
57 0

热门文章

最新文章