为政府、传统企业提供大数据解决方案,数之联的核心优势是算法

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据作为企业的一项重要资产越来越受重视。最早运用大数据的是BAT等互联网巨头,后来延伸到金融、运营商等领域,而在政府、军工、工业领域,对数据的管理依然相对传统和封闭,不同业务系统的数据无法打通,数据孤岛问题严重,更无从最大限度释放数据价值。

数之联是一家大数据解决方案提供商,主要为政府、传统企业提供数据采集、存储、治理、分析、挖掘、应用和可视化等大数据全产业链综合服务。

我们知道,数据分析之前需要按照业务逻辑梳理清楚。在过去的信息化建设过程中,政府、企业积累了几十上百个业务系统,数据分散,同时存在着一致性、完整性、准确性不达标等质量问题。数之联会同企业老板沟通,先进行IT系统的顶层规划,帮助企业了解未来3~5年需要建立怎样的系统、成本效益如何等,再按照一定的数据标准建立数据中心,将用户内部数据按照新的标准导进来,并按照不同的业务逻辑归类。对于不同系统出现的相同字段,平台会进行交叉验证,以此提高数据的完整性和准确性。

数据梳理好之后,还需要挖掘数据的资产价值。很多企业在这方面并没有足够的技术能力,对数据的分析多是拍脑袋或凭经验决策,比如生产哪些产品、投放到哪些地区、不同地区对某个商品的喜好程度,等等。而如果能把企业的内外部数据拿来分析,可以做很多事情。比如根据线上线下的销售数据、评论信息、营销数据等,为企业的生产提供决策;在生产加工过程中,根据日常生产设备的数据,比如电流电压、震动传感器数据等,了解生产状态,预测宕机等。

数之联目前通过爬虫技术积累了8000万条工商数据,300亿条微博关系网络数据、5000万招投标数据、3500万人才简历数据、1.7亿条手机APP数据、3亿条网购用户消费行为数据,等等。根据用户的需求,可以将相关的外部数据同企业内部数据打通,提供不同维度的数据分析。

数之联旗下产品主要用两个,一是iCloudUnion,这是一个算法集成平台,包含150种算法,能把数据挖掘的能力开放出去,帮助企业做编程,缩短在数据挖掘和分析上的时间;另外,为了帮助用户直观理解iCloudUnion平台的价值,数之联开发了配套的xDataInsight商业智能分析平台,将数据分析结果通过报表、树状图、饼状图呈现出来,在大屏上进行展示。

对于中小客户,数之联提供标准化的产品iCloudUnion平台,用户可以自行导入数据并进行分析。对于有定制化需求的大客户,数之联也会提供私有化部署,并针对用户需求开发不同的模型。

举个例子,数之联目前在为某大型酒业集团提供两类服务。一是营销系统,帮助其建设从线下到线上的营销体系,监控不同渠道的数据,提供竞品信息等情报分析;二是通过分析生产大数据优化生产,这块之前主要靠人工记录,比如酿酒不同阶段的温度、湿度、加水量等,数之联目前在针对某个车间现有的存量数据做分析,未来将逐步增加理化指标、微生物数据等,最终分析出不同指标对口感的影响,从而更好地指导生产。

其它应用场景还包括,根据历史质检信息、企业诉讼信息等,帮助食药监局提高抽检率;根据历史判决文书,为法官提供同类案件裁判建议;等等。

尽管不同行业业务复杂多样,但算法和技术相对固定。在服务一个行业第一家用户时,数之联会根据用户需求训练模型,之后则能快速复制到同类企业。

目前,为政府、传统企业提供数据挖掘分析的还包括IBM,不过,数之联的优势在于本地化服务,同时支持定制化,IBM通常仅提供通用产品,产品的渠道商也没有能力做定制算法;浪潮云也相继推出政务云、城市云,但其重点在硬件上,相当于建立一个云平台,把用户的数据搬上去,数之联则主要做云平台之上的数据分析,提供核心算法,挖掘数据价值。

据了解,针对客户的私有化部署,从谈判到落地周期大概为3~6个月。产品根据节点或项目的实施成本收费,客单价在几万到几百万/年不等。目前已服务过40个左右客户,服务、产品和行业解决方案已覆盖国内主要城市和标杆政府企业,通过参控股10余家不同地域和领域的大数据企业形成了集团化经营态势。

团队方面,目前公司有130多人,70%为技术研发人员。创始人周涛是80后,27岁被聘为电子科技大学教授,主要研究方向为大数据挖掘和复杂性科学,共发表200余篇SCI论文;董事长兼CFO傅彦,博士生导师,从事14年数据挖掘领域的研究与应用,在国内外发表论文70余篇,被SCI、EI收录论文50余篇;CTO方育柯,主要从事计算机科学与大数据等交叉领域的研究工作,曾担任华为大数据产品部架构师,负责并参与金融、运营商等领域的多个大数据分析挖掘项目。核心团队来自2002年成立的电子科技大学大数据研究中心,拥有14年数据挖掘和深度机器学习经验、10余项自主发明专利及软件著作权。

公司已于去年10月完成数千万元A轮融资,鼎兴量子领投、国中创投等跟投,投后估值超4亿。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
算法 Java
并发垃圾回收算法对于大规模服务器应用的优势
并发垃圾回收算法对于大规模服务器应用的优势
|
5天前
|
分布式计算 算法 Java
阿里云ODPS PySpark任务使用mmlspark/synapseml运行LightGBM进行Boosting算法的高效训练与推理
阿里云ODPS PySpark任务使用mmlspark/synapseml运行LightGBM进行Boosting算法的高效训练与推理
|
19天前
|
分布式计算 算法 搜索推荐
Java中可以用的大数据推荐算法
在Java中实现大数据推荐算法,通常使用Apache Mahout、Weka、DL4J或Spark MLlib。本文简要介绍了三种推荐算法:基于内容的推荐、协同过滤推荐和深度学习推荐,以及它们的使用场景。提供了每种算法的伪代码或关键代码片段。基于内容的推荐适用于有用户历史行为和物品内容信息的场景,而协同过滤适用于大量用户行为数据的场景,深度学习推荐则用于处理复杂特征。在实现时,注意数据预处理、特征提取、用户画像构建和相似度计算。
25 1
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型的核心成功因素通常可以归结为三大要素:大数据、大算力和强算法。
AI大模型的核心成功因素通常可以归结为三大要素:大数据、大算力和强算法。
23 0
|
11天前
|
机器学习/深度学习 数据采集 大数据
大数据技术下的企业智能决策支持系统
大数据技术下的企业智能决策支持系统
18 0
|
16天前
|
存储 算法 Java
分布式唯一ID解决方案-雪花算法
分布式唯一ID解决方案-雪花算法
11 0
|
23天前
|
存储 监控 NoSQL
MongoDB分片:打造高性能大数据与高并发处理的完美解决方案
MongoDB分片:打造高性能大数据与高并发处理的完美解决方案
|
1月前
|
存储 分布式计算 DataWorks
【阿里云云原生专栏】云原生下的数据湖建设:阿里云MaxCompute与DataWorks解决方案
【5月更文挑战第26天】在数字化时代,数据成为企业创新的关键。阿里云MaxCompute和DataWorks提供了一种构建高效、可扩展数据湖的解决方案。数据湖允许存储和分析大量多格式数据,具备高灵活性和扩展性。MaxCompute是PB级数据仓库服务,擅长结构化数据处理;DataWorks则是一站式大数据协同平台,支持数据集成、ETL和治理。通过DataWorks收集数据,MaxCompute存储和处理,企业可以实现高效的数据分析和挖掘,从而提升业务洞察和竞争力。
389 0
|
1月前
|
存储 算法 搜索推荐
【大数据分析与挖掘技术】Mahout推荐算法
【大数据分析与挖掘技术】Mahout推荐算法
28 0
|
4天前
|
机器学习/深度学习 自然语言处理 算法
m基于深度学习的OFDM+QPSK链路信道估计和均衡算法误码率matlab仿真,对比LS,MMSE及LMMSE传统算法
**摘要:** 升级版MATLAB仿真对比了深度学习与LS、MMSE、LMMSE的OFDM信道估计算法,新增自动样本生成、复杂度分析及抗频偏性能评估。深度学习在无线通信中,尤其在OFDM的信道估计问题上展现潜力,解决了传统方法的局限。程序涉及信道估计器设计,深度学习模型通过学习导频信息估计信道响应,适应频域变化。核心代码展示了信号处理流程,包括编码、调制、信道模拟、降噪、信道估计和解调。
26 8