数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
实时计算 Flink 版,5000CU*H 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 一句话了解DTinsight.ScienceDTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。

一句话了解DTinsight.Science

[DTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。]

使用数栈-数据科学平台DTinsight.Science进行一站式数据探索

划重点!

数栈-数据科学平台 DTinsight.Science是什么:
机器学习作业探索平台

数栈-数据科学平台 DTinsight.Science的产品目标是:
提供专业、可靠、高效的算法建模平台,一站式完成算法建模、模型训练、模型部署等机器学习作业,让数据智能触手可及。

数栈-数据科学平台 DTinsight.Science的客户价值是:
帮助企业构建算法服务能力,让数据智能快速落地,构建数据智能化与业务智能化双向驱动引擎。

数栈-数据科学平台 DTinsight.Science给谁用:
企业的数据科学家和数据分析师们

再深入了解DTinsight.Science

2.1 研发初衷

随着大数据在企业中横向与纵向的深度应用,已经有离线计算、实时计算等大数据产品解决客户常用的计算与运维场景。目前,数据的智能化应用也是更多企业应用、探索的方向,让数据智能驱动业务智能。在这个过程中,怎么让更多的企业快速拥有数据智能化的能力,是数据科学平台思考的方向。

所以今天,数栈推出数据科学平台来构建数据加工后的算法建模能力,为数据科学家数据分析师提供完善易用的开发平台,希望为企业提供更加科学、准确的判断,实现数据的高价值应用。

2.2 产品优势

#兼容主流机器学习与深度学习框架#
TensorFlow \ MXNet \ Python \ Spark

数栈-数据科学平台DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark计算框架,不同的算法任务可选择合适的计算框架,支持多维化开发场景。后续也将支持Pytorch、XGboost等计算框架。

image

#丰富的算法组件库#
你需要的组件,我都会有

数栈-数据科学平台DTinsight.Science封装了多类算法组件,包含数据源/目标、SQL脚本工具、数据预处理、特征工程、统计分析、机器学习、深度学习、预测、评估、文本分析、网络分析等算法组件,充分覆盖算法建模场景。

image
DTinsight.Science具有丰富的算法组件

#可视化实验建模#
可视化、拖拉拽方式进行算法建模

在大数据深度应用的现在,越来越多的人员对数据与业务的智能结合,算法模型搭建充满兴趣。数栈-数据科学平台DTinsight.Science支持可视化实验建模,可将算法组件拖拉拽至画布区域,组成可视化的实验流,可界面化配置组件参数,并可视化查看数据运行结果以及模型结果,简单易上手。

image
DTinsight.Science支持可视化实验建模

#交互式Notebook数据探索#
使用Python自由进行数据探索

除可视化的实验搭建外,数据科学平台同时具备交互式Notebook开发环境,可进行python代码的编写,执行某段语句查看相应结果与运行日志,为数据分析师提供自由的数据探索环境。

image
交互式Notebook自由进行数据探索

#模型离线训练#
周期调度,训练模型参数

算法模型开发完成后,可提交任务进行离线调度,调度引擎根据调度周期进行模型训练,产生新的模型参数与数据。模型训练完成后,可查看评估结果,选取合适的模型参数进行保存应用,或在线部署。

#模型在线部署#
模型在线部署和调用,实时挖掘数据价值

当模型的预测及评估结果达到目标后,可进行模型在线部署,将模型部署至模型服务器上,并生成模型的调用API。部署后,可进行模型的在线调用。

除以上核心功能外,基础的租户隔离、项目创建管理、用户管理、角色管理、数据接入等也是具备的,可一站式完成机器学习作业,欢迎大家体验。

使用DTinsight.Science可以做哪些有意思和有价值的事情?

数栈-数据科学平台DTinsight.Science可帮助企业构建算法服务能力,服务于企业数据的多样化应用场景,驱动业务创新发展。常用的应用场景如下:

精准营销:

基于相关数据进行个性化的商品推荐、视频推荐、旅游商品推荐、广告精准投放等。

关系网络:

分析用户关系网络,进行人群关联,精细化任务画像,扩大营销范围及场景。

库存优化:

分析销售与库存关系,帮助企业智能化进货、退货,合理使用库存控件,并保证健康的供应链关系。

金融风控:

金融领域是算法模型应用比较成熟的领域,应用的场景也很多,比如根据个人信用评估,进行贷款发放的预测,贷款还款的预测,进行风险控制,以及屏蔽羊毛党等营销场景上的使用。

其他:

在不同的行业领域,会有更多的分析场景,如文本分析、图片分类、视频分析等。

截止到今天,袋鼠云企业级一站式数据中台PaaS-数栈具有数据计算引擎、数据开发平台、数据科学平台、数据资产平台、数据服务引擎等5大产品模块,平台覆盖全链路的数据采集、数据分析、数据挖掘、任务运维、数据质量、数据地图、数据模型、数据API开放等场景,充分满足企业建设数据中台过程中的多样复杂需求。

目前,西湖风景名胜区、西溪湿地、山西商务厅、老板电器、中金易云、河南世纪联华、浙江大学、常州旅游商贸职业技术学校、宁波图书馆、京东方、福建票付通、观远数据、东方龙马、佰羚数据等客户和合作伙伴都已经在使用或者参与数栈产品共创。

数栈——企业级—站式数据中台PaaS

数据计算引擎

提升企业数据共享能力,加速释放数据价值

离线计算引擎

基于Apache Spark,计算速度比MapReduce快百倍

实时计算引擎

基于Apache Flink,高吞吐、低延迟、高性能

数据开发平台

一站式大数据开发平台,快速完全数据中台搭建

离线计算开发套件

节省80%数据开发时间,全链路数据处理,兼容开源、商用计算引擎

实时计算开发套件

金融级流式数据处理自研组件,10倍采集性能,Flink引擎源码增强

数据同步引擎FlinkX

分布式多节点并发读写,吞吐量高,支持丰富的数据源

数据科学平台

机器学习作业探索平台
可视化实验搭建,集成多种主流计算框架与丰富的算法组件
交互式Notebook开发,提供自由的算法探索环境
模型离线训练,支持周期调度与任务管理
模型在线部署,支持在线调用模型与更新模型版本

数据资产平台

构建企业数据资产中心,实现数据管理规范化

数据地图

可视化数据资产中心,数据全生命周期可知可管

数据质量

覆盖90%质量校验场景,双表逐行校验保障海量数据一致

数据模型

构建OneData数据模型,快速上手清晰易懂的数据规范

数据服务引擎

提升企业数据共享能力,加速释放数据价值

数据可视化

让数据价值看得见,打造新一代“四有”大屏

分析引擎

百亿数据实现秒级查询多维度,频度复杂分析

数据API

“0代码”API生成,多权限控制保障数据开放安全

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
158 11
|
5月前
|
存储 人工智能 算法
AI与大数据的结合:案例分析与技术探讨
【8月更文挑战第22天】AI与大数据的结合为各行各业带来了前所未有的机遇和挑战。通过具体案例分析可以看出,AI与大数据在电商、智能驾驶、医疗等领域的应用已经取得了显著成效。未来,随着技术的不断进步和应用场景的不断拓展,AI与大数据的结合将继续推动各行业的创新与变革。
|
8月前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
364 6
|
存储 人工智能 并行计算
喜马拉雅基于DeepRec构建AI平台实践
快速落地大模型训练和推理能力,带来业务指标和后续算法优化空间的显著提升。喜马拉雅AI云,是面向公司人员提供的一套从数据、特征、模型到服务的全流程一站式算法工具平台。
|
人工智能 Cloud Native 安全
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
「开源人说」第四期——大数据& AI专场在今年云栖大会举办,阿里巴巴开源委员会大数据AI领域副主席王峰和阿里云AI开源项目EasyRec负责人施兴现场分享热门开源项目背后的故事。开源中国创始人&CTO红薯,白鲸开源联合创始人代立冬,浙大博导赵俊博,InfoQ总编辑王一鹏、Apache软件基金会成员李钰等嘉宾圆桌共话,对开源热点及痛点问题展开激烈讨论。
138924 5
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
|
机器学习/深度学习 人工智能 自然语言处理
干货!数据分析&AI资料合辑~
干货!数据分析&AI资料合辑~
|
人工智能 大数据 分布式计算
独家下载 |《领军行业大数据及AI实战》解锁九大行业领军企业云上大数据及AI实战
简介:深度剖析大数据在直播、多媒体、新零售、物联网、金融科技、社交、家居服务、互联网、泛娱乐9个行业实战场景,通过企业真实案例,助你速懂企业大数据实践。
84257 0
独家下载 |《领军行业大数据及AI实战》解锁九大行业领军企业云上大数据及AI实战
|
人工智能 Cloud Native 大数据
阿里云新品发布会周刊第99期 丨 Graph + AI,揭秘阿里云新一代图智能平台
阿里云Graph + AI技术,帮助各行各业融合多元异构数据,做出更聪明的分析、决策。本次分享将以上海华瑞银行为例,揭秘阿里云图智能平台如何助力华瑞银行对数以亿计的数据信息进行深度关系分析,从而建立金融知识图谱,打造智慧风控。
1306 0
阿里云新品发布会周刊第99期 丨  Graph + AI,揭秘阿里云新一代图智能平台
|
人工智能 供应链 算法
ACM SIGKDD 主席裴健:AI 要想有突破,「计算-数据-智能」平台和生态建设是关键
我们面临的最大挑战同时也是最大的机会将是如何用最新的人工智能技术把握不确定性、管理不确定性、经营不确定性。
1204 0
|
人工智能 边缘计算 Cloud Native
阿里云新品发布会周刊第82期 丨 重磅!大数据实时分析与决策&当AI遇上展会
12月23日阿里云新品发布会带您了解阿里云实时数仓如何助力企业实时决策;12月25日更有新栏目“云计算情报局”登场展现-当AI遇上展会。更多精彩内容敬请关注阿里云新品发布会!
799 0
阿里云新品发布会周刊第82期 丨 重磅!大数据实时分析与决策&当AI遇上展会