数据处理

首页 标签 数据处理
# 数据处理 #
关注
17326内容
阿里重磅开源全球首个批流一体机器学习平台Alink,Blink功能已全部贡献至Flink
11月28日,Flink Forward Asia 2019 在北京国家会议中心召开,阿里在会上发布Flink 1.10版本功能前瞻,同时宣布基于Flink的机器学习算法平台Alink正式开源,这也是全球首个批流一体的算法平台,旨在降低算法开发门槛,帮助开发者掌握机器学习的生命全周期。
Spark修炼之道(高级篇)——Spark源码阅读:第十三节 Spark SQL之SQLContext(一)
作者:周志湖 1. SQLContext的创建 SQLContext是Spark SQL进行结构化数据处理的入口,可以通过它进行DataFrame的创建及SQL的执行,其创建方式如下: //sc为SparkContext val sqlContext = new org.apache.spark.sql.SQLContext(sc) 其对应的源码为: def
图嵌入综述 (arxiv 1709.07604) 译文第一、二章
原文:A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications (arxiv 1709.07604) 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 一、引言 图自然存在于各种各样的现实世界场景中,例如,社交媒体网络中的社交图/扩散图,研究领域中的引用图,电子商务区中的用户兴趣图,知识图等。
结构方程模型(SEM)的假设(2)
结构方程模型(SEM)的假设 合理的样本量SEM是一般线性模型灵活有力的扩展。像其它统计方法一样,需要一系列假设。这些假设应该满足或至少近似地保证有可信赖的结果。按 照James Stevens的社会科学的应用多变量统计的说法,一个好的经验法则是在标准普通最小二乘多重回归分析中每个因子有15个个案。因为SEM在某些方面与多 重回归紧密相关,SEM中每个测量变量15个个案是合
如何用VOSviewer分析CNKI关键词共现?
用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。
做可交互的统计图表,这套图形语法不容错过
“一图胜千言”,是最直观的数据可视化魅力。以图表来传达和沟通信息,其效率远超枯燥乏味的数据表达。
数据中心是什么,一般都建在哪?
互联网的发展,直接把人类带入一个信息爆炸的时代。海量的数据改变了传统商业、科学研究以及日常生活的方方面面。而随着互联网特别是移动互联网的兴起,数据中心也成为了一个非常热门的概念。
通过libVirt抓取kvm虚拟机监控指标数据
通常在我们的云环境中,为了保证云平台中虚拟机的正常运行,基本都需要这样一个功能,就是收集虚拟机的监控数据,比如cpu的使用率、内存的使用率、磁盘io、网络io等基本信息。可以利用这些信息及时调整云平台环境中出现的一些问题,从而实现保证VM的正常运行。
免费试用