Spark

首页 标签 Spark
# Spark #
关注
9128内容
Spark Streaming Dynamic Resource Allocation
The goal is to make processing time infinitely close to duration by reducing/increasing resource in spark streaming . And we also hope having a reas
MySQL因不能创建 PID 导致无法启动的解决办法
MySQL 启动报错信息如下: Starting mysqld (via systemctl): Job for mysqld.service failed because the control process exited with error code. See "systemctl status mysqld.service" and "journalctl -xe" for details、 [FAILED] 根据提示,使用 systemctl status mysqld.service 和 journalctl -xe 查看服务启动失败的原因。
基于Spark的机器学习实践 (十) - 降维
通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。
基于分布式的短文本命题实体识别之----人名识别(python实现)
目前对中文分词精度影响最大的主要是两方面:未登录词的识别和歧义切分。 据统计:未登录词中中文姓人名在文本中一般只占2%左右,但这其中高达50%以上的人名会产生切分错误。在所有的分词错误中,与人名有关的错误占到了将近90%,这中国人名都是根据人的想法起的名字,有很大的随意性,并且数量巨大,规律也不尽相同。
Spark Tungsten in-heap / off-heap 内存管理机制
这篇文章具体描述了Spark Tungsten project 引入的新的内存管理机制,并且描述了一些使用细节。
免费试用