GoAlaaa_社区达人页

备案控制台

GoAlaaa

已加入开发者社区2375天

勋章更多

个人头像照片

专家博主

专家博主

个人头像照片

星级博主

星级博主

个人头像照片

技术博主

技术博主

个人头像照片

初入江湖

初入江湖

成就

已发布192篇文章

2条评论

已回答0个问题

0条评论

已发布0个视频

github地址

https://github.com/GoAlers

我关注的人更多

代码bug生产队

代码bug生产队

粉丝更多

游客z65hcr6zw24ae

游客z65hcr6zw24ae

游客3ym4cxnwslang

游客3ym4cxnwslang

aliyun4290304611-28741

aliyun4290304611-28741

游客ks7o4f2qytzii

游客ks7o4f2qytzii

游客2xcxhuhvvxrqg

游客2xcxhuhvvxrqg

游客zswgxx7dthxm6

游客zswgxx7dthxm6

游客yuwvsmjshg3j2

游客yuwvsmjshg3j2

游客2ang5tirofkam

游客2ang5tirofkam

技术能力

兴趣领域

擅长领域

技术认证

暂时未有相关云产品技术能力~

专注大数据与人工智能技术分享，个人博客：https://blog.csdn.net/qq_36816848

精选

文章
问答
视频

暂无更多

暂无更多信息

2022年10月

10.18 18:49:14

发表了文章 2022-10-18 18:49:14

音乐推荐系统

项目描述：利用各类元数据为特征构建推荐系统，使用cb、cf算法做推荐召回，使用redis数据库做缓存处理，结合机器学习LR推荐排序，实现推荐引擎搭建。
10.18 18:45:45

发表了文章 2022-10-18 18:45:45

TF-IDF及相似度计算

TF-IDF：衡量某个词对文章的重要性由TF和IDF组成 TF：词频(因素：某词在同一文章中出现次数) IDF：反文档频率(因素：某词是否在不同文章中出现) TF-IDF = TF*IDF TF ：一个单词在一篇文章出现次数越多越重要 IDF: 每篇文章都出现的单词(如的，你，我，他) ，越不重要
10.18 18:42:54

发表了文章 2022-10-18 18:42:54

大数据组件综合笔记(二)

Hadoop：Hadoop是一个分布式存储和计算框架，具有高可靠, 高扩展, 高容错的特点(数据副本和集群)；由底层HDFS分布式文件系统负责存储，和MapReduce负责分布式计算，以及后续增加的yarn负责资源协调管理。
10.18 18:42:47

发表了文章 2022-10-18 18:42:47

大数据组件综合笔记(一)

Hadoop：Hadoop是一个分布式存储和计算框架，具有高可靠, 高扩展, 高容错的特点(数据副本和集群)；由底层HDFS分布式文件系统负责存储，和MapReduce负责分布式计算，以及后续增加的yarn负责资源协调管理。
10.18 17:35:36

发表了文章 2022-10-18 17:35:36

Kafka常见面试问题（二）

分类专栏： Kafka
10.18 17:35:30

发表了文章 2022-10-18 17:35:30

Kafka常见面试问题(一)

Kafka常见面试问题
10.18 17:29:44

发表了文章 2022-10-18 17:29:44

Flume基础

Flume是数据采集，日志收集的框架，通过分布式形式进行采集,(高可用分布式)
10.18 17:20:14

发表了文章 2022-10-18 17:20:14

Hive调优

Hive调优
10.18 12:36:05

发表了文章 2022-10-18 12:36:05

HBSAE实战总结

HBSAE实践：(先启动zookeeper)
10.18 12:31:32

发表了文章 2022-10-18 12:31:32

Hive综合

Hive主要解决海量结构化日志的数据统计分析，它是hadoop上的一种数据仓库工具，可以将结构化的数据文件映射成一张表，并提供类似于SQL的查询方式，本质上来说是将Hive转化成MR程序。
10.18 12:28:21

发表了文章 2022-10-18 12:28:21

Scala学习笔记总结

Scala学习笔记总结
10.18 12:20:13

发表了文章 2022-10-18 12:20:13

IDEA最全使用教程

IDEA官方文档（强推！！！！）： README - IntelliJ-IDEA-Tutoria
10.18 00:02:07

发表了文章 2022-10-18 00:02:07

Hbase分布式列存储数据库

HBase 本质上是一个数据模型，可以提供快速随机访问海量结构化数据。利用 Hadoop 的文件系统(HDFS)提供的容错能力。它是 Hadoop 的生态系统，使用 HBase 在 HDFS 读取消费/随机访问数据，是 Hadoop 文件系统的一部分。 HBase 是一个面向列的数据库，在表中它由行排序。表模式定义只能列族，也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格值都具有时间戳。总之，在一个 HBase：表是行的集合、行是列族的集合、列族是列的集合、列是键值对的集合。
10.17 23:56:48

发表了文章 2022-10-17 23:56:48

Spark部署模式、任务提交

Spark部署模式与任务提交
10.17 23:49:31

发表了文章 2022-10-17 23:49:31

Java学习笔记基础（下）（二）

基本数据类型对象包装类：是按照面向对象思想将基本数据类型封装成了对象。
10.17 23:49:20

发表了文章 2022-10-17 23:49:20

Java学习笔记基础（下）（一）

基本数据类型对象包装类：是按照面向对象思想将基本数据类型封装成了对象。
10.17 23:28:37

发表了文章 2022-10-17 23:28:37

Java学习笔记基础（上）

1，明确需求。我要做什么？ 2，分析思路。我要怎么做？1,2,3。 3，确定步骤。每一个思路部分用到哪些语句，方法，和对象。 4，代码实现。用具体的java语言代码把思路体现出来。学习新技术的四点： 1，该技术是什么？ 2，该技术有什么特点(使用注意)： 3，该技术怎么使用。demo 4，该技术什么时候用？test。
10.13 12:46:27

发表了文章 2022-10-13 12:46:27

Java学习笔记基础（中）（二）

Java学习笔记基础
10.13 12:45:54

发表了文章 2022-10-13 12:45:54

Java学习笔记基础（中）（一）

Java学习笔记基础
10.13 12:30:17

发表了文章 2022-10-13 12:30:17

Hive数仓基本概念介绍

Hive数仓基本概念介绍
10.12 13:10:14

发表了文章 2022-10-12 13:10:14

Java-HashMap实现原理

数组和链表组合成的链表散列结构，通过hash算法，尽量将数组中的数据分布均匀，如果hashcode相同再比较equals方法，如果equals方法返回false，那么就将数据以链表的形式存储在数组的对应位置，并将之前在该位置的数据往链表的后面移动，并记录一个next属性，来指示后移的那个数据。注意数组中保存的是entry,其中保存的是键值. HashMap可以接受null键值和值，而HashTable则不能；HashMap是非synchronized;HashMap很快；以及HashMap储存的是键值对等等.
10.12 13:06:55

发表了文章 2022-10-12 13:06:55

数据结构思维导图汇总

数据结构思维导图汇总
10.12 13:05:06

发表了文章 2022-10-12 13:05:06

Anaconda基础命令总结

Anaconda基础命令总结
10.12 13:01:40

发表了文章 2022-10-12 13:01:40

zookeeper3.4.5集群安装

zookeeper3.4.5集群安装
10.12 12:57:19

发表了文章 2022-10-12 12:57:19

Zookeeper的Leader选举

Leader选举是保证分布式数据一致性的关键所在。Leader选举分为Zookeeper集群初始化启动时选举和Zookeeper集群运行期间Leader重新选举两种情况。在讲解Leader选举前先了解一下Zookeeper节点4种可能状态和事务ID概念。
10.12 12:55:10

发表了文章 2022-10-12 12:55:10

Hive数据分析实战

有以下几张数据表，请写出Hive SQL语句，实现以下需求。注：分区字段为dt，代表日期。
10.12 12:51:55

发表了文章 2022-10-12 12:51:55

Zookeeper概念介绍

ZooKeeper是一个分布式的，开放源码的，用于分布式应用程序的协调服务。zookeeper服务端有两种模式：单机的独立模式和集群的仲裁模式，所谓仲裁是指一切事件只要满足多数派同意就执行，不需要等到集群中的每个节点反馈才执行。Zookeeper本身也是服从主从架构的，在仲裁模式下会有一个主要的节点作为Leader(领导者)，而其余集群中的节点作为Follower(公民)，对某一事件是否执行，leader都会先征询各个follower的反馈信息再做决定，如果多数派同意，leader就将命令下发到所有的follower去执行。
10.12 12:46:43

发表了文章 2022-10-12 12:46:43

数据结构与算法笔记总结(二)

数据结构与算法笔记总结
10.12 12:46:39

发表了文章 2022-10-12 12:46:39

数据结构与算法笔记总结(一)

数据结构与算法笔记总结
10.12 12:34:46

发表了文章 2022-10-12 12:34:46

Python常用函数总结

Python常用函数总结
10.12 11:17:45

发表了文章 2022-10-12 11:17:45

Mysql常见面试题（二）

如果没有显式定义主键，则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引。
10.12 11:14:23

发表了文章 2022-10-12 11:14:23

Mysql常见面试题（一）

如果没有显式定义主键，则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引。
10.12 11:08:08

发表了文章 2022-10-12 11:08:08

Git常用命令总结

Git常用命令总结
10.12 11:05:17

发表了文章 2022-10-12 11:05:17

Java设计模式介绍

设计模式有两种分类方法，即根据模式的目的来分和根据模式的作用的范围来分。
10.12 11:03:33

发表了文章 2022-10-12 11:03:33

HDFS

HDFS 是一个分布式文件系统，负责文件存储。它的文件系统和平时看到的Linux很像，有目录结构，顶层目录是/，存放着文件，以及可以对文件进行增删，修改，移动等功能，不同的是它具有分布式的特点，hdfs的文件系统可以横跨多个机器，文件可能是存储在不同机器上的，但用户在使用时会被当作是存储在一台机器上。
10.12 10:57:55

发表了文章 2022-10-12 10:57:55

Mapreduce概念及流程介绍

Mapreduce概念及流程介绍
10.12 10:53:35

发表了文章 2022-10-12 10:53:35

Python思维导图框架总结

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。
10.12 10:37:14

发表了文章 2022-10-12 10:37:14

Python学习总结

Python基础
10.12 10:31:18

发表了文章 2022-10-12 10:31:18

Linux命令总结

Linux命令总结
10.12 10:19:48

发表了文章 2022-10-12 10:19:48

Python数据分析（二）：DataFrame基本操作

查看数据(查看对象的方法对于Series来说同样适用)
10.12 10:15:24

发表了文章 2022-10-12 10:15:24

Yarn分布式集群操作系统

Apache Hadoop YARN 是 apache Software Foundation Hadoop的子项目，为分离Hadoop2.0资源管理和计算组件而引入。YARN的诞生缘于存储于HDFS的数据需要更多的交互模式，不单单是MapReduce模式。Hadoop2.0 的YARN 架构提供了更多的处理框架，不再强迫使用MapReduce框架。
10.12 10:09:42

发表了文章 2022-10-12 10:09:42

大数据hadoop常见端口

大数据常见端口汇总
10.12 10:06:31

发表了文章 2022-10-12 10:06:31

大数据各组件环境完整安装

首先安装Centos系统修改网络配置：我的三台机器： master 192.168.179.10 slave1 192.168.179.11 slava2 192.168.179.12 各组件端口号查看： http://www.gaohongwei.cn/530/ CentOS7配置NAT模式网络详细步骤(亲测版) https://blog.csdn.net/Jackson_mvp/article/details/100856966
10.12 10:03:02

发表了文章 2022-10-12 10:03:02

Hadoop常见命令总结

常见基础命令： • 启动Hadoop • 进入HADOOP_HOME目录。 • 执行sh bin/start-all.sh • 关闭Hadoop • 进入HADOOP_HOME目录。 • 执行sh bin/stop-all.sh
10.12 09:53:24

发表了文章 2022-10-12 09:53:24

Python数据分析（一）：Pandas、Numpy

作为python数据分析库，Pandas是基于NumPy数组构建的，使数据预处理、清洗、分析工作变得更快更简单。pandas是专门为处理表格和混杂数据设计的，而NumPy更适合处理统一的数值数组数据。

1

2

3

4

发表了文章 2022-10-24

深度学习系列资料总结(二)
发表了文章 2022-10-21

深度学习系列资料总结(一)
发表了文章 2022-10-21

深度学习知识点全面总结（二）
发表了文章 2022-10-21

深度学习知识点全面总结（一）
发表了文章 2022-10-21

Pytorch学习笔记总结
发表了文章 2022-10-21

机器学习知识点全面总结
发表了文章 2022-10-21

大数据电商数仓分析项目
发表了文章 2022-10-21

大数据开发面试知识点总结（三）
发表了文章 2022-10-21

大数据开发面试知识点总结（二）
发表了文章 2022-10-21

大数据开发面试知识点总结
发表了文章 2022-10-21

Python数据分析与挖掘实战总结(二)
发表了文章 2022-10-21

Python数据分析与挖掘实战总结(一)
发表了文章 2022-10-21

音乐推荐系统（二）
发表了文章 2022-10-21

音乐推荐系统（一）
发表了文章 2022-10-20

大数据电影可视化系统
发表了文章 2022-10-20

论文笔记系列：主干网络（二）-- DenseNet
发表了文章 2022-10-20

论文笔记系列：主干网络（一）-- ResNet
发表了文章 2022-10-20

数学建模笔记总结
发表了文章 2022-10-20

基于PaddleOCR的体检报告识别（二）
发表了文章 2022-10-20

基于PaddleOCR的体检报告识别（一）

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

勋章

关注

粉丝