Byyyi_社区达人页

个人头像照片
Byyyi
已加入开发者社区265

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
初入江湖
初入江湖

成就

已发布60篇文章
18条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
  • Java
  • SQL
  • 数据建模
  • Linux
  • 大数据
擅长领域
技术认证

暂时未有相关云产品技术能力~

计算机科学与技术在读大二,自学大数据,希望和小伙伴们一起进步!

暂无精选文章
暂无更多信息

2024年05月

  • 05.06 08:16:55
    发表了文章 2024-05-06 08:16:55

    【科研入门】评价指标AUC原理及实践

    该文介绍了二分类问题的评估指标,特别是AUC的概念和重要性。文章首先讲解了混淆矩阵,包括TP、FP、FN和TN的含义,然后讨论了准确率、精确率和召回率,并指出它们在处理不平衡数据集时的局限性。接着,作者解释了阈值对分类结果的影响以及如何通过调整阈值平衡精确率和召回率。最后,文章重点介绍了ROC曲线和AUC,说明AUC作为衡量模型性能的无参数指标,其值越接近1表示模型性能越好。AUC可以通过计算ROC曲线下的面积或比较样本对的预测得分来求得。
  • 05.06 08:14:56
    发表了文章 2024-05-06 08:14:56

    解决Pycharm安装后无法导入库的问题

    解决Pycharm导入库问题:进入Settings,选择Project的`Python Interpreter`,点击Add Interpreter。删除`.venv`文件夹内容,然后关闭并重启Pycharm以初始化新环境,现在可以正常导入库了。
  • 05.06 08:05:02
    发表了文章 2024-05-06 08:05:02

    Spark安装教程

    该教程详细介绍了在Linux环境下安装Spark 3.1.2的步骤。首先,检查JDK版本需为1.8。接着,下载Spark资源并设置环境变量`SPARK_HOME`。配置`spark-env.sh`和`yarn-site.xml`文件,禁用内存检查。然后,重启Hadoop集群,启动Spark集群,并通过`jps -ml`检查Spark Master和Worker。可以通过Web UI访问Spark状态,并使用`spark-shell`测试Scala交互环境及Spark on Yarn。最后,学习如何关闭Spark集群。
  • 05.06 08:03:27
    发表了文章 2024-05-06 08:03:27

    Scala 02——Scala OOP

    Scala 是一种纯粹的面向对象编程(OOP)语言,它不支持基本类型,所有数据都作为对象处理,即使在JVM上运行也会自动处理拆装箱。Scala 不包含静态关键字,其“静态”概念体现在类型系统和单例对象中,类型检查都在编译时完成。类型推断、类型预定和动静结合是其特点,例如,Scala 支持协变和逆变,使得泛型编程更加灵活。此外,Scala 的类、继承、抽象类、单例对象和泛型等特性提供了丰富的编程模型。例如,单例对象可以看作静态成员的替代品,同时具备惰性初始化和与类的绑定关系。
  • 05.06 08:01:35
    发表了文章 2024-05-06 08:01:35

    Scala 04 —— Scala Puzzle 拓展

    Scala 程序设计探讨了占位符、模式匹配、继承中的成员声明、默认值与重载以及集合操作的一致性。示例展示了 `_` 占位符在函数简洁性上的应用,同时指出它不等同于箭头函数,因为函数体内的副作用可能不同。另外,解释了变量与常量模式,以及在继承中字段初始化的顺序。在集合操作中,`for`循环与`map`的区别在于`for`会过滤不符合模式的元素,而`map`则会引发错误。最后,讨论了如何确保集合类型在操作中保持一致。
  • 05.06 07:59:36
    发表了文章 2024-05-06 07:59:36

    Scala 05 —— 函数式编程底层逻辑

    Scala讲座探讨了函数式编程的底层逻辑,强调无副作用和确定性。函数式编程的核心是纯函数,避免读写数据等副作用,将其移至代码边缘处理。函数输入输出应清晰定义,避免模糊参数。函数视为数据范畴间的映射,以范畴论为基础。业务逻辑转化为纯函数式,通过声明式编程实现解耦,关注输入输出而非过程,便于验证和自动编程。将业务逻辑视作流水线,每个函数处理数据,避免全局变量和`var`,优先确保正确性再优化效率。
  • 05.06 07:54:50
    发表了文章 2024-05-06 07:54:50
  • 05.06 07:53:00
    发表了文章 2024-05-06 07:53:00

    Scala应用 —— JDBC的创建

    这篇文章介绍了如何使用Scala实现JDBC连接。首先,通过在pom.xml添加MySQL JDBC驱动依赖,然后使用`Class.forName()`加载驱动,接着创建连接对象。初始化执行器涉及创建执行器对象和设置参数。执行操作时,根据DML(数据修改语言)和DQL(数据查询语言)返回不同结果。文章提出了一个柯里化的`jdbc`函数,以处理不同操作步骤和多类型结果。结果类型通过枚举和抽象类`Three`的子类来表示,包括异常、DML影响行数和DQL查询结果。最后,展示了`jdbc`方法的实现,以及如何处理结果并转换为具体对象。代码示例中,查询结果被转换为`Test`对象数组并打印。
  • 05.06 07:50:27
    发表了文章 2024-05-06 07:50:27

    ZooKeeper详解

    ZooKeeper是大数据组件中的协调器,确保高可用性和一致性。它用于监控主备节点切换(如Hadoop YARN的ResourceManager,HBase的RegionServer,Spark的Master)并实现数据同步。设计基于文件系统和通知机制,通过Znodes的状态变化(创建、删除、更新、子节点变化)进行协调。ZooKeeper使用观察者模式,当Znode变化时,通知客户端。其数据结构为树形,提供CLI工具如`zkCli.sh`进行交互。ZooKeeper有三个默认端口:2181(客户端连接),2888(服务器间同步),3888(选举)。选举采用半数机制,确保集群稳定性。
  • 05.06 07:48:32
    发表了文章 2024-05-06 07:48:32

    MySQL常见问题解决和自动化安装脚本

    这篇内容包含了两个主要部分:解决MySQL登录问题和处理GPG密钥问题。当MySQL密码正确但无法登录时,可以通过执行SQL命令`ALTER USER`和`flush privileges`来修改和重置密码。对于MySQL安装时的GPG密钥错误,首先需要强制删除旧的MySQL仓库包,导入新的GPG公钥,然后安装MySQL服务器。如果遇到GPG检查错误,可以使用`--nogpgcheck`参数忽略检查来安装。最后,提供了一个自动化安装MySQL的脚本,用于检查旧版本、卸载残留、安装MySQL8并启动服务。
  • 05.06 07:47:06
    发表了文章 2024-05-06 07:47:06
  • 发表了文章 2024-05-15

    数据的格式与描述

  • 发表了文章 2024-05-15

    函数式 Scala的重要基础!一文掌握!

  • 发表了文章 2024-05-15

    【史上最全】Hadoop精选18道面试题(附回答思路)

  • 发表了文章 2024-05-15

    Linux笔记01 —— Linux初识与Shell汇总(请配合另一篇《Linux笔记02》一起使用)

  • 发表了文章 2024-05-15

    Linux笔记02 —— Shell补充

  • 发表了文章 2024-05-15

    Hive 拉链表详解及实例

  • 发表了文章 2024-05-15

    Hive 优化总结

  • 发表了文章 2024-05-15

    Hive 行列转换

  • 发表了文章 2024-05-15

    Hive实战 —— 电商数据分析(全流程详解 真实数据)

  • 发表了文章 2024-05-15

    实现HBase表和RDB表的转化(附Java源码资源)

  • 发表了文章 2024-05-15

    【经验分享】如何快速转化笔记格式为标准的MarkDown格式并进行博客发布,提高生产力?

  • 发表了文章 2024-05-15

    何时需要指定泛型:Scala编程指南

  • 发表了文章 2024-05-15

    【经验分享】如何在IDEA中快速学习|审查|复习代码工程?

  • 发表了文章 2024-05-15

    Scala 03 —— Scala OOP Extension

  • 发表了文章 2024-05-15

    Scala 05 —— 函数式编程底层逻辑

  • 发表了文章 2024-05-15

    Scala 04 —— Scala Puzzle 拓展

  • 发表了文章 2024-05-15

    异常详解,一文搞懂!

  • 发表了文章 2024-05-15

    一文搞懂线程!!

  • 发表了文章 2024-05-15

    【经验分享】用Linux脚本管理虚拟机下的大数据服务

  • 发表了文章 2024-05-15

    Hive UDF UDTF UDAF 自定义函数详解

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息