Scala 03 —— Scala OOP Extension

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: Scala OOP 拓展

image.png

image.png

Scala 2.1 —— Scala OOP Extension

一、正则

@[TOC]

1.1 Java正则和Scala正则的区别
  • Java调用的主体是字符串,Scala调用的主体是正则对象
1.2 Java正则和Scala正则的的基本知识点
Java正则
public static void main(String[] args) {
   
   
  // 匹配
  String regex = "\\d+";
  String content1 = "123";
  System.out.println(content1.matches(regex)); // true, 因为"123"完全由数字组成

  // 替换
  String content2 = "123,avc,$%#";
  System.out.println(content2.replaceAll(regex, "")); // ",avc,$%#", 将所有数字替换为空字符串
  System.out.println(content2.replaceFirst(regex, "")); // ",avc,$%#", 将第一个数字序列替换为空字符串

  // 分割
  String content3 = "123,asd,#$,456";
  System.out.println(content3.split("[^0-9]+").toString()); // 打印的是数组对象的内存地址, 如"[Ljava.lang.String;@15db9742"

  // 分组
  final Pattern cp1 = Pattern.compile("([a-z]+.*?\\d+)");
  final Pattern cp2 = Pattern.compile("([a-z]+):(\\d+)");
  String scores = "java:88,mysql:a99,hadoop:82,spark:91";
  final Matcher mt1 = cp1.matcher(scores);
  while (mt1.find()){
   
   
    final String score = mt1.group(0);
    final Matcher mt2 = cp2.matcher(score);
    if(mt2.find()){
   
   
      System.out.println(mt2.group(1) + "->" + mt2.group(2)); // "java->88", "hadoop->82", "spark->91"
    }
  }
}
Scala正则
// 初始化正则表达式
val regexStr: String = "\\d+"
val regex: Regex = regexStr.r

// 字符串匹配
val content = "123"
println(content.matches(regexStr)) // 输出:true

// 字符串分割
val content4 = "123,87,xy,921"
content4.split("[^0-9]+").foreach(println) // 输出分割后的数字:123, 87, 921

// 字符串替换
// 替换字符串中的第一个匹配项:
val content3 = "123,87,xy,921"
println(regex.replaceFirstIn(content3, "66")) // 输出:66,87,xy,921


// 替换所有符合正则的对象,匹配到就替换,没有匹配到就不替换,返回类型是Option[String]
println(regex.replaceSomeIn(content3, mat => Some((mat.group(0).toInt + 1).toString)))

// 替换所有符合正则的对象,匹配到就替换,没有匹配到就不替换,返回类型是String
println(regex.replaceAllIn(content3, mat => (mat.group(0).toInt + 1).toString))

// 模式匹配
val content = "123,456,789"
val regex = "(\\d+),(\\d+),(\\d+)".r
println(content match {
  case regex(a, b, c) => (a.toInt + 1, b.toInt + 1, c.toInt + 1)
})// 如果content2符合regex2的模式,regex2(a,b,c,d)会提取四个字符串,并且存放到变量a,b,c,d中;匹配成功后,将这四个字符串变量转换为整数+1。

// 分组
val pat = "([a-zA-Z]+):(\\d+)".r // 边界(粗略提取整体)
val patIn = "([a-zA-Z]+):(\\d+)".r // 正则构成(提取细则)
val scores = "java:88,mysql:99,hadoop:82,spark:91";

// 提取第一个符合正则的对象
val opt: Option[String] = pat.findFirstIn(scores)
println(opt.get) // java:88
// 提取所有符合正则的对象
val it: Regex.MatchIterator = pat.findAllIn(scores)
println(it.mkString(","))  // 输出:java:88,mysql:99,hadoop:82,spark:91

// 提取第一个符合正则的对象,且该对象可以按组匹配
val mat: Option[Regex.Match] = patIn.findFirstMatchIn(scores)
val str: String = mat.get.group(1)
val str2: String = mat.get.group(2)
println(str + ":" + str2)// 输出:java:88

// 提取出所有符合正则且可按组匹配的对象构成一个迭代器
val mats: Iterator[Regex.Match] = patIn.findAllMatchIn(scores)
mats.map(m=>{
  val subject: String = m.group(1)
  val score: String = m.group(2)
  (subject,score)
}).foreach(println)// 依次输出:(java,88), (mysql,99), (hadoop,82), (spark,91)
1.3 练习
练习一:使用正则表达式解析日志

现有如下日志信息,请使用scala正则表达式解析如下信息:
日志级别
日期
请求URI

INFO 2016-07-25 requestURI:/c?app=0&p=1&did=18005472&industry=469&adid=31
INFO 2016-07-26 requestURI:/c?app=0&p=2&did=18005473&industry=472&adid=31
INFO 2016-07-27 requestURI:/c?app=0&p=1&did=18005474&industry=488&adid=32
方法一:使用findAllMatchIn方法提取出所有符合正则且可按组匹配的对象构成一个迭代器,后通过map方法将每一行中符合的部分提取出来构成元组。
val logs = "INFO 2016-07-25 requestURI:/c?app=0&p=1&did=18005472&industry=469&adid=31\n" +
  "INFO 2016-07-26 requestURI:/c?app=0&p=2&did=18005473&industry=472&adid=31\n" +
  "INFO 2016-07-27 requestURI:/c?app=0&p=1&did=18005474&industry=488&adid=32"
val pat = "(INFO|WARN|ERROR) ([0-9]{4}-[0-9]{2}-[0-9]{2}) requestURI:(.*)".r
val it = pat.findAllMatchIn(logs)
it.map(m=>{
  val level: String = m.group(1)
  val date: String = m.group(2)
  val uri: String = m.group(3)
  (level,date,uri)
}).foreach(println)
/* 输出:
(INFO,2016-07-25,/c?app=0&p=1&did=18005472&industry=469&adid=31)
(INFO,2016-07-26,/c?app=0&p=2&did=18005473&industry=472&adid=31)
(INFO,2016-07-27,/c?app=0&p=1&did=18005474&industry=488&adid=32)
*/
方法二:使用collect方法在传入的偏函数中构造模式匹配,将匹配的部分提取出来构成元组
val regex = "(INFO|WARN|ERROR) (\\d{4}-\\d{2}-\\d{2}) requestURI:(.*)".r
Array(
  "INFO 2016-07-25 requestURI:/c?app=0&p=1&did=18005472&industry=469&adid=31",
  "INFO 2016-07-26 requestURI:/c?app=0&p=2&did=18005473&industry=472&adid=31",
  "INFO 2016-07-27 requestURI:/c?app=0&p=1&did=18005474&industry=488&adid=32",
  "WRONG 2016-07-26 requestURI:/c?app=0&p=2&did=18005473&industry=472&adid=31"
).collect({
  case regex(level,date,uri) => (level,date,uri)
}).foreach(println)

/* 输出:
(INFO,2016-07-25,/c?app=0&p=1&did=18005472&industry=469&adid=31)
(INFO,2016-07-26,/c?app=0&p=2&did=18005473&industry=472&adid=31)
(INFO,2016-07-27,/c?app=0&p=1&did=18005474&industry=488&adid=32)
*/
练习二:提取字符串的每组数据
val scores = "java:88,mysql:99,hadoop:82,spark:91"
val regex: Regex = "([a-z]+):(\\d+)".r
val it: Iterator[Regex.Match] = regex.findAllMatchIn(scores)
it.foreach(mat => println(mat.group(1),mat.group(2).toInt))
/*
(java,88)
(mysql,99)
(hadoop,82)
(spark,91)
*/
val scores = "java:88,mysql:99,hadoop:82,spark:91"
val pat1: Pattern = Pattern.compile("([a-z]+.*?\\d+)")
val pat2: Pattern = Pattern.compile("([a-z]+):(\\d+)")
val mat1: Matcher = pat1.matcher(scores)
while(mat1.find()){
  val score: String = mat1.group(0)
  val mat2: Matcher = pat2.matcher(score)
  if(mat2.find()){
    println((mat2.group(1), mat2.group(2)))
  }
}

二、隐式类

隐式类允许你向已存在的类型添加新的方法,是一种便捷的方式在不修改源代码的情况下扩展类的功能。

  1. 定义
    • 隐式类通常用于扩展某个类型的功能。它们通过隐式转换将原始类型转换为提供额外方法的新类型。
  2. 约束条件
    • 位置:隐式类必须定义在==类、trait或者对象==(包括单例对象和包对象)内部。
    • 构造器参数:隐式类的主构造器==必须且只能有一个非隐式参数。==这个参数是被扩展的类型,隐式类将为这个类型添加新的功能。
    • 非case类:==隐式类不能是case类。==Scala的case类用于模式匹配和简化数据类的创建,但隐式类用途不同,它主要用于类型转换和扩展功能。
    • 唯一性:在定义隐式类的同一作用域内,==不能有与之同名的其他方法、成员或对象。==
// 字符串的方法扩展,而在 Java 中 String 是final的,无法扩展
implicit class StrExt(str:String){
    def incr() = str.map(c=>(c+1).toChar)
    def isEmail = str.matches("\\w+@[a-z0-9]{2,10}\\.(com(.cn)?|cn|edu|org)")
}

val a:String = "12665473@qq.com"
val incr: String = a.incr
val isEmail: Boolean = a.isEmail

三、异常

3.1.Java的基本异常处理结构
try-catch-finally
private static void close(AutoCloseable...acs){
   
   
  for (AutoCloseable ac : acs) {
   
   
    if (Objects.nonNull(ac)) {
   
   
      try {
   
   
        ac.close();
      } catch (Exception e) {
   
   
        e.printStackTrace();
      }
    }
  }
}

try{
   
   
  // 可能抛出异常的代码块
  BufferedReader reader = new BufferedReader(new FileReader("test.txt"));
  System.out.println(reader.readLine());
} catch(IOException ex) {
   
   
  // 异常的捕获和处理
  System.err.println("An IOException occurred: " + ex.getMessage());
} finally{
   
   
  // 无论是否发生异常,都会执行的代码块,通常用于释放资源
  close(reader);
}
try-with-resources
try (BufferedWriter writer = new BufferedWriter(new FileWriter("test.txt"))) {
   
   
  // 使用资源,该资源必须extends AutoCloseable
  // try块中的`BufferedWriter`在代码块执行完毕后会自动关闭,不需要再通过finally关闭资源
  writer.write("Hello World");
} catch (IOException ex) {
   
   
  // 异常的捕获和处理
  System.err.println("An IOException occurred: " + ex.getMessage());
}
对比

try-catch-finallyfinally不仅可以关闭资源,还可以用于执行其他代码块。

try-with-resources资源会立即被关闭,InputStream,OutputStream,Reader,Writer等均实现了该接口。

try-with-resources优先于try-catch-finally,因为可能会存在finally延迟。

3.2.Scala的异常处理机制

3.2.1 异常数据类型

Option类型

使用Option类型可以在函数无法返回有效结果时,返回None,而不是抛出异常。

def divideOption(a:Int,b:Int):Option[Int] = {
  try {
    Some(a/b)
  }catch {
    case _ : ArithmeticException => None
  }
}
Either类型

Either类型通常用于函数可能返回两种类型的结果,其中Left通常用于错误或异常,Right用于正常值。

Either[String, Int]需要包含两种数据类型的原因是需要同时兼容``Right[Nothing,Int]Left[String,Nothing]的类型。

def divideEither(a: Int, b: Int): Either[String, Int] = {
  try {
    Right(a / b)
  }:Right[Nothing,Int] catch {
    case _: ArithmeticException => Left("divide by zero"):Left[String,Nothing]
  }
}
Try类型

Try 是一个代表可能会成功或失败的操作的容器类型。Success表示操作成功,Failure表示操作失败。

Failure需要一个Throwable对象作为参数。

def divideTry(a: Int, b: Int): Try[Int] = {
  try {
    Success(a / b)
  } catch {
    case _: ArithmeticException => Failure(new Exception("divide by zero"))
  }
}
值获取方式

Option 类型:getOrElse()

EitherTry 类型:模式匹配

val either: Either[Int, String] = Left(404)

val errorInfo = either match {
  case Left(err) => s"发生错误,错误码:$err"
  case Right(value) => s"操作成功,结果为:$value"
}
// 这会返回:"发生错误,错误码:404"
import scala.util.{Try, Success, Failure}

val attempt = Try { Integer.parseInt("abc") }

val result = attempt match {
  case Success(value) => s"转换成功,结果为:$value"
  case Failure(ex) => s"转换失败,错误信息:${ex.getMessage}"
}
// 这会返回:"转换失败,错误信息:For input string: "abc""

3.2.2 模式匹配

catch的模式匹配
try {
  // 可能抛出异常的代码块
  val result = 10 / 0
} catch {
  // 捕获异常的格式是:case e:XxxException => ...
  case ex: ArithmeticException => println("ArithmeticException occurred")
  case ex: NullPointerException => println("NullPointerException occurred")
  case ex: Exception => println("Other exception occurred: " + ex.getMessage)
}
3.3.Scala的异常控制工具
allCatch工具
  • opt: 将异常转换为Option
  • withTry: 将结果包装在Try
  • either: 将异常或结果包装在Either
import scala.util.control.Exception.allCatch

def divideOpt(a: Int, b: Int) = allCatch.opt(a / b)
def divideWithTry(a: Int, b: Int) = allCatch.withTry(a / b)
def divideEither(a: Int, b: Int) = allCatch.either(a / b)
failAsValue工具
  • failAsValue允许你指定某种异常类型,并在捕获到该异常时返回一个默认值。
import scala.util.control.Exception.failAsValue

def divideFail(a: Int, b: Int) = failAsValue(classOf[ArithmeticException])(-1)(a / b)

四、类型信息处理

4.1 定义类和子类
case class Text(author: String, title: String, price: Float)

class TextSon(level: String,
         override val author: String,
         override val title: String,
         override val price: Float)
extends Text(author, title, price) {
    val _level: String = level
    override def toString() = s"TextSon{${super.toString}, ${_level}}"
}

添加新的属性后如何重新toString()方法?

override def toString() = s"TextSon{${super.toString}, ${_level}}"
4.2 实例化和使用
val obj: Text = new TextSon("TOP", "The Wild Roaring", "张培元", 86.32f)
4.3 类型判断和检查

进行类型判断,检查obj是否是TextSon类型的实例

val isIns: Boolean = obj.isInstanceOf[TextSon]

进行类型转换,需要通过allCatch.opt()进行异常处理

val safeSon: Option[TextSon] = allCatch.opt(obj.asInstanceOf[TextSon])
println(opt.getOrElse("转换失败"))

image.png

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
7月前
|
机器学习/深度学习 JSON Java
Scala 02——Scala OOP
Scala 是一种纯粹的面向对象编程(OOP)语言,它不支持基本类型,所有数据都作为对象处理,即使在JVM上运行也会自动处理拆装箱。Scala 不包含静态关键字,其“静态”概念体现在类型系统和单例对象中,类型检查都在编译时完成。类型推断、类型预定和动静结合是其特点,例如,Scala 支持协变和逆变,使得泛型编程更加灵活。此外,Scala 的类、继承、抽象类、单例对象和泛型等特性提供了丰富的编程模型。例如,单例对象可以看作静态成员的替代品,同时具备惰性初始化和与类的绑定关系。
67 1
Scala 02——Scala OOP
|
Java Scala
scala 学习笔记(06) OOP(下)多重继承 及 AOP
一、多继承 上篇trait中,已经看到了其用法十分灵活,可以借此实现类似"多重继承"的效果,语法格式为: class/trait A extends B with C with D ... 之所以要给多重继承加一个引号,是因为这有约束条件的,上面的语法中,从左向右看,extends 后的B是A...
1245 0
|
Java Scala
scala 学习笔记(05) OOP(中)灵活的trait
trait -- 不仅仅只是接口! 接上回继续,scala是一个非常有想法的语言,从接口的设计上就可以发现它的与众不同。scala中与java的接口最接近的概念是trait,见下面的代码: package yjmyzz object App { def main(args...
947 0
|
Java Scala C#
scala 学习笔记(04) OOP(上)主从构造器/私有属性/伴生对象(单例静态类)/apply方法/嵌套类
一、主从构造器 java中构造函数没有主、从之分,只有构造器重载,但在scala中,每个类都有一个主构造器,在定义class时,如果啥也没写,默认有一个xxx()的主构造器 class Person { var name: String = _ /** * 从构造...
1185 0
|
2月前
|
分布式计算 大数据 Java
大数据-87 Spark 集群 案例学习 Spark Scala 案例 手写计算圆周率、计算共同好友
大数据-87 Spark 集群 案例学习 Spark Scala 案例 手写计算圆周率、计算共同好友
51 5
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
51 3
|
2月前
|
消息中间件 分布式计算 NoSQL
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
42 0
|
2月前
|
消息中间件 存储 分布式计算
大数据-103 Spark Streaming Kafka Offset管理详解 Scala自定义Offset
大数据-103 Spark Streaming Kafka Offset管理详解 Scala自定义Offset
93 0
|
2月前
|
分布式计算 大数据 Java
大数据-86 Spark 集群 WordCount 用 Scala & Java 调用Spark 编译并打包上传运行 梦开始的地方
大数据-86 Spark 集群 WordCount 用 Scala & Java 调用Spark 编译并打包上传运行 梦开始的地方
27 1
大数据-86 Spark 集群 WordCount 用 Scala & Java 调用Spark 编译并打包上传运行 梦开始的地方
|
2月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
41 0