Scala学习笔记(八) 模式匹配

简介: Scala学习笔记(八) 模式匹配

1. 模式匹配简介



模式匹配是 Scala 的重要特性之一,前面两篇笔记Scala学习笔记(六) Scala的偏函数和偏应用函数Scala学习笔记(七) Sealed Class 和 Enumeration都是为了这一篇而铺垫准备的。


在jdk1.7之前,Java的 switch 关键字只可以处理原生类型(int 、short 、byte 、char)和枚举类型。在jdk1.7以后,switch新增了对String类型的处理。Scala 虽然没有switch关键词,但是它的模式匹配可以看做是 switch 的加强版,能够处理更加复杂的类型和场景。


先来看一个简单的例子。

scala> def judgeGrade(name:String,grade:String) {
     |   grade match {
     |     case "A" => println(name+", you are excellecnt")
     |     case "B" => println(name+", you are good")
     |     case "C" => println(name+", you are just so so")
     |     case _ if name == "Tony" => println(name+", you are a good boy,come on")
     |     case _ => println("you need to work harder")
     |   }
     | }
judgeGrade: (name: String, grade: String)Unit
scala> judgeGrade("Monica","A")
Monica, you are excellecnt
scala> judgeGrade("Lily","B")
Lily, you are good
scala> judgeGrade("Tom","C")
Tom, you are just so so
scala> judgeGrade("Tony","D")
Tony, you are a good boy,come on
scala> judgeGrade("Jacky","D")
you need to work harder


通过这个例子,可以看到模式匹配的语法大致是这样的。

变量 match { 
  case 值1 => 代码
  case 值2 => 代码
  ...
  case 值N if (...) => 代码
  case _ => 代码
}


注意,case后面的值1到值N,可以是相同类型也可以是不同类型的。


if (...) 是守卫条件,后面的例子会看到。


在最后一行指令中_是一个通配符,它保证了我们可以处理所有的情况。否则当传进一个不能被匹配的值的时候,你将获得一个运行时错误。


2. 模式匹配类型



Scala的模式匹配可以支持常量模式、变量模式、序列模式、元组模式、变量绑定模式等等。


2.1常量匹配


case 后面的值是常量。

scala> def matchConstant(x:Any) = x match {
     |   case 1 => "One"
     |   case "two" => "Two"
     |   case "3" => "Three"
     |   case true => "True"
     |   case null => "null value"
     |   case Nil => "empty list"
     |   case _ => "other value"
     | }
matchConstant: (x: Any)String
scala> println(matchConstant(1))
One
scala> println(matchConstant(true))
True
scala> println(matchConstant(null))
null value
scala> println(matchConstant(List()))  //匹配到Nil
empty list
scala> println(matchConstant(false))
other value


特别需要注意的是,Nil是一个空的List,定义为List[Nothing]。iOS开发者会比较熟悉Nil,但是这里的Nil跟OC中的Nil是两个完全不同的概念。


2.2 变量匹配


case 后面的值是变量

scala> def matchVariable(x:Any) = x match {
     |    case x if(x==1) => x
     |    case x if(x=="Tony") => x
     |    case x:String => "other value:" + x
     |    case _ => "unexpected value:"+x
     | }
matchVariable: (x: Any)Any
scala> println(matchVariable(1))
1
scala> println(matchVariable("Tony"))
Tony
scala> println(matchVariable("Scala"))
other value:Scala
scala> println(matchVariable(2))
unexpected value:2


2.3 序列匹配


case 后面的值是数组、List、Range等集合。

scala> def matchSeq(x:Any) = x match {
     |    case List("Tony",_,_*) => "Tony is in the list"
     |    case List(_,second,_*) => "The second is:"+second
     |    case Array(first,second,_*) => "first:"+first+",second:"+second
     |    case _ => "Other seq"
     | }
matchSeq: (x: Any)String
scala> val list1 = List("Tony","Cafei","Aaron")
list1: List[String] = List(Tony, Cafei, Aaron)
scala> val list2 = "android"::"iOS"::"H5"::Nil
list2: List[String] = List(android, iOS, H5)
scala> val array1 = Array("Hadoop","Spark","ES")
array1: Array[String] = Array(Hadoop, Spark, ES)
scala> val array2 = Array("Scala")
array2: Array[String] = Array(Scala)
scala> println(matchSeq(list1))
Tony is in the list
scala> println(matchSeq(list2))
The second is:iOS
scala> println(matchSeq(array1))
first:Hadoop,second:Spark
scala> println(matchSeq(array2))
Other seq


需要注意的是,

val list2 = "android"::"iOS"::"H5"::Nil


看上去很奇怪,其实等价于

val list2 = List("android","iOS","H5")


list分为head和tail两个部分,head是list的第一个元素,tail是list中除了head外的其余元素组成的list。用::连接list时,尾节点要声明成Nil。


所以呢,在case后面可以使用::的形式,例如:

scala> def matchSeq2(x:Any) = x match {
     |   case x::y::Nil => x+" "+y
     |   case _ => "Something else"
     | }
matchSeq2: (x: Any)String
scala> val list3 = List(1,2)
list3: List[Int] = List(1, 2)
scala> println(matchSeq2(list2))
Something else
scala> println(matchSeq2(list3))
1 2


2.4 元组匹配


case 后面的值是元组类型。

scala> def matchTuple(x:Any) = x match {
     |    case (first,_,_) => first
     |    case _ => "Something else"
     | }
matchTuple: (x: Any)Any
scala> val t = ("Tony","Cafei","Aaron")
t: (String, String, String) = (Tony,Cafei,Aaron)
scala> println(matchTuple(t))
Tony


值得注意的是,在元组模式中不能使用_*来匹配剩余的元素,_*只适用于序列模式。


2.5 类型匹配


它可以匹配输入待匹配变量的类型。

scala> def matchType(x:Any) = x match {
     |   case s:String => "the string length is:"+s.length
     |   case m:Map[_,_] => "the map size is:"+m.size
     |   case _:Int | _:Double => "the number is:"+x
     |   case _ => "unexpected value:"+x
     | }
matchType: (x: Any)String
scala> println(matchType("test"))
the string length is:4
scala> println(matchType(1))
the number is:1
scala> println(matchType(1.0d))
the number is:1.0
scala> println(matchType(true))
unexpected value:true
scala> val map = Map("one"->1,"two"->2,"three"->3)
map: scala.collection.immutable.Map[String,Int] = Map(one -> 1, two -> 2, three -> 3)
scala> println(matchType(map))
the map size is:3


在这里,case 子句支持"或"逻辑,使用|即可。


如果上述代码使用Java来改写的话,需要不断地使用instanceof来做判断类型。


类型擦除(Type erasure)


上面的类型模式示例中的Map部分,其实只是匹配了该变量是否为Map类型,并没有匹配其中的key和value的类型。如果同时需要匹配精确的key和value的类型的话,例如下面代码中匹配key和value都是Int类型的Map,会提示警告。

scala> def isIntIntMap(x: Any) = x match {
     |   case m: Map[Int, Int] => true
     |   case _ => false
     | }
<console>:12: warning: non-variable type argument Int in type pattern scala.collection.immutable.Map[Int,Int] (the underlying of Map[Int,Int]) is unchecked since it is eliminated by erasure
         case m: Map[Int, Int] => true
                 ^
isIntIntMap: (x: Any)Boolean


由于Scala 使用了泛型的类型擦除模式,代码在运行时会将类型参数忽略掉。所以上面的代码在运行时并不能去判断当前Map对象的key和value类型是否为Int或其他类型。

scala> isIntIntMap(Map(1->1))
res10: Boolean = true
scala> isIntIntMap(Map("string"->"value"))
res11: Boolean = true


但是Array不会类型擦除,可以指定Array对象中元素的类型。


2.6 变量绑定匹配


可以将匹配的对象绑定到变量上。首先写一个变量名,然后写一个@符号,最后写入该匹配的对象。如果匹配成功,则将变量设置为匹配的对象。

scala> case class Person(name: String, age: Int)
defined class Person
scala> val person = Person("Tony",18)
person: Person = Person(Tony,18)
scala> person match {
     |   case p @Person(_,age) => println(s"${p.name},age is $age")
     |   case _ => println("Not a person")
     | }
Tony,age is 18


3. 模式匹配和Case Class



Case Class在Scala学习笔记(四) 类的初步中有提到。


3.1构造器模式匹配


case 后面的值是类构造器。

scala> case class Person(name:String,age:Int)
defined class Person
scala> val tony = Person("Tony",18)
tony: Person = Person(Tony,18)
scala> val monica = Person("Monica",15)
monica: Person = Person(Monica,15)
scala> val tom = Person("Tom",20)
tom: Person = Person(Tom,20)
scala> def matchConstructor(x:Any) = x match {
     |    case Person("Tony",18) => println("Hi Tony")
     |    case Person("Monica",15)=> println("Hi Monica")
     |    case Person(name,age) => println(s"Who are you,$age year-old person named $name?")
     | }
matchConstructor: (x: Any)Unit
scala> matchConstructor(tony)
Hi Tony
scala> matchConstructor(monica)
Hi Monica
scala> matchConstructor(tom)
Who are you,20 year-old person named Tom?


如果在类中声明了与该类相同的名字的 object 则该object 是该类的“伴生对象”。伴生对象有一个apply()用于构造对象,跟apply()对偶的是unapply()用于提取和“解构”。上面例子的匹配,就是用了Person.unapply(...)。


Person类是case class,创建时就帮我们实现了一个伴生对象,这个伴生对象里定义了apply()和unapply()。


3.2 Sealed Class的模式匹配


使用Sealed Class能保证所有的匹配情况都列举出来。


其实,在Scala学习笔记(七) Sealed Class 和 Enumeration中,已经提到了Sealed Class的模式匹配


4.模式匹配的其他用法



模式匹配并不仅仅局限于case语句。在定义变量时,也可以使用模式匹配。


例如:

scala> val (x,y) = (1,2)
x: Int = 1
y: Int = 2


4.1 for循环中使用


foreach方法

scala> for (i<-List("Java","Scala","Kotlin","Groovy"))
     |    println(i)
Java
Scala
Kotlin
Groovy


变量绑定,相当于给Scala设置别名index

scala> for(index@"Scala" <- List("Java","Scala","Kotlin","Groovy"))
     |   println(index)
Scala


条件表达格式

scala> for((language,"Hadoop") <- Set("Scala" -> "Spark","Java" -> "Hadoop")){
     |   println(language)
     | }
Java


4.2 正则表达式中使用

scala> val pattern="(S|s)cala".r
pattern: scala.util.matching.Regex = (S|s)cala
scala> val str="Scala is scalable and cool language"
str: String = Scala is scalable and cool language
scala> println(pattern findFirstIn str)
Some(Scala)
scala> println((pattern findAllIn str).mkString(", "))
Scala, scala
scala> println(pattern replaceFirstIn(str, "Java"))
Java is scalable and cool language


Scala 的正则表达式就是提取器,Scala会把每个括号里的匹配都展开到一个模式变量里。比如"(S|s)cala".r有一个unapply()方法,它返回Option[String]。另一方面"(S|s)(cala)".r的unapply会返回Option[String,String]。

scala> val numitemPattern="""([0-9]+) ([a-z]+)""".r
numitemPattern: scala.util.matching.Regex = ([0-9]+) ([a-z]+)
scala> val line="9527 scala"
line: String = 9527 scala
scala> line match{
     |       case numitemPattern(num,blog)=> println(num+"\t"+blog)
     |       case _=>println("hahaha...")
     |     }
9527    scala


4.3 异常处理中使用


Scala 抛出异常的语法和 Java 中的抛出异常语法是一致的。


但是Scala 的try...catch语句和 Java 的有些不一样,catch语句中通过case语句来捕获对应的异常。

catch {
  case e: IllegalArgumentException => println("illegal arg. exception");
  case e: IllegalStateException    => println("illegal state exception");
  case e: IOException              => println("IO exception");
}


再结合一下final语句。

try {
  throwsException();
} catch {
  case e: IllegalArgumentException => println("illegal arg. exception");
  case e: IllegalStateException    => println("illegal state exception");
  case e: IOException              => println("IO exception");
} finally {
  println("this code is always executed");
}


4.4 Option类中使用


Scala 语言中包含一个标准类型 Option 类型,代表可选值。Option 类型的值有两个可能的值,一个为 Some(x) 其中 x 为有效值,另外一个为 None 对象,代表空值。

scala> val books=Map("hadoop"->5,"spark"->6,"hbase"->7)
books: scala.collection.immutable.Map[String,Int] = Map(hadoop -> 5, spark -> 6, hbase -> 7)
scala> books.get("hadoop")
res0: Option[Int] = Some(5)
scala> books.get("hive")
res1: Option[Int] = None
scala> books.get("hive").getOrElse("No such book") // 不存在的元素则使用其默认的值
res2: Any = No such book


将 Option 类型的值放开,使用模式匹配:

scala> def matchOption(x:Option[Int]) = x match {
     |    case Some(s) => s
     |    case None => "?"
     | }
matchOption: (x: Option[Int])Any
scala> matchOption(books.get("hadoop"))
res3: Any = 5
scala> matchOption(books.get("hive"))
res4: Any = ?
scala>


Option[T]实际上就是一个容器,可以把它看做是一个集合,只不过这个集合中要么只包含一个元素(被包装在Some中返回),要么就不存在元素(返回None)。既然是一个集合,那么可以对它使用map、foreach或者filter等方法。


总结



模式匹配是 Scala 区别于 Java 的重要特征。我们看到了模式匹配的各种用法,在实际开发中模式匹配也应用于各个方面。

相关文章
|
11月前
|
Scala
166 Scala 模式匹配和样例类
166 Scala 模式匹配和样例类
73 0
|
3月前
|
Scala 开发者
Scala中的模式匹配与高阶函数:探索强大的编程范式
【7月更文挑战第11天】Scala中的模式匹配和高阶函数是两种极其强大的特性,它们不仅提升了代码的表达力和可读性,还使得开发者能够编写出更加灵活和可重用的解决方案。通过
|
4月前
|
Scala
scala-模式匹配(字符串、数组、元组、集合、类、偏函数)
scala-模式匹配(字符串、数组、元组、集合、类、偏函数)
21 0
|
5月前
|
Scala
Scala中的异常处理和模式匹配
Scala中的异常处理和模式匹配
39 1
|
5月前
|
Scala
Scala中的模式匹配:强大的匹配和转换工具
Scala中的模式匹配:强大的匹配和转换工具
38 1
|
5月前
|
分布式计算 Java 大数据
Scala:样例类、模式匹配、Option、偏函数、泛型(三)
Scala:样例类、模式匹配、Option、偏函数、泛型(三)
68 0
|
分布式计算 Java 大数据
|
Java 大数据 Scala
大数据开发基础的编程语言的Scala的模式匹配和正则
Scala是一种支持模式匹配和正则表达式的编程语言,它提供了强大的字符串处理和数据解析功能。本文将介绍Scala中模式匹配和正则表达式的概念和用法,帮助开发者更好地理解和应用这门语言。
74 0
|
分布式计算 Java Scala
scala中的模式匹配和样例类
scala有一个十分强大的模式匹配机制,可以应用到很多场合。java switch caseswitch语句类型查询以及快速获取数据并且scala还提供了样例类,对模式匹配进行了优化,可以快速进行匹配。
85 0
scala中的模式匹配和样例类
|
安全 Java 编译器
Scala快速入门-10-模式匹配与样例类
mathch表达式是一个更好的switch,不会有穿透到下一个分支的问题 如果没有模式能够匹配,会抛出MatchError,可以用case _ 模式来避免,相当于Java中的default 模式可以包含一个随意定义的条件,称做守卫 可以匹配数组、列表、元组等模式,然后将匹配到不同部分绑定到变量 样例类及密封类的模式匹配 用Option来存放可能存在也可能不存在的值,比null更安全