变量和数据类型和运算符
二进制
二进制,是计算技术中广泛采用的一种数制,由德国数理哲学大师莱布尼茨于1679 年 发明。二进制数据是用 0 和 1 两个数码来表示的数。它的基数为 2,进位规则是“逢二进 一”。 数字计算机只能识别和处理由‘0’.‘1’符号串组成的代码。其运算模式正是二进制。 二进制对应两种状态,广泛应用于电子科学。比如:可以对应电子器件的开关状态、对应信号电压状态(+5V 等价于逻辑"1",0V 等价于逻辑"0")、对应卡带是否打孔状态、电磁存储(磁体状态:南为 0,北为 1)等等。
二进制广泛应用于我们生活的方方面面。比如,广泛使用的摩尔斯电码,它由两种基本信号组成:短促的点信号“·”,读“滴”;保持一定时间的长信号“—”,读“嗒”。然后,组 成了 26 个字母,从而拼写出相应的单词。
当然,我们没有必要记住这些。如果一定想学,记住 SOS 就好了^_^
二进制和十进制的转化
在线进制转化的工具:https://tool.lu/hexconvert/
二进制和十进制数的对应
十进制转二进制
十进制整数转换为二进制整数采用"除 2 取余,逆序排列"法。
十进制数 29 转成二进制就是:11101
二进制转十进制
二进制转十进制采用“权相加法”。
注释
写注释的好处: 做一个人见人爱的程序员!
不写注释的好处: 做一个离职后,前公司还得求你的程序员! 注释不会出现在字节码文件中,即 Java 编译器编译时会跳过注释语句。 在 Java 中根据注释的功能不同,主要分为单行注释、多行注释和文档注释。
【示例 2-1】认识 Java 的三中注释类型
/** * Welcome 类(我是文档注释) * @author 童小纯 * @version 1.0 */ public class Welcome { //我是单行注释 public static void main(String[ ] args/*我是行内注释 */) { System.out.println("Hello World!"); } /* 我是多行注释! 我是多行注释! */ }
标识符和关键字
标识符是用来给变量、类、方法以及包进行命名的。
4 大规则:
1. 必须以字母、下划线_、美元符号$开头。
2. 其它部分可以是字母、下划线“_”、美元符“$”和数字的任意组合。
3. 大小写敏感,且长度无限制。
4. 不可以是 Java 的关键字。
Java 不采用 ASCII 字符集,而是采用 Unicode 字符集。因此,这里字母的含义不仅仅是英文,还包括汉字等等。但是不建议大家使用汉字来定义标识符!
【示例 2-2】合法的标识符
int a = 3;
int _123 = 3;
int $12aa = 3;
int 变量1 = 55; //不建议使用中文命名的标识符
【示例 2-3】不合法的标识符
int 1a = 3; //不能用数字开头
int a# = 3; //不能包含#这样的特殊字符
int int = 3; //不能使用关键字
关键字/保留字
Java 关键字是 Java 语言保留供内部使用的,如 class 用于定义类。 我们不能使用关键 字作为变量名或方法名。
菜鸟雷区
出于应试教育的惯性思维,很多新手很可能去背上面的单词,从实战思维出发,我们不需要刻意去记!随着学习的深入,自然就非常熟悉了。
变量(variable)
变量的本质
1. 变量本质上就是代表一个”可操作的存储空间”,空间位置是确定的,但是里面放置什么值不确定。
2. 可通过变量名来访问“对应的存储空间”,从而操纵这个“存储空间”存储的值。
3. Java 是一种强类型语言,每个变量都必须声明其数据类型。变量的数据类型决定了变量占据存储空间的大小。 比如,int a=3; 表示 a 变量的空间大小为 4 个字节。
变量的声明
double salary;
long earthPopulation;
int age;
不同数据类型的常量会在内存中分配不同的空间,如图 2-1 所示。
【示例】声明变量和初始化
int age = 18;
double e = 2.718281828;
int i ,j; // 两个变量的数据类型都是 int
变量的分类和作用域
变量有三种类型:局部变量、成员变量(也称为实例变量)和静态变量。
老鸟建议
成员变量和静态变量不是目前重点,不要过多纠结理解与否。我们学习面向对象时,再重点讲解成员变量和静态变量。
局部变量(local variable)
方法或语句块内部定义的变量。生命周期是从声明位置开始到到方法或语句块执行完毕 为止。局部变量在使用前必须先声明、初始化(赋初值)再使用。
【示例】局部变量的声明
public void test() { int i; int j = i+5 ; // 编译出错,变量 i 还未被初始化 }
public void test() { int i; i=10; int j = i+5 ; // 编译正确 }
成员变量(也叫实例变量 member variable)【暂不用掌握,讲面向对象再说】
方法外部、类的内部定义的变量。从属于对象,生命周期伴随对象始终。如果不自行初 始化,它会自动初始化成该类型的默认初始值。
【示例 2-8】实例变量的声明
public class Test { int i; }
静态变量(类变量 static variable)【暂不用掌握,讲面向对象再说】
使用 static 定义。 从属于类,生命周期伴随类始终,从类加载到卸载。 (注:讲完内存 分析后我们再深入!先放一放这个概念!) 如果不自行初始化,与成员变量相同会自动初始 化成该类型的默认初始值。
注意: 目前大家只需要了解基本的分类概念即可。不需要掌握,后面讲了方法、对象、类以后再深入学习。
常量(Constant)
在 Java 语言中,用关键字 final 来定义一个常量。常量一旦被初始化后不能再更改。
声明格式: final type varName = value
【示例 2-9】常量的声明及使用
public class TestConstants { public static void main(String[] args) { final double PI = 3.14; // PI = 3.15; //编译错误,不能再被赋值! double r = 4; double area = PI * r * r; double circle = 2 * PI * r; System.out.println("area = " + area); System.out.println("circle = " + circle); } }
为了更好的区分和表述,一般将 1、2、3、’a’、’b’、true、false、”helloWorld”等 称为字符常量,而使用 final 修饰的 PI 等称为符号常量。
老鸟建议
变量和常量命名规范
所有变量、方法、类名:见名知义
类成员变量:首字母小写和驼峰原则: monthSalary
局部变量:首字母小写和驼峰原则
常量:大写字母和下划线:MAX_VALUE
类名:首字母大写和驼峰原则: Man, GoodMan
方法名:首字母小写和驼峰原则: run(), runRun()
基本数据类型(primitive data type)
Java 数据类型分为两大类:基本数据类型(primitive data type)和引用数据类型(reference data type)。
注意事项
引用数据类型的大小统一为 4 个字节,记录的是其引用对象的地址!
本章只讲解基本数据类型。引用数据类型在后续数组和面向对象章节讲解。
整型
Java 语言整型常量的四种表示形式
十进制整数,如:99, -500, 0
八进制整数,要求以 0 开头,如:015
十六进制数,要求 0x 或 0X 开头,如:0x15
二进制数,要求 0b 或 0B 开头,如:0b01110011
Java 语言的整型常数默认为 int 型,声明 long 型常量可以后加‘ l ’或‘ L ’ 。
【示例】long 类型常数的写法及变量的声明
long a = 55555555; //编译成功,在 int 表示的范围内(21 亿内)。 long b = 55555555555;//不加 L 编译错误,已经超过 int 表示的范围。
报错:The literal 55555555555 of type int is out of range,所以我们需要修改代 码为:
long b = 55555555555L;
浮点型(Floating Point Number)
1. float 类型又被称作单精度类型,尾数可以精确到 7 位有效数字。
2. double 表示这种类型的数值精度约是 float 类型的两倍,又被称作双精度类型,绝大部 分应用程序都采用 double 类型。
3. Java 浮点类型常量有两种表示形式
(1) 十进制数形式: 例: 3.14 314.0 0.314
(2) 科学记数法形式 例:3.14e0 3.14E2 3.14E-1
4. 浮点型不精确,不要用于比较
浮点数存在舍入误差,数字不能精确表示。浮点数适合普通的科学和工程计算,精度足够; 但不适合精度要求非常高的商业计算,这时候要使用 BigDecimal 进行运算和比较。
5. 浮点常量默认类型是 double,要改成 float 可以后面加 F 或 f
【示例】使用科学记数法给浮点型变量赋值
double f = 314e2; //314*10^2-->31400.0 double f2 = 314e-2; //314*10^(-2)-->3.14
float类型的数值有一个后缀F或者f ,没有后缀F/f的浮点数值默认为double类型。也 可以在浮点数值后添加后缀D或者d, 以明确其为double类型。
【示例】float 类型常量的写法及变量的声明
float f = 3.14F;//float 类型赋值时需要添加后缀 F/f double d1= 3.14; double d2 = 3.14D;
【示例 2-13】浮点型数据的比较一
float f = 0.1f; double d = 1.0/10; System.out.println(f==d);//结果为 false
【示例 2-14】浮点型数据的比较二
float d1 = 423432423f; float d2 = d1+1; if(d1==d2){ System.out.println("d1==d2");//输出结果为 d1==d2 }else{ System.out.println("d1!=d2"); }
运行以上两个示例,发现示例2-13的结果是“false”,而示例2-14的输出结果是“d1==d2”。 这是因为由于字长有限,浮点数能够精确表示的数是有限的,因而也是离散的。 浮点数一 般都存在舍入误差,很多数字无法精确表示(例如0.1),其结果只能是接近, 但不等于。二 进制浮点数不能精确的表示0.1、0.01、0.001这样10的负次幂。并不是所有的小数都能可以 精确的用二进制浮点数表示。 java.math 包下面的两个有用的类:BigInteger 和 BigDecimal,这两个类可以处理任 意长度的数值。BigInteger 实现了任意精度的整数运算。BigDecimal 实现了任意精度的浮 点运算。
菜鸟雷区
不要使用浮点数进行比较!很多新人甚至很多理论不扎实的有工作经验的程序员也会犯这个错误!需要比较请使用 BigDecimal 类
字符型
ASCII 字符集表示了英文字母、数字、特殊字符、控制符,所有字符集的老祖宗,大家都会兼容它。但是一个字节能够表示 256 个状态,而 ASCII 字符只用到 128 个,后面 128 个一直是空的。
于是有了 ISO8859-1,别名叫 latin-1, 包含了 256 个字符。前 128 个字符与 ASCII 中完全相同。后 128 个包括了西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。
随着我国的计算机普及,汉字的处理也有了我们自己的方案。那就是 GB2312,两个字节表示 1 个汉字。两个字节可以表示 65536 个状态,汉字再多也能全部包含。后来,又有了 GBK、GB18030。
我国的台湾地区自己搞了一套显示繁体中文的大五码 BIG5。
全世界各个地方,都有自己的文字编码。由于不互通,经常造成乱码的问题。
如果有一种统一的字符集,将世界上所有语言字符都纳入其中,每一个字符都给予一个全球独一无二的编码,那么乱码问题就会消失。于是,全球所有国家和民族使用的所有语言字符的统一字符集诞生了,这就是 Unicode 字符集。
Unicode 字符集是为了给全世界所有字符一个唯一的编码,“唯一”对应的英文为 Unique,而编码的英文为 code。
Unicode 采用了字符集和编码分开的策略。Unicode 之前,Unicode 诞生之前可以将字符集和字符编码混为一谈,而在 Unicode 中必须严格区分开。
Unicode 字符集统一采用两个字节表示一个字符,包括英文字母。但是,由于英文占据互联网信息的绝大部分。真实存储和传输时,会造成极大的浪费;因此,目前主要采用 UTF8 编码来实现具体的存储和传输。UTF-8 是变长编码,用 1-6 个字节编码 Unicode 字符。 西欧字符仍然是 1 个字节,汉字 3 个字节。
字符型在内存中占 2 个字节,在 Java 中使用单引号来表示字符常量。例如’A’是一 个字符,它与”A”是不同的,”A”表示含有一个字符的字符串。 char 类型用来表示在 Unicode 编码表中的字符。Unicode 编码被设计用来处理各种 语言的文字,它占 2 个字节,可允许有 65536 个字符。
【示例 2-16】字符型演示
char eChar = 'a'; char cChar ='中';
Unicode 具有从 0 到 65535 之间的编码,他们通常用从’\u0000’到’\uFFFF’之 间的十六进制值来表示(前缀为 u 表示 Unicode)
【示例 2-17】字符型的十六进制值表示方法
char c = '\u0061';
Java 语言中还允许使用转义字符 ‘\’ 来将其后的字符转变为其它的含义。常用的转 义字符及其含义和 Unicode 值如表 2-6 所示。
【示例 2-18】转义字符
char c2 = '\n'; //代表换行符
注意事项 以后我们学的 String 类,其实是字符序列(char sequence), 本质是 char 字符组成的数组。
布尔型(boolean)
1. boolean 类型有两个常量值,true 和 false。
2. 在内存中占一个字节或 4 个字节,不可以使用 0 或非 0 的整数替代 true 和 false ,这点和 C 语言不同。
【注意点】
JVM 规范指出 boolean 当做 int 处理,也就是 4 字节,boolean 数组当做 byte 数组处理,这样我
们可以得出 boolean 类型占了单独使用是 4 个字节,在数组中是确定的 1 个字节。
【示例 2-19】boolean 类型演示
boolean flag ; flag = true; //或者 flag=false; if(flag) { // true 分支 } else { // false 分支 }
小童建议
Less is More!!请不要这样写:if ( flag = = true ),只有新手才那么写。关键也很容易写错成 if(flag=true),这样就变成赋值 flag 为 true 而不是判断!
小童的写法是 if ( flag )或者 if ( !flag)