大数据:分享大数据之基础语法
1 计算机理论介绍
2 编程基础--进制分类、进制转换
进制
就是进位制。指的是我们来表示一个数字的时候进位的制度。
进制分类
计算机中,常用的进制有以下几种:
进制 | 描述 | 示例 | 备注 |
---|---|---|---|
二进制 | 使用0和1来描述所有的自然数 | 0, 1, 10, 11, 100, 101 | 使用0b 开头 |
八进制 | 使用0-7来描述所有的自然数 | 4, 5, 6, 7, 10, 11, 12 | 使用0 开头 |
十进制 | 使用0-9来描述所有的自然数 | 6, 7, 8, 9, 10, 11, 12 | |
十六进制 | 使用0-9, a-f来描述所有的自然数 | 9, A, B, C, D, E, F, 10 | 使用0x 开头 |
进制转换
-
十进制转其他进制
- 辗转相除法,用数字除进制,再用商除进制,一直到商为零结束,最后将每一步得到的余数倒着连接
-
其他进制转十进制
- 每一位的数字乘进制的位数-1次方,再将所有的结果累加到一起
-
二进制与八进制之间的相互转换
- 每一个八进制位可以等价替换成三个二进制位
- 每一个十六进制位可以等价替换成四个二进制位
原码、反码、补码
正数 | 负数 | |
---|---|---|
原码 | 由数字直接计算出的二进制表示形式 | 最高位表示符号位: 0代表正数, 1代表负数 |
反码 | 与原码相同 | 符号位不变, 其他位按位取反 |
补码 | 与原码、反码相同 | 反码 + 1 |
注意事项:
- 数据的存储与运算都是以补码的形式进行的
- 补码与补码运算的结果还是补码
- 对补码再求一次补, 可以得到原码
3 什么是Java
Java是一种面向对象的程序设计语言,可以使用这种语言编写程序,实现我们想要的一些功能。主要分三块:
J2SE: Java的标准版,用于标准的应用程序开发。
J2ME: Java的微型版,常用于移动端的开发。
J2EE: Java的企业版,用于企业级的应用服务开发。
Java程序的运行,需要先将.java源文件编译成.class字节码文件,然后由jvm虚拟机将这些字节码文件翻译成机器语言,然后执行相应的操作。
常用名词解释
JDK: Java Development Kit, Java开发框架, 开发Java程序需要用到的各种工具包。
JRE: Java Runtime Envrioment, Java运行时环境。
JVM: Java Virtual Mechine, Java虚拟机, 能够运行Java程序
1.2.4 常用DOS命令
- cd: 切换到指定的路径
- dir: 列举当前目录下的所有文件和文件夹
- mkdir: 创建文件夹
- rmdir: 删除文件夹
1.2.5 JDK的安装与环境变量的配置
-
JDK的安装
- 找到对应的版本号, 直接安装即可
- 安装完成后, 在 jdk 的 bin 目录下, 有编译运行Java程序所需要的指令
-
环境变量的配置
-
为什么要配置环境变量
- 因为我们需要使用bin目录下的javac和java指令来编译和运行程序, 而使用这两个程序的话, 就需要先用cd切到指定路径下才能执行, 并且参数需要写java文件所在的目录, 因此在编译和运行程序的时候非常不方便。因此需要将bin目录添加到环境变量, 这样我们就可以在任意的路径下使用javac和java指令,来对我们的程序进行编译和运行。
-
怎么配置环境变量
- 我的电脑 -> 右键 -> 属性 -> 高级系统设置 -> 环境变量
-
选择系统变量 -> Path -> 编辑
- win10: 新建一个变量,将jdk下面的bin目录粘贴进去,并上移到最上方
- win7/8: 将jdk下面的bin目录的路径粘贴到所有路径的最前方,然后添加一个路径分隔符;
-
怎么验证环境变量是否配置成功
- 新建一个DOS窗口, 输入指令 javac, 如果没有错误提示就是是成功
-
1.2.6 注释
注释是对代码的描述, 是开发者写给自己或者别人看的, 相当于我们记录的一些笔记, 或者备忘录。 注释部分的内容不会被编译, 因此没有语法上的要求。
注释可以分为三类:
- 单行注释: 以两个 // 开头, 后面的一行内容会被注释
- 多行注释: 以一个 / 开头, 以一个 / 结尾。中间所有的内容都会被注释
- 文档注释: 以 /* 开头, / 结尾。文档注释中可以添加一些标签,更方便的记录程序的信息
1.2.7 数据类型
在程序中, 我们需要操作各种各样的数据, 这些数据都有各自不同的类型。
Java中, 所有的数据可以分为两大类: 基本数据类型和引用数据类型
引用数据类型, 又叫做引用类型。在后面课程中具体说明。
基本数据类型, 又叫做值类型, 在Java中有以下分类:
-
整型
- 就是整数, 按照占用空间大小, 分为四种
- 字节型: byte, 1byte, [-128, 127]
- 短整型: short, 2byte, [-2^15^, 2^15^-1]
- 整型: int, 4byte, [-2^31^, 2^31^-1]
- 长整型: long, 8byte, [-2^63^, 2^63^-1]
-
浮点型
- 就是小数, 按照占用空间大小, 分为两种
- 单精度浮点型: float, 4byte
- 双精度浮点型: double, 8byte
- 双精度浮点型可以比单精度浮点型精确更多的小数点后面的位数
-
布尔型
- 用来描述程序中不是对的就是错的, 不是真的就是假的数据
- boolean, 1byte
- 只有两个值: true / false
-
字符型
- 用来描述组成一个文本的最小单元
- char, 2byte
- 字符型的数据, 需要用单引号括起来, 单引号中只能有一个字符, 不能多也不能少
1.2.8 标识符
由若干个字符组成的一个有序的序列, 用来描述程序中的一个数据
命名规则
- 只能由字母、数字、下划线和$符号组成
- 不能以数字作为开头
-
不能与关键字和保留字同名
- 关键字: 系统占用的, 已经被赋予了特殊含义的字符序列
- 保留字: 系统占用的, 暂时还没有特殊含义, 但是后续可能会用到的字符序列
命名规范
- 望文知意: 应该可以从标识符的命名中看出想表述的数据含义
-
遵循驼峰命名法
- 大驼峰命名法: 所有的单词首字母都大写
- 小驼峰命名法: 首单词除外, 从第二个单词开始, 每个单词的首字母都大写
1.2.9 变量和常量
变量: 在程序运行的过程中, 数值可以发生改变的数据
常量: 在程序运行的过程中, 数值不可以发生改变的数据
在程序中的声明
-
变量
- 数据类型 标识符;
- 数据类型 标识符 = 初始值;
- 数据类型 标识符1, 标识符2, ...;
- 数据类型 标识符1 = 初始值, 标识符2, 标识符3 = 初始值, ...;
-
常量
- final 数据类型 标识符 = 初始值;
- final 数据类型 标识符; 标识符 = 初始值;
- Java允许在声明常量的时候不赋值初始值, 可以延迟赋值。但是赋值只能进行一次。
1.2.10 转义字符
一个特殊的字符, 主要有两个作用
-
可以将某些具有特殊含义的字符转成普通字符
- 单引号, 用来匹配一个字符的开始和结尾, 转义字符可以使其成为一个普通的单引号
- 双引号, 用来匹配一个字符串的开始和结尾, 转义字符可以使其成为一个普通的双引号
-
可以配合某些普通字符使用, 使其没有特殊含义
- n本身是一个普通字符, 配合转义字符使用: n 表示换行
- t本身是一个普通字符, 配合转义字符使用: t 表示tab
- r本身是一个普通字符, 配合转义字符使用: r 表示return
1.2.11 数据类型转换
一个变量声明完成后, 在内存中已经开辟好了空间, 此时是不允许调整空间大小的, 也就是说这个变量的数据类型是不允许改变的。这里说的数据类型转换, 指的是声明一个新的指定类型的变量, 将原来变量中的值拷贝到新的变量中。
数据类型转换可以分为两种:
-
自动类型转换
- 又叫做隐式转换, 一般是由取值范围小的数据类型, 向取值范围大的数据类型转换
- 转换过程不需要任何额外操作
- 转换后, 没有任何精度丢失情况
-
强制类型转换
- 又叫做显式转换, 一般是由取值范围大的数据类型, 向取值范围小的数据类型转换
- 转换过程需要强制操作, 不能自动完成
- 转换后, 可能会出现精度丢失的情况
java
byte a = 10;
int b = a; // 由 byte 类型转型为 int 类型, 自动完成, 不需要任何额外操作
int c = 128;
byte d = (byte)c; // 由 int 类型转型为 byte 类型, 强制操作, 会存在精度丢失
额外说明
- byte, short, char 类型的数据在进行运算的时候, 会自动的转型为int类型
- 浮点型转整型, 会舍去小数点后面所有的内容, 只保留整数部分
1.2.12 常用运算符
算术运算符
用来做基础的算术计算, + - * / % ++ --
其中:
- + - * % 和数学计算中没有区别
- 两个整型的数据进行除法, 结果还是整型, 会将计算的浮点结果强转成整型
- 自增运算符++, 用在变量前, 表示是前取变量值, 后对这个变量进行+1操作
- 自增运算符++, 用在变量后, 表示是先对这个变量进行+1操作, 然后再取变量值
- 自减同自增
int a = 10;
int b = a++; // b的值是10
int c = ++b; // c的值是11
赋值运算符
=: 将等号右边的值, 给左边的变量进行赋值
+=, -=, *=, /=, %=: 组合运算符, 对一个变量进行运算
a += 10; 等价于 a = a + 10
关系运算符
> < >= <= == !=
逻辑运算符
& : 与and
| : 或or
! : 非not
^ : 异或xor, 计算逻辑: 两个相同为false, 两个不同为true
&& :
短路与, 结果与逻辑与相同. 区别在于: 如果前面的结果可以决定整体的运算结果, 后面的表达式不参与运算
|| :
短路或, 结果与逻辑或相同. 区别在于: 如果前面的结果可以决定整体的运算结果, 后面的表达式不参与运算
位运算
位运算操作的是两个整型的数字, 计算的逻辑就是将两个整型的数字求出补码, 再对补码的每一位做类似于逻辑运算的操作, 其中 1 相当于 true, 0 相当于 false
三目运算符
condition ? expression1 : expression2
condition是一个boolean类型的变量, 或者一个boolean结果的表达式. 如果condition为true, 最终整体的结果取expression1, 否则, 结果取expression2