学习大数据常用Linux命令

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 学习大数据常用Linux命令

0x00 教程目的


在编程的世界里,为了加快速度,我们往往直接用键盘来代替鼠标的操作,因为直接敲键盘要比移动鼠标要快得多。所以,为了加快我们的操作速度,以及更好地进入编程世界,我们学习好命令行(键盘)操作,也就是电影里面黑客常用的小黑框操作是一项必备技能。说白了,就是敲特定的字母或者符号来代替鼠标操作而已。你不愿意的话,用鼠标也可以的,但前提是要安装Linux系统的桌面版,比较耗资源。


0x01 Linux命令常用操作


1. Linux命令常用操作

按完字母/符号要记得回车哈!

/表示根路径

~表示当前用户主路径,如果是root用户,则为/root

.表示当前路径

..表示上一层路径


查看当前路径:pwd


进入某个路径:cd,如:

cd /表示进入/目录

cd ..表示进入当前目录的上一级目录


列出当前文件夹的文件名:ls


列出当前文件夹详细的文件信息:ll


复制文件,复制一份a文件为b(如果a是文件夹,则要加-r参数,复制多个文件也要加上),如:

cp a b,cp -r a b


创建一个空文件:touch hello.txt


修改/文件名(a也可以是文件夹),将a文件的文件名更名为b,如:

mv a b

如果a是文件,b是文件夹,则表示将a文件,移动到b文件夹里面


删除文件/文件夹(加参数-r表示递归删除,删除文件夹时要加上,-f表示强制执行):

rm aa.txt

rm -rf aa


如果是多服务器之间复制,则用scp,如

scp -r hadoop-2.7.5 root@slave1:/home/shaonaiyi

表示将hadoop-2.7.5这个文件夹,复制到slave1这台机器的/home/shaonaiyi这个路径下,-r表示循环递归复制,root为另外一台服务器的用户名,注意主机名右边是接着一个英文冒号::,注意不要写成/home/shaonaiyi/!


安装rpm包,可以使用命令:rpm -ivh xxx.rpm

默认是安装到/usr/local路径


解压文件,如解压hadoop-2.7.5.tar.gz这个包,则:

tar -zxvf hadoop-2.7.5.tar.gz

此时会解压hadoop-2.7.5.tar.gz到其所在的目录,如果想指定路径,则加上-C的参数,如:

tar -zxvf hadoop-2.7.5.tar.gz -C /usr/local


2. vi 编辑器常用操作

除了上面用touch创建文件的方式,还有很多种方式,这里先演示用vi编辑器方式:


vi的方式可以用来新建文件,也可以用来编辑文件,如果文件存在则是编辑,如果不存在,则为新建,如:输入vi hello.txt,如果hello.txt存在,则会编辑此文件;如果不存在,则会进入一个新的界面,之前打的命令好像都被覆盖了,如图:


微信图片_20220618210225.png


进入这个界面后,其实是还不能输入文件的,因为首先进入的是非编辑模式,就好像我们在win系统里打开了word文档,然后往窗口外面点了一下鼠标,你继续按键盘,其实是无法在word文档里面输入内容的。


1、Linux与Win类似也是这个道理,我们Linux系统没有鼠标,那怎么往文件里面输入内容呢?


只能用键盘,那么就不能像Win一样往编辑窗口点击一下,我们可以怎么做的,其实我们可以按i(insert的缩写)进入编辑状态,按了之后下方会出现insert的字样,此时再输入内容就可以输入了

2、输入完后,我们怎么保存呢?


因为我们没有鼠标,所以只能通过键盘,但问题是,我们按键盘,只会往文本里面输入内容,而无法保存,所以,我们要先退出编辑状态,退出编辑状态是按键盘左上角的Esc键进入非编辑模式。然后在非编辑模式输入:wq,就可以保存了,w是保存的意思,而q是退出的意思,有些时候由于权限等等问题,会提示你是否真的要修改等等,可以在q的后面再加个!,表示强制执行。如:wq!。注意:此处的:不能漏了,而且,是英文的冒号。

前面我们说了如果文件存在则是编辑,如果不存在,则为新建,有些时候我们需要编辑一个文件,里面是有很多已经存在了的内容的,但是我们在编辑的时候,由于误操作,乱删了一些东西,也不知道自己删了什么东西,那么此刻最好的做法就是,不要保存就退出,重新再编辑一次,不保存退出是::q,强制退出是:q!,当然,你如果知道自己错哪了,重新编辑也是可以的。


下面给出几个常用的快捷方式,在非编辑模式下可以使用:


保存:shift+z+z 按住shift键,然后再按两下z

调到文末:G 输入大写G,则为shift+g

调到行首/末:键盘的Home、End,当然,输入^也可以跳到行首,$可以跳到行末,跟正则表达式一样

删除一行:dd

删除3行:3dd 4行4dd、5行5dd类似

复制一行:yy

复制3行:3yy 4行4yy、5行5yy类似

粘贴:p


务必记得:上面这些操作都是在非编辑模式下执行,显然的,如果是编辑模式下,那就直接输入这些字母了,又怎么会是操作呢!


进入编辑模式除了i,还有另外两个字母:a(光标跳到右一位),o(光标跳到下一行)


新建文件,除了touch和vi,还有一种常用的方式,如:

echo 111 >> aaa.txt

表示新建一个aaa.txt文件,里面加上111,如果aaa.txt文件已经存在了,则直接在里面添加内容111。其实意思就是echo出来的内容管道到aaa.txt文件里面。


3. 注意事项

a. 命令、文件名、参数之间一定要记得加一个空格,如

cat /etc/profile

ls /etc

rm -r aa.txt


0x02 其它相关命令


1. Java相关

a. 查看进程(可以查看到进程号)

jps

image.png


b. 杀死进程(1954为进程号)

kill -9 1954


0xFF 总结


  1. 之前有读者反馈想要一份简洁的教程,这里再重新整理一遍,有需要再更新。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
Linux Shell
Linux 10 个“who”命令示例
Linux 10 个“who”命令示例
81 14
Linux 10 个“who”命令示例
|
1月前
|
Ubuntu Linux
Linux 各发行版安装 ping 命令指南
如何在不同 Linux 发行版(Ubuntu/Debian、CentOS/RHEL/Fedora、Arch Linux、openSUSE、Alpine Linux)上安装 `ping` 命令,详细列出各发行版的安装步骤和验证方法,帮助系统管理员和网络工程师快速排查网络问题。
143 20
|
24天前
|
Linux
linux查看目录下的文件夹命令,find查找某个目录,但是不包括这个目录本身?
通过本文的介绍,您应该对如何在 Linux 系统中查看目录下的文件夹以及使用 `find` 命令查找特定目录内容并排除该目录本身有了清晰的理解。掌握这些命令和技巧,可以大大提高日常文件管理和查找操作的效率。 在实际应用中,灵活使用这些命令和参数,可以帮助您快速定位和管理文件和目录,满足各种复杂的文件系统操作需求。
70 8
|
1月前
|
网络协议 Linux 应用服务中间件
kali的常用命令汇总Linux
kali的常用命令汇总linux
70 7
|
2月前
|
Linux 数据库
Linux中第一次使用locate命令报错?????
在Linux CentOS7系统中,使用`locate`命令时出现“command not found”错误,原因是缺少`mlocate`包。解决方法是通过`yum install mlocate -y`或`apt-get install mlocate`安装该包,并执行`updatedb`更新数据库以解决后续的“can not stat”错误。
49 9
|
2月前
|
监控 网络协议 Linux
Linux netstat 命令详解
Linux netstat 命令详解
|
2月前
|
运维 监控 网络协议
运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面
本文介绍了运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面,旨在帮助读者提高工作效率。从基本的文件查看与编辑,到高级的网络配置与安全管理,这些命令是运维工作中的必备工具。
219 3
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
575 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
71 2
|
16天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试

热门文章

最新文章