大数据实战之环境搭建(三)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

今天不小心下载了一个VMPLayer和CenterOS-5。所以我决定后面的demo全部使用linux作为大数据的载体来进行讲解。今天主要就是讲一下CenterOS的安装准备

我们安装好VMPlayer之后,打开后选择Create a New virtual Machine

因为我们下载的CentOS是ISO文件,所以打开以后我们选择install disc image file(ISO):

点击next,输入linux系统的具有root权限的用户名和密码

点击next,选择安装目录

点击next,分配虚拟机磁盘空间,这里因为是大数据,所以给大点,如果你的磁盘很大的话。

点击next,如果你还要设置一些硬件的信息,点击Customize hardware

在这个界面你可以设置内存,处理器,网络适配模式等等。如果不想设置,直接点击Finish开始安装

安装完成后系统启动,会提示是否安装Vmware tools,选择安装就会自动下载安装,VMWare Tools很有用,必须装。否则你会面临分辨率,linux系统屏幕小,鼠标切换困难等问题。在这里提醒一下,如果没有安装vmware tools,请按ctrl+alt键切换鼠标。

OK,启动以后的界面如下,怎么样很爽吧

如果有什么不清楚的,这位老兄写的也比较详细http://sofree.cc/vmware-centos/

我们也看到了桌面上的VMWare Tools也下载下来了,如果没有下载下来,不要紧,那么可以在VMware PLayer的菜单上选择player=>Manage=>install vmware tools,在桌面就会出现VMWare Tools。

双击发现他是一个压缩包

我们要对它进行解压,然后执行安装命令。首先将其拷贝至tmp目录,直接右键copy,拷贝到tmp目录下或者直接右键解压解压到tmp目录下。我是采取后者。

解压后的文件,我是在tmp下新建了一个文件夹叫VMTOOL。

之后我们进入tmp\VMTOOL\vmware-tools-distrib,执行安装命令,命令如下


开始安装,之后一直按enter键。


直到这一步,安装成功

根据提示,咱们重启linux。重启之后我们发现界面也不是那么小了,鼠标也可以随意切换至windows,最重要的是还可以共享剪切板。夜这么深了,我仿佛又回到了大三时代。为了拖拉控件而兴奋的时光。在centOS上安装一个qq吧,以防聊天信息没有隐私。那这个qq安装文件怎么从windows上去linux上呢。可以搭建web站点下载,ftp下载,或者共享文件夹。我选择http站点。

在windows7上搭建一个站点,不会在win7上使用IIS的同学,请看我的另一篇文章C#生成word并上传FTP。站点如下,站点包含一个html和一个下载文件linuxqq开头的那个

搭建好之后我们在linux上访问这个站点

点击超链接下载,下载到了desktop

下载下来之后下载下来之后我们用命令解压


执行qq结果报错。

娘的太郁闷了,搜了一段命令执行之后,仿佛希望来了

可是,当我./qq的时候,又让人失望,还是那个错误。真是坑爹,于是

这次我在applications、internet下看到了QQ

尼玛怎么是乱码,不管先登录一下,结果吐血

说我的版本将会过期,当你点击那个确定按钮后,直接就不登陆了。老夫放弃了,有机会再试吧,老夫主要还是要讲大数据的。


下节主要是在linux上让tomcat跑起来。



本文转自 BruceAndLee 51CTO博客,原文链接:http://blog.51cto.com/leelei/1220222,如需转载请自行联系原作者


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
12天前
|
消息中间件 存储 druid
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
28 3
|
14天前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
45 4
|
4月前
|
数据采集 大数据
大数据实战项目之电商数仓(二)
大数据实战项目之电商数仓(二)
105 0
|
2月前
|
数据采集 人工智能 安全
AI大数据处理与分析实战--体育问卷分析
本文是关于使用AI进行大数据处理与分析的实战案例,详细记录了对深圳市义务教育阶段学校“每天一节体育课”网络问卷的分析过程,包括数据概览、交互Prompt、代码处理、年级和学校维度的深入分析,以及通过AI工具辅助得出的分析结果和结论。
|
2月前
|
大数据 API 数据处理
揭秘!Flink如何从默默无闻到大数据界的璀璨明星?起源、设计理念与实战秘籍大公开!
【8月更文挑战第24天】Apache Flink是一款源自Stratosphere项目的开源流处理框架,由柏林理工大学等机构于2010至2014年间开发,并于2014年捐赠给Apache软件基金会。Flink设计之初即聚焦于提供统一的数据处理模型,支持事件时间处理、精确一次状态一致性等特性,实现了流批一体化处理。其核心优势包括高吞吐量、低延迟及强大的容错机制。
53 1
|
2月前
|
分布式计算 大数据 分布式数据库
"揭秘HBase MapReduce高效数据处理秘诀:四步实战攻略,让你轻松玩转大数据分析!"
【8月更文挑战第17天】大数据时代,HBase以高性能、可扩展性成为关键的数据存储解决方案。结合MapReduce分布式计算框架,能高效处理HBase中的大规模数据。本文通过实例展示如何配置HBase集群、编写Map和Reduce函数,以及运行MapReduce作业来计算HBase某列的平均值。此过程不仅限于简单的统计分析,还可扩展至更复杂的数据处理任务,为企业提供强有力的大数据技术支持。
49 1
|
2月前
|
API C# Shell
WPF与Windows Shell完美融合:深入解析文件系统操作技巧——从基本文件管理到高级Shell功能调用,全面掌握WPF中的文件处理艺术
【8月更文挑战第31天】Windows Presentation Foundation (WPF) 是 .NET Framework 的关键组件,用于构建 Windows 桌面应用程序。WPF 提供了丰富的功能来创建美观且功能强大的用户界面。本文通过问题解答的形式,探讨了如何在 WPF 应用中集成 Windows Shell 功能,并通过具体示例代码展示了文件系统的操作方法,包括列出目录下的所有文件、创建和删除文件、移动和复制文件以及打开文件夹或文件等。
62 0
|
3月前
|
分布式计算 Apache Spark
|
3月前
|
分布式计算 Java 大数据
实战:基于Java的大数据处理与分析平台
实战:基于Java的大数据处理与分析平台
|
4月前
|
消息中间件 分布式计算 Hadoop
大数据实战项目之电商数仓(一)
大数据实战项目之电商数仓(一)
221 0