Cloud Computing 2(一)|学习笔记

简介: 快速学习 Cloud Computing 2(一)。

开发者学堂课程【高校精品课-上海交通大学-企业级应用体系架构:Cloud Computing 2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/75/detail/15849


Cloud Computing 2(一)

 

内容介绍:

一、 边缘计算

二、云端融合的系统

三、cloud

四、延迟

五、能量

六、成本问题

 

一、边缘计算

边缘计算主要解决的问题是并不是把所有的数据全部都推送到中心云里面进行处理所以可以有效的降低这个带宽的占用因为不需要所有数据全程录制。

image.png

例如中间的某一个节点上把数据做一次预处理,统计完的结果发送回去。另外一点是在移动边缘计算的场景,当别人设备在不断发生变化,例如传感器它在不断发生变化的时候。那和中心的连接并非是持久的、连续性

就像使用的平板电脑或者笔记本电脑智能电话等等,有可能不能持续保持和云中心的连接。就会把数据通过边缘服务器进行缓存或者预处理。然后再往云空间中心里面发送。所以它可以在这种不能保持持续连接的环境下。通过减少带宽占用了这种方式来提高整个系统的响应能力。

并非要把所有的任务全部都在边缘端做,因为边缘端的服务器或者智能手机也是要受限的。所以不是能够全部都在云端做。那这在边缘端做,可能一部分还要推到云端去做。也涉及到 offloading,这是云这一段可以把任务卸载到边缘来做边缘这端也可以把任务卸载到去做。

 image.png

 

二、云端融合的系统

这个动作就叫 offloading,就是要把一部分的负载卸载到另外一方去做,这是一个云端融合的系统。做一个视频分析的例子

image.png

假设在一个场景底下,需要找一个目标。在一个目标区域内找这个目标。例如在商场里面小孩子走丢了父母报警之后,商场,在商场里所有的摄像头里同时开始去找。找的时候怎么找呢?

一种是把所有的视频全部推回到服务器端,在云里面处理那这个压力下降就会很大。摄像头可能会很多,例如有上百,那服务器就要处理上百路视频信号。但是如果前端的摄像头具有一定的处理能力例如像海康卫视,摄像头可以在前端高级的摄像后,就存储9万张图片。然后可以拿着检测到的这个目标,然后9万张图片进行比对。那就是在前端它有没有实现一个比对的功能。如果这样做,就会给所有的这100个摄像头发一张这个丢的这个小孩儿的一张照片。那每一个摄像头拿一张照片,在各自范围内去进行搜索。搜索之后,只要报告有没有搜索到,并且收到了那张照片上这个小孩的样子就可以。

上述是把所有的任务全部从 cloud 这一段之后,后面的全部推到了 camera 这一。这个摄像头它有100个来分担原来全部要由云处理的任务现在的速度就会提高,并且 camera 和 cloud 之间传递的信息就是 yes 或 no,以及在yes情况下,要发这张照片那其的数据流不需要及时推送到 cloud,可以本地缓存,然后隔一段时间再把这个数据当成备份,还有传统方式这样整个带宽的占用会降低很多。另外就是整个系统的实时性会提高因为现在相当于在100个摄像头比较并行的,而不是把数据全部拿回到服务器端慢慢的。这就是很明显的一个计算的 offloading,就是云这一端会把大量的计算任务给它卸载到端这一端去做。

再举一个反过来的例子:camera 这端要做的事情,做录像,如做一个 AI 换脸。把里面拍摄到的人给换脸换掉。智能手机这一端在不断的拍照换脸,但是处理能力有限。例如一秒钟,最多换这个四帧就是4 FPS只能处理四,但是一个录像,比较流畅的话,是24到25。处理不过来中间这20该怎么办?摄像头就可以把中间的20发送到cloud阶段,让后端来处理处理完之后发回来。在前端只要处理这四,剩下的只是发送本地不做计算处理。上层处理可能会非常快,把结果回过头来,那就可以看到 AI 换脸的一个视频可以在很短的一个时间内就完成。这只是在做一个反方向的 offloading。无论是在云端还是在边缘端,都可以互相 offloading,所以这是一个云端融合的系统。根据当前的负载确定任务到底在哪个端来实现。

智能家居的例子。智能家居就把家里所有东西全部都管理起来。因为会装很多传感器。这些数据数量会非常的大要全部都推到云里面去处理,显然就不合适了于是就会看到在智能家居这里面有一个地方会运行一个特殊的针对这个边缘的操作系统。所有的互联网的设备可以连接到这个系统数据就在本地,家里安装的边缘的gateway上,在本地就去处理了。这样就可以免除把所有数据全部发送到云里面去进行处理的对带宽的负担。可以减轻而且响应速度会更快,因为是本地处理。

有一个疑问,这是一个智能家庭,意思就是里面有一个 server 在连所有的设备,再做处理。处理完了做控制例如灯要控制或者冰箱要控制,还往云里传什么?还有需求吗?如果要做一个远程的控制因为一些原因,例如需要做用户的认证或者授权之类或者不会直接通过公网对外通过一个专有的的网络到了云,云里面有一台机器公网对外。在这种场景之下,在数据安全受到保护这边不通过公网直接对外情况下,通过云作为一个跳板来进行控制。云这一端就会严格的安全限制,用户就可以用自己的手机去做控制,这是一方面。另外一方面这些数据如果传到云里面,整个智能家居的提供商肯定了很多的家庭。希望收集到这些数据去了解用户的使用习惯帮助改进智能家居产品。所以从提供商的角度来,也希望把这些数据都收回来。

再看客户的角度除了能够更好的访问,还要考虑如果服务器崩了整个家里就不能控制。如果把家里的一些配置信息相关的跑出来的信息,全部都通过云去做一次备份即使崩了,在重启的时候,可以从云里面把备份数据拿过来,就会恢复状态或者服务器彻底一坏掉了,没有办法恢复,只要买一台新的服务器,重新部署系统从云里面去恢复状态所有的东西都有。和手机为什么要用苹果手机,为什么需要用 iCloud 备份重要信息是一个道理。所以云是有存在的价值,从几方来看都需要。

在这种场景之下能看见智能家具里面是一个边缘。服务器在靠近边缘处理数据,但是像数据备份恢复功能是在cloud 里边,所以是一个很典型的是云端融合系统。

边缘计算里面就是云端融合的计算最重要的考虑为什么会有这种场景?以前为什么没有现在用的终端,无论用的是智能手机还是一些车载计算机都有很强处理能力。这些处理能力如果把它闲置在那里,也是一种浪费。怎么样把它给利用起来,就是把这些东西连到数据中心。然后可以利用计算能力去做数据的计算,做数据的存储或者做更复杂的任务处理。

以前就是受制于网络的连接,网络可能没有多的连接或者是连接资源,让所有设备全部互联起来就是所谓万物互联达不到。现在是在5G 的时代,至少有一种可能当然5G 会怎么样,现在不知道,但至少能提供一种可能。就是可以就近就可以去4G 知道是有公基站为主的。例如在一个小区里看到一个基站,连整个小区的所有手机。那5G是微基站,工作范围可能就是一二十米的范围,就是小区里面会遍布大量的基站。

那这些基站就拓展整个系统互联能力所以这些万物互联就成为了一种可能。所以现在5G出现就促进了边缘计算,往前走了一大步

在数据中心里面,因为数据本身它的数量非常的大。所以数据中心的存储数据规模在变大,自身也应该变了很大看连接的终端数量就非常的多。要想把数据中心的压力降低,就必须要去利用那些跟互联的这些工作,压力给分散出去

云端融合,就是现在一种比较流行的计算架构,现在到处都会看到它。像刚才讲的视频分析的例子,其实最典型的现在看到的各种各样的视频分析的系统。例如一些监控的系统,看这里是不是有一些像刚才讲的走丢的人,或者在分析是不是有人在放置一些很危险的物品,像这类系统里面都走这种路线。

是既不是在服务器里面处理所有的视频,也不是在边缘就把所有事情都做了再做融合,这是一种趋势。

 

三、cloud

在云里面其实云主要的东西就是这样几类

第一个是资源是怎么管理的?就是持有这些计算资源怎么管理。

第二个是上面那个软件暴露出来的服务是怎么管理

第三个,能不能把所有的负载在持有一些资源的基础上,这些服务可以把它优化起来,所有的压力都差不多。

意思就是:资源的管理,关注的是物理机,有多少计算的资源服务的管理是在考虑有多少个应用以服务形式体现然后负载就这些应用用户。当一个应用的用户是非常多的时候应该给其分配更多的物理资源一个应用的客户端减少了之后,应该把分配给它的资源收回一些。

这三者实际上是统一的。画了一个图就如下图设计

image.png

意思就是用户的请求来了之后,会有一个容量管理器。根据当前的请来预测整个系统各个应用的负载会是什么样子然后就会根据负载的情况去预测各个系统的性能会怎么样。根据性能预测看的结果,去在所有的应用之间去调配资源。比如刚才讲的有一些资源就回收了有一些可能给这些应用多分配点资源。

就是看到了资源管理要管理的事情为了知道怎么样去分配资源或者回收资源,需要对整个系统当中资源做一个管理就会有一个注册中心,一方面了解有哪些资源,一方面了解有哪些服务。当一个 Web 应用提供者,把的服务注册到云里面之后,就会记住有哪一些服务。这些服务的会为 Client 提供服务,会去跟资源管理器进行交互就是根据容量去判断哪些应用会需要分配资源依据就是性能如何负载情况如何去预测性能,决定给哪一些服务,多分配一些资源或者少分这些资源。

在云端融合的系统里面会看到大概分成这样几个层

image.png

第一层是云,云里面有大量服务器。第二层在边缘。M 的意思是Mobile,就是移动边缘计算服务器例如这是中国电信的总部 telecomm会有一个核心网例如软件大楼有服务器然后旁边例如电信大楼服务器相连,devices核心网里和它连,软件大楼楼里面就会摆了一些服务器所有的设备实际上是通过微基站连到这些服务器上。通过这些服务器再接入核心网,在跟云里面的服务器里面交互所以这一类的服务器就是看到的边缘服务器,位于整个网络的边缘。服务器有些性能还比较强例如电信学,软件其实单独不适应整个交大所有的中国移动所有的服务器连在学院的四号楼的一间机房里面那间机房里面就有若干台服务器,处理能力很强。可以利用这些服务器来实现功能例如今天早上产生的一些新闻现在的新闻都是以视频的方式。当用户看新闻的时候就会想这,当然在交大的学生关心科技型的新闻,这种 V6新闻能不能直接发到这些边缘服务器上去做缓存?不要每一次让用户上来的时候一定要核心机房里面去拿视频看,而是主动把视频给推下来放到上面缓存。因为计算能力比较强,还有比较多的资源。交大用户在访问的时候看视频新闻,这上面就可以命中可以直接返回,这是个实际的一个例子。真实的情况下,就可以把大量的数据放到上面缓存、存储。另外一方面是用户的手机在接入之后就会发一些指令给给服务器这些服务器也可以做这些数据的缓存,也没必要每一次手机用户来了,信息都要马上传到中心云里,就地进行处理。例如用户的位置数据这是可以解算出来,根据连接的基站,它的信号的强弱还有数量可以结算出来位置,这种位置数据就不一定非要推到云里面,就地存储未来如果有人想知道一个用户在软件学院里面的路径的时候,就直接在服务器上就可以进行处理。所以在场景之下,实际上只有这两方在协作是云端和边缘阶段做协作,共同完成一个功能。对于最终看到的这些移动用户来,这件事情是透明的感受不到上面分了两层反正就是有这么个功能,一调用就实现了。

边缘计算的挑战是什么?第一个就是编程模型什么样,既然计算可以迁移怎么去写代码?

因为迁移完之后,需要迁移到边缘节点很难保证里面的服务器和边缘节点是同构的。涉及到像操作系统,数据,编程语言各个环境都是可能异构。把一个计算任务从云里面卸载的边缘能支撑吗?像刚才的视频分析数据把功能推到摄像头这边去做摄像头能做所以可编程性是很大问题。第二就是命名,这东西可能是大家以前在写代码或者系统甚至从来没有关心过。实际上翻译成软件给含义是id是什么?如果真支持万物互联所有的物的数量就会显得非常庞大。什么样的方式来定义 id 就是命名是一个很严重的问题。如果没有相应的国际的标准或者是国内标准或者行业标准随便命名,怎么保证 id 比较容易识别以及全局唯一?背后带来的问题就是所有的物进行连接时有没有的ID 是 统一编码国际标准。如果有就简单,但是没有就要保证如何唯一,如何解析?容易解析的话,就证明肯定不会是上课讲基于整数递增。肯定应该是分段,前中后分别是什么,最后再加一个自己单独东西。例如种类然后型号然后安装位置和随机数,是唯一并且根据内容较快的知道解析语义第三是数据抽象,万物互联是物联网。物联网产生的大量数据,应该怎么表示?数据原始的本身是数据,要抽象的话要把原本的语义表示出来。例如有的温度传感器、湿度传感器等等一系列东西直接写温度不行。因为处理温度可能有 还有 C°,可能还有的精度质量等等,数据抽象的标准要能产生,否则的话大家理解的数据不一样,可能表达的语法都不一样

服务管理,服务互相之间应该如何区分,服务的可扩展性怎么样,彼此之间是不是隔离,以及它的可靠性怎么样如果真的用边缘的设备提供的服务,能不能保证这4点,就是能唯一的标识服务能够访问到,它具备不具备可扩展性,比如它的功能或者容量有没有可扩展性,服务和服务之间会不会有干扰,服务在多长时间之内可以提供可靠的保障,会不会时而可行时而不可行,或者连接不到这样的问题。

再往下其实就是云都有的一个问题,就是隐私性和安全性如何来保证什么是安全性?那么隐私性和安全性怎么去保证?这是为什么?就是所有的数据是在边缘,从互联网从各个设备收集到的数据,那么这个数据它归谁所有?所以现在出去谈很多项目都碰上这个问题,不是没有大数据,是大数据都有,但是数据互相之间不通。

例如去管公安局,去管银行需要汇款信息,要破案用,银行都不一定会给因为数据它拿来之后,它实际上就是一种资产,是一种能够再生就是能够增值的东西。那么把数据给别人的时候,别人就会去想对自己有什么好处,数据拿去之后,本身隐私会不会暴露,然后这个数据拿出去给别人用,会不会有国家安全的问题等等。

简单来,即便是不涉及到这一类问题,比如在软件大楼布了很多微基站,微蜂窝基站 Micro base station,设计了算法可以去结算每一个手机的位置,只要进入软件大楼的范围内,就可以一直跟踪路径,一直到离开这个范围内。

这种数据收集完了,是在软件学院的服务器上放,它能不能直接拿出去给别人用,这涉及不涉及到隐私和安全,这就是个问题。

所以需要相应的数据,隐私和安全性保护的协议,在这个基础之上开发相应的有效工具去实现隐私和安全的保证,在边缘计算场景下,用边缘服务器处存储数据的一个前提。因为原来的数据都是加密以后存储到云里的,只要云不被攻破,隐私就不会泄露,现在是到处都有在边,只要经过的边缘服务器上都有。隐私被暴露的概率可能就会很大,所以这就是一个很大的挑战。

相关文章
|
5月前
|
存储 网络协议 数据库
【技术分享】Cloud computing
简介: 5月更文挑战第1天
69 2
|
边缘计算 人工智能 5G
Cloud Computing 2(二)|学习笔记
快速学习 Cloud Computing 2(二)。
Cloud Computing 2(二)|学习笔记
|
存储 数据采集 设计模式
Cloud Computing 1(二)|学习笔记
快速学习 Cloud Computing 1(二)
129 0
Cloud Computing 1(二)|学习笔记
|
存储 分布式计算 Linux
Cloud Computing 1(一)|学习笔记
快速学习 Cloud Computing 1(一)
122 0
Cloud Computing 1(一)|学习笔记
|
存储 弹性计算 API
|
存储 缓存 虚拟化
|
存储 网络性能优化 虚拟化
|
存储 监控 安全
|
存储 缓存 运维
|
存储 负载均衡 调度