开发者社区> laxcus大数据> 正文

说说这些年做的云计算和大数据项目

简介: 入行十几年了,做了不少分布计算、并行计算、内存计算、海量数据处理的项目,按照现在的分类,这些都属于云计算/大数据范畴。今天说说我做过的其中三个项目,只三个
+关注继续查看
         入行十几年了,做了不少分布计算、并行计算、内存计算、海量数据处理的项目,按照现在的分类,这些都属于云计算/大数据范畴。今天说说我做过的其中三个项目,只三个。
         第 一个是我们接到的视频分享网站的视频转码的订单,网站名字就不说了,有替人宣传嫌疑。他们情况是这样,视频网站的内容用MP4格式在网页上播放,但是上传 的格式多种多样,我们必须把这些视频统一转换成MP4格式,视频转码的工作想必大家都在自己的电脑上试过,通常一个100M左右的视频转码需要20分钟以 上(CPU是Pentium IV)。为了提高转码效率,让用户以接近实时得到结果,必须在收完视频后,立即将一个视频拆分成多个单元,分散到多台计算机上进行转码,然后回收所有转码 视频,按照顺序再次组合成一个新视频。我估计现在视频网站都是这个套路。我们这个团队最早是做流媒体起家的,工作没什么难度,轻车熟路,很快就完成了。只 要机器足够多,视频差不多可以以接近实时的状态完成转码。后来又再一次改进,从用户上传视频开始立即进行转码,收到一段转一段,用户的视频上传完毕,我们 的转码工作也完成,用户可以马上看到自己上传的转码后视频,基本上是零延时,并且稳定性、效率都高于对方提出的要求。做完这个,合作方老板很满意,接着又 给了一个CDN的项目。现在我们仍保持着合作的关系。    
         第二个有点玄乎, 项目可以写一篇论文,题目是《关于空中移动目标运行轨迹和落点的问题》。这个项目是XXX发下来的,实质就是炮弹打导弹,大概是想看看能不能打着,论证技 术可行性。当时人还在某单位,因为研究领域和空气动力学毫不相关,所以这方面的知识基本属于文盲,知道的也就是那么几个有限的名词和数学公式,但是这正好 符合XXX的要求,不需要我们懂这些高深的理论,他们派人和我们合作这个项目。我们的工作就是把很多传感器(他们没明说,但是地球人都明白这东西应该是雷 达)接收的数据,包括当前多少公里范围内的空气的风速、风向、地表的曲面率,还有其它一些指标在收集后(这些瞬间产生的三维数据的数据量非常大),分散到 一大堆计算机上去执行(测试时准备了100个节点),并且要很快计算出结果(必须比空中运动的目标快)。这其实和现在的SPARK、STORM做的工作很 象,要依赖大内存、高性能CPU、和高速网络,跳过硬盘这个瓶颈,才能得以实现快速计算。这个项目花了很长时间,主要是与合作方的沟通改进,然后是再沟通 再改进,循环往复,周而复始。后来终于完成了,据说做了试验,可行性很高,上面领导很满意,还摆了庆功酒。反正我没见着也没喝着。其实他们怎么计算的,我 到最后也没有搞明白,问过一次,说是秘密。  
         第三个和两桶油的页岩气有关。当 前的背景是在四川涪陵(这个地方还产榨菜)发现了大面积的天然气,按照自然规律,油气是共生的,所以两桶油想通过采集页岩样本,分析这个地区地下有没有石 油资源,如果有,是不是具有开采价值。这套程序原本已经是有的,艾克森.美孚石油公司开发的,跑在CARY-1向量机上。那套机器是上世纪七八十年代的超 级计算机,在当时已经不能满足需要,属于进博物馆之列。有些数据分析理论已经过时,需要调整。两桶油最不满意的还是速度太慢,计算一次要几小时几天才能出 结果。这一次又是合作,两桶油出熟悉采油的技术专家,我们出并行计算的码农,前前后后合作弄了大半年,算是完成了。这次我们用了新的并行算法,效率提高了 一大截。和上次炮弹打导弹一样,整个项目静悄悄开始,静悄悄结束,后面怎么样就不知道了。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
物联网、大数据、云计算、人工智能之间的关系
了解什么物联网、大数据、云计算、人工智能大概是什么样的,物联网、大数据、云计算、人工智能的工作关系。
145 0
聚焦云计算、大数据、人工智能等开源技术,这场开源开发者的盛会不容错过!
聚焦云计算、大数据、人工智能等开源技术。大咖云集,这场开源开发者的盛会等你来探索!
87 0
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
89 0
云计算和大数据以及两者的区别
云计算大数据是现在比较热门的词,其具体应用领域也比较多,很多人对于云计算和大数据二者分不清,什么是云计算大数据?大数据和云计算有什么区别?大家可以看看下文来详细了解下。
450 0
浅谈数字经济新技术间的关系——云计算、物联网、大数据、区块链、人工智能、元宇宙
1、什么是数字经济数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。——摘自《国务院 “十四五”数字经济发展规划 2021年12月12日》北京2022年1月12日 - 中国国务院周三发布“十四五”数字经济发展规划,提出到2025年,数字经济核心产业增加...
790 0
世界程序员最难的题目,做不好你就是杀人凶手【云计算 大数据 开卷题目】
这道题目没有任何数据给你,但你可以去找估计数字,欢迎有志程序员做这到题目,这是一个开卷题目,你考虑的越多对象和属性程序会越复杂,你可以纯属娱乐。
54 0
融合大数据和云计算是机器人技术的未来
融合大数据和云计算是机器人技术的未来
341 0
云计算、大数据和人工智能在2018年会不会更混乱?
云计算、大数据和人工智能在2018年会不会更混乱?
92 0
云计算与大数据的关系
云计算与大数据的关系
813 0
一文读懂云计算、大数据和AI间的关系和区别
相信大家都听说过云计算、大数据和人工智能,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据、大数据的时候会提人工智能、谈人工智能的时候会提云计算……三者之间相辅相成又不可分割,那么这三者之间到底是怎么一回事呢,今天小编就来讲讲。
624 0
云计算、大数据已经过时?不,正是因为它们RPA才能大流行
云计算、大数据已经过时?不,正是因为它们RPA才能大流行 站在云计算、大数据、人工智能的肩膀上,RPA才能走得更远
115 0
Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)
Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)
453 0
面向大数据与云计算调度挑战的阿里经济体核心调度系统—Fuxi 2.0全揭秘
随阿里经济体和阿里云丰富的业务需求(尤其是双十一)和磨练,伏羲的内涵不断扩大,从单一的资源调度器(对标开源系统的YARN)扩展成大数据的核心调度服务,覆盖数据调度(Data Placement)、资源调度(Resouce Management)、计算调度(Application Manager)、和本地微(自治)调度(即正文中的单机调度)等多个领域,并在每一个细分领域致力于打造超越业界主流的差异化能力。本文试从面向大数据/云计算的调度挑战出发,介绍各个子领域的关键进展,并回答什么是“伏羲 2.0”。
2799 0
云计算、大数据和人工智能的增长飞轮
贝佐斯和亚马逊取得巨大成功的关键因素之一,是在电子商务领域应用了增长飞轮式的闭环商业模式。经过对以阿里云为代表的云计算厂商进行分析研究,我们发现在云计算领域,增长飞轮式的闭环模式同样适用。本文分析了云计算、大数据和人工智能的三级增长飞轮模式,在云计算的驱动之下,云计算、大数据和人工智能三者实现协同增长。可以预见,随着“新基建”热潮的到来,云计算的增长飞轮必将驱动更多的领域实现增长。
819 0
+关注
laxcus大数据
我思故我在
文章
问答
视频
相关电子书
更多
天气风险管理的过去、现在与未来——基于大数据和云计算的天气风险管理
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
相关实验场景
更多