开发者社区> 问答> 正文

大数据和python有什么区别

问题来源于python学习网

展开
收起
保持可爱mmm 2019-12-10 14:51:18 4902 0
3 条回答
写回答
取消 提交回答
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;

    核心在于科学家及分析师需要一种简单实用的语言,而Python比较合适,或者Python后续的设计就倾向于此。

    2020-03-22 11:56:10
    赞同 展开评论 打赏
  • 根本是关公战秦琼。 一个是技术方案,一个是实施语言,两者根本不能同时比较。 如果非说关系,那就是python可以作为大数据的实施语言。

    2020-03-13 14:42:35
    赞同 展开评论 打赏
  • 大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才

    能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    首先大数据是一个很大的概念,现在很多领域都用到了大数据,比如:互联网、广告、金融、能源、交通等。而Python是一门编程语言,可以用Python处理和分析各个领域产生的数据。很多初学者经常比较哪种语言是最好的,其实:编程语言没有最好,只有最适用,即在某一种中场景下最适用!!!经常会有很多小伙伴们在一些论坛中喊,PHP是世界第一语言;Java是宇宙第一语言;人生苦短,我用Python等等。

    客观的说,如果以后想从事大数据开发方向,两种语言都可能会用到,可以先学一门,因为语言是相通的,学了一门后,再学其他的就很快了!!!不要在到底学习哪门语言上纠结,重要的是先行动起来,学好一门编程语言!因为以后你可能还会学新的语言,比如现在Spark很火,还要学Scala呢!

    以前在一个论坛上有人这样比较Python、Java、C++,我觉得很形象生动:说Python是自行车,拿过来就骑,但是速度最快也就百十公里;Java是大型运输机,体量大,越飞越快;C++是导弹,一按发射按钮,嗖的一下就飞了,可以飞到几倍音速。经过比较,很容易上手,但是Python的性能最差,C++性能最高,但是想驾驭C++,就像控制导弹一样,成本和难度较高,而Java就脱颖而出了,你会发现现在大数据生态圈中的绝大多数框架都是用Java编写或是运行在JVM之上的!!!

    互联网企业是这样做的:如果处理的数量比较大,那先用Hadoop或Spark进行一次或多次处理,然后将处理后的结果保存起来。如果数据量较小并且还要做一些数据挖掘或机器学习,会倾向使用Python,因为Python的机器学习算法更多,更完善!但是Hadoop和Spark也有相应的机器学习库了,比如Hadoop的Mahout和Spark MLlib,但是算法相对较少,随着时间的发展,会越来越完善的!所以到底是使用Spark还是Python,要看数据量的多少和业务的复杂度来决定!

    就大数据处理和分析而言,python更适用一些,建议先学好python,毕竟现在大数据生态圈中的技术都脱离不了python,以后再学其他语言也很容易!

    2019-12-10 15:16:01
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载