• 整理之刷过的数据结构与算法

    47.Python中的默认排序算法为timsort,一个做了大量优化的归并排序。试查阅资料实现这一排序算法并分析其算法时间复杂度。48.实现shell排序并分析算法的时间复杂度。49.现在有一堆(25张)已经被分割的RGB图片(参见...
    文章 2018-03-21 1430浏览量
  • 谷歌背后的数学

    显然,这条假设所体现的正是前面提到的佩奇和布林的排序原则,因为右端求和的存在表明与 Wi 有链接的所有网页 Wj 都对 Wi 的排名有贡献,而求和中的每一项都正比于 pj,则表明来自那些网页的贡献与它们的自身...
    文章 2017-05-02 835浏览量
  • MAB问题的解法与应用

    汤普森采样算法UCB算法是用置信区间上界来给老虎机打分,汤普森采样算法则是用Beta分布采样来给老虎机打分。这里面有两个名词需要解释一下:什么是Beta分布?什么是采样?首先解释一下采样,采样也叫取样,从字面上...
    文章 2021-10-11 19浏览量
  • 阿里凑单算法首次公开!基于Graph Embedding的打包购...

    一个分布式的图计算平台,离线graph有2亿条边,3千万节点,10分钟跑完所有的数据,实时部分,我们实现了每分钟最高可更新10w的Graph边的结构,如何在分布式odps graph平台实现这套算法详见另一篇ata,尽请期待 ...
    文章 2018-02-01 6796浏览量
  • 彻底理解Cisco/Linux/Windows的IP路由

    距离矢量算法这种算法就是在这个网络的所有路由器节点之间进行运算的,是一种分布式算法。可以设想每一个路由器是一个点,连接路由器的链路是连接点的边,所有节点一起开始计算,直到一个稳定的状态。计算的方法就是...
    文章 2017-11-12 1079浏览量
  • 《深入分布式缓存》之“分布式理论:CAP是三选二吗?

    Marz认为一个分布式系统面临CAP难题的两大问题就是:在数据库中如何使用不断变化的数据,如何使用算法来更新数据库中的数据。Marz提出了2个基本思路: 1)数据不存在update,只存在append操作。这样就把对数据的处理...
    文章 2018-01-24 933浏览量
  • CAP的相对论

    Marz认为一个分布式系统面临CAP难题的两大问题就是:在数据库中如何使用不断变化的数据,如何使用算法来更新数据库中的数据。Marz提出了2个基本思路: 1)数据不存在update,只存在append操作。这样就把对数据的处理...
    文章 2016-07-07 4187浏览量
  • 新浪微博千万级规模高性能、高并发的网络架构经验分享

    第一个例子,在分布式系统我们会做 MySQL分 库 分表,我们要从不同的库和表中读取数据,这样的抽象最直观就是使用模板,因为绝大多数SQL语义是相同的,除了路由到哪个库哪个表,如果不使用Proxy中间件,模板就是性价...
    文章 2016-03-29 3389浏览量
  • BTA|周政军:区块链中侧链和分片解决不了的扩容问题,...

    就是说我要依据现在钱包里有多少钱来做竞标。工作量证明不是,工作量证明是要依据某一个时间段里面你做到了什么样,所以他有一个时间要素的问题。如果你用工作量证明虽然导致可能挖矿中心化,但是始终有可能或者有...
    文章 2018-04-18 1242浏览量
  • 时下最火搜索引擎:ElasticSearch详解与优化设计

    ElasticSearch(简称ES)是一个分布式、Restful的搜索及分析服务器,设计用于分布式计算;能够达到实时搜索,稳定,可靠,快速。和Apache Solr一样,它也是基于Lucence的索引服务器,而ElasticSearch对比Solr的优点...
    文章 2017-05-02 1287浏览量
  • 【阿里飞天】阿里飞天平台总架构师唐洪:飞天开放平台

    第三个本质的问题就是服务运营,云计算的本质问题就是服务运营,也就是说当你现在大家都说云计算跟电一样,你开电你不需要自己在家里安一个柴油发电机,你用多少电花多少钱。很多互联网公司的发展是爆炸的,他们...
    文章 2016-09-11 13944浏览量
  • 计算广告关键技术:他们怎么什么都知道?

    所谓关键技术,就是那些能让广告主觉得“这花的值”,让媒体网站觉得“这挣的快”的技术。具体都有哪些呢?下面我们一一来表。5.1 合约广告关键技术:受众定向 计算广告发展到合约广告阶段,媒体网站依靠受众...
    文章 2017-05-18 3085浏览量
  • Python机器学习笔记 使用scikit-learn工具进行PCA降维

    当然,我们还可以将参数设置为"mle",此时PCA类会用MLE算法根据特征的方差分布情况自己去选择一定数量的主成分特征来降维。我们也可以用默认值,即不输入n_components,此时n_components=min(样本数,特征数)。2)...
    文章 2019-04-04 2136浏览量
  • 面向机器学习的自然语言标注.

    本书中的所有示例代码都在交互Python shell编程环境中运行。关于如何使用这一环境,请参阅http://docs.python.org/tutorial/interpreter.html。如果没有特别说明,假设在所有的示例代码前使用命令import nltk。...
    文章 2017-05-02 11364浏览量
  • 北京六天十次面试,已拿到offer,面试题和总结分享...

    四、分布式及中间件8.请简述CAP理论。9.请简述Redis 2.X实现高可用的方法及如何水平扩展。10.请列举常用的消息中间件及其特点。11.请简述HBase的基本概念、应用场景及其与关系型数据库的区别。五、Java12.请简述...
    文章 2019-07-28 1855浏览量
  • 分享实录|第四范式程晓澄:机器学习在推荐系统中的...

    但是亚马逊当时就颠覆了这个概念,把全世界的书都放在网上,让世界上任何一个人都能找到他感兴趣的内容,那就直接省去了店面的成本,根据喜好直接推荐给他,这个就赚到了。再举个例子来说,在当年人们的文化消费...
    文章 2018-01-16 1104浏览量
  • 图数据库综述与 Nebula 在图数据库设计的实践

    Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。第三...
    文章 2019-08-10 2450浏览量
  • 【干货】蒋步星:关系代数的问题及尝试

    讲座全文: 今天的内容分五个部分,开始先讲一下...关系代数不区分这些JOIN类型,必须实现笛卡尔积式的JOIN运算,分布式计算就困难的多,一般的办法是将表按键值HASH到不同节点机上再计算,造成大量的网络传输。不同...
    文章 2017-04-03 1103浏览量
  • 为什么说流处理即未来?

    但是我们当然不希望所有的请求都被依次顺序处理,这与我们使用分布式系统的初衷相违背。所以我们需要保证这些请求最后的产生的影响看起来是按照顺序发生的,也就是一个请求产生的影响是基于前一个请求产生影响的基础...
    文章 2019-04-17 8997浏览量
  • 带你读《Python数据分析与数据化运营(第2版)》之三...

    假如我们通过一定方法确定带有缺失值(无论缺少字段的值缺失数量有多少)的字段对于模型的影响非常小,那么我们根本就不需要对缺失值进行处理。因此,后期建模时的字段或特征的重要性判断也是决定是否处理字段缺失...
    文章 2019-11-08 1558浏览量
  • 面经手册·开篇《面试官都问我啥》

    4.5.4 分布式任务 xxl-job 4.5.5 监控 系统非入侵全链路监控 TP99、TP999、QPS、TPS的熟悉程度 4.5.6 压测 是否压测过,有无经验 对系统健壮性的把控 JVM参数 GC调优 代码优化 4.6 环境 Linux Tomcat docker k8s 5....
    文章 2020-08-03 4547浏览量
  • 大数据和人工智能的关系,超全解析

    对于数据的传输:一个内存里面的队列肯定会被大量的数据挤爆掉,于是就产生了基于硬盘的分布式队列,这样队列可以多台机器同时传输,随你数据量多大,只要我的队列足够多,管道足够粗,就能够撑得住。对于数据的存储...
    文章 2019-03-29 1582浏览量
  • 张勇云栖连讲三年,你看懂阿里云原生的技术野心了吗

    “去IOE”其实是上云另一种表述方式,在IOE架构的系统中提升算力的思路是让服务器越来越强,而云计算的分布式思路是只需要增加服务器节点的数量,就能处理更多的并发服务请求,而云系统的业务连续性,并不是靠高可用...
    文章 2020-09-20 5320浏览量
  • 浅谈创业公司的技术发展历程

    来阿里之前,工作了4年半,其中3年半在某O2O型(餐饮)创业...5、按照时间线,由集中到分散,分布式、服务化是主流。6、系统的重构和优化,是个长期的过程。7、开发要有产品观。在大版本迭代时,产品观会非常强烈。Bye#
    文章 2016-11-22 8677浏览量
  • 最小可行性区块链原理解析

    我们可以不建立一个P2P分布式系统,而是建立一个所有集邮者的全局注册表,记录他们的帐户信息,对他们进行验证并(尝试)确保没人能通过创建多个身份作弊,最重要的是,保证有一个共享的分类账簿副本!具体来说,...
    文章 2018-04-19 928浏览量
  • 优秀工程师必备的一项技能,你解锁了吗?

    java,linux,数据结构和算法,数据库,网络通信与分布式计算的原理,这几类是比较重要的基础知识,我们在做方案设计、编码、问题排查中会运用得很多;设计模式,UML这个是对系统架构设计必要要掌握的知识,当你经历...
    文章 2019-06-13 38374浏览量
  • Google工程师:如何做到区块链的最小可行性呢?

    我们可以不建立一个P2P分布式系统,而是建立一个所有集邮者的全局注册表,记录他们的帐户信息,对他们进行验证并(尝试)确保没人能通过创建多个身份作弊,最重要的是,保证有一个共享的分类账簿副本!具体来说,...
    文章 2018-04-19 877浏览量
  • 带你读《区块链开发实战:基于JavaScript的公链与DApp...

    区块链技术是一种分布式不可篡改的加密数据库技术,主要解决的是去中心化节点间的数据一致性问题,并且融入了通证(Token)的经济激励机制。可以大大增强数据的安全度和可信度。区块链技术主要包括以下几个部分。1....
    文章 2019-10-30 1746浏览量
  • IBM技术专家:Hyperleger Fabric 架构与部署实例解析

    Hyperledger 是面向企业应用的全球最大的分布式账本开源项目,由 Linux 基金会支持,创建于 2015 年底。目前已有 200 多家科技、金融行业领军企业加入成员,包括 IBM、Intel、摩根、甲骨文、万达、百度、腾讯等。...
    文章 2018-04-12 61959浏览量
  • 简单介绍区块链技术

    大多数情况下,他们都在谈论分布式账本,即跨多台计算机复制的交易列表,而不是存储在中央服务器上。常见的主题似乎是一个数据存储: 通常包含金融交易 几乎实时地跨多个系统复制 通常存在于对等网络之上 使用密码学...
    文章 2018-04-16 1065浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化