• 关于

    采样过程问题怎么解决

    的搜索结果
  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT)

    亲爱的各位同仁,各位同学,早上好。讲到大数据,就要问数据分析师应该做什么?所以我今天的标题是大数据分析师的卓越之道。这里不一定讲的对,讲的对的我也不一定懂,所以请大家以批评式的方式去理解。 这是一个典型的数据分析的场景,下面是基础设施,数据采集、存储到处理,左边是数据处理,右边价值输出。连接...

    文章 小旋风柴进 2017-05-02 1118浏览量

  • 数字化和模拟化—信息论系列

    总是听到有人拿数字系统和模拟系统做对比,其实二者根本就不是一个层次的,模拟化会更加全面一些,它在努力重现一些事实,并且在某种程度上力图达到效果的一致,比如模拟放音机,它就是用来试图重现声音的,其实我们的世界模拟概念无所不在,我写文章其实就是在模拟我的思想...但是模拟系统有个固有的弊端,就是无法做...

    文章 科技小能手 2017-11-12 805浏览量

  • [译]如何处理机器学习中的不平衡类别

    本文讲的是[译]如何处理机器学习中的不平衡类别, 原文地址:How to Handle Imbalanced Classes in Machine Learning 原文作者:elitedatascience 译文出自:掘金翻译计划 本文永久链接:github.com/xitu/go...

    文章 玄学酱 2017-10-16 2900浏览量

  • CVPR 2017精彩论文解读:综合使用多形态核磁共振数据的3D生物医学图像分割方法 | 分享总结

    雷锋网 AI 科技评论按:计算机视觉盛会 CVPR 2017已经结束了,雷锋网 AI 科技评论带来的多篇大会现场演讲及收录论文的报道相信也让读者们对今年的 CVPR 有了一些直观的感受。 论文的故事还在继续 相对于 CVPR 2017收录的共783篇论文,即便雷锋网(公众号:雷锋网)(公众号:雷锋...

    文章 云栖大讲堂 2017-08-01 1230浏览量

  • 阿里视频云黄海宇:解析世界杯超大规模直播场景下的码率控制

    在本月的重庆云栖大会飞天技术汇专场中,阿里云高级算法专家黄海宇分享了题为《超大规模直播码率控制》的议题,从生产的链路角度来说世界杯怎么让观众看到更加清晰的视频。 这一次的世界杯,与以往世界杯最大的区别在于,有很多互联网用户观看直播,而不是在电视上。在互联网观看直播,互联网的网络条件不一样,观众会...

    文章 樰篱 2018-09-03 7281浏览量

  • 云杉网络亓亚烜:用SDN打造安全可控的云数据中心网络

    2016年6月2日,“2016全球SDNFV技术大会”进入了第二天。作为连续举办三届的SDN/NFV技术与产业盛会,本届大会着眼于SDN/NFV的实践应用与部署,从SDN/NFV在运营商网络、企业网、云数据中心、测试解决方案等多个场景的应用出发,深入解析产业部署现状及面临的挑战与发展趋势。 云杉...

    文章 行者武松 2017-09-02 1223浏览量

  • 数据变现的历史与未来

    其中,360商业产品首席架构师刘鹏就分享了他对于“数据变现与交易”话题的观点看法。在这场题为《数据变现的历史与未来》的演讲中,刘鹏结合自己在数据领域的实践经验,强调了“计算广告(Computational Advertising)”的概念。 大数据文摘编者根据现场录音及速记整理出了一些干货,以下都...

    文章 小旋风柴进 2017-05-02 1343浏览量

  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT珍藏版)

    亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不一定真懂了,所以请大家以批判的方式去理解。 这是一个典型的数据分析的场景,下面是基础设施,数据采集、存储到处理,左边是数据处理,右边价...

    文章 小旋风柴进 2017-05-02 1052浏览量

  • Hive之数据倾斜的原因和解决方法

    数据倾斜 在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些Counters得出的平均值,而由于数据倾斜的原因造成map处理数据量的差异过大,使得这些平均值能代表的价...

    文章 潜水到明朝 2016-09-23 6690浏览量

  • 清华大学计算机科学与技术系朱军教授:机器学习里的贝叶斯基本理论、模型和算法

    雷锋网[AI科技评论]按:3月3日,中国人工智能学会AIDL第二期【人工智能前沿讲习班】在北京中科院自动化所举行,本期讲习班的主题为【机器学习前沿】。周志华教授担任学术主任,前来授课的嘉宾均为中国机器学习界一流专家、资深科研人员和企业精英,包括:耿新、郭天佑、刘铁岩、王立威、叶杰平、于剑、余扬、张...

    文章 云栖大讲堂 2017-08-01 1564浏览量

  • 【AI学霸榜】世界名校十大学霸获200万奖金,NLP、CV等四大领域学术秘籍曝光

    1月22日,2017年度百度奖学金颁奖典礼在百度科技园举行,10位来自世界名校的候选人平分200万人民币奖金。 经过从初选到答辩的层层选拔,来自清华大学的王奕森和林衍凯、北京大学的王云鹤、复旦大学的吴昊、中国人民大学的陈师哲、哈尔滨工业大学的朱鎔、厦门大学的张飚、卡耐基梅隆大学的胡志挺和王小龙、麻...

    文章 技术小能手 2018-01-23 5643浏览量

  • 经验之谈:内存问题造成数据库性能异常怎么破?

    云栖号:https://yqh.aliyun.com第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策! 导读:在使用数据库的过程中,内存不足常常会引起数据库异常。但是内存不足,又会为数据库带来哪些具体的影响呢?本次,我们将通过某客户现场数据库在某个...

    文章 云栖号资讯小编 2020-03-11 385浏览量

  • 想买奶茶,高德如何让我更快喝到?

    作者 | 雪糥,星泉 对搜索排序模块做重构 搜索建议(suggest服务)是指:用户在输入框输入query的过程中,为用户自动补全query或POI(Point of Interest,兴趣点,地理信息系统中可以是商铺、小区、公交站等地理位置标注信息),罗列出补全后的所有候选项,并进行智能排序。...

    文章 剑曼红尘 2019-12-29 257浏览量

  • Spark Sort Based Shuffle内存分析

    前言 借用和董神的一段对话说下背景: shuffle共有三种,别人讨论的是hash shuffle,这是最原始的实现,曾经有两个版本,第一版是每个map产生r个文件,一共产生mr个文件,由于产生的中间文件太大影响扩展性,社区提出了第二个优化版本,让一个core上map共用文件,减少文件数目,这样共...

    文章 祝威廉 2016-09-07 1686浏览量

  • 机器学习在高德搜索建议中的应用优化实践

    导读:高德的愿景是:连接真实世界,让出行更美好。为了实现愿景,我们要处理好LBS大数据和用户之间的智能链接。信息检索是其中的关键技术,而搜索建议又是检索服务不可或缺的组成部分。 本文将主要介绍机器学习在高德搜索建议的具体应用,尤其是在模型优化方面进行的一些尝试,这些探索和实践都已历经验证,取得了不...

    文章 高德技术小哥 2019-07-09 12395浏览量

  • 数据仓库、数据湖、流批一体,终于有大神讲清楚了!

    作者:蒋晓伟(量仔) 阿里云研究员金晓军(仙隐) 阿里云高级技术专家摘要:数据仓库,数据湖,包括Flink社区提的流批一体,它们到底能解决什么问题?今天将由阿里云研究员从解决业务问题出发,将问题抽丝剥茧,从技术维度娓娓道来:为什么你需要数据湖或者数据仓库解决方案?它的核心难点与核心问题在哪?如果...

    文章 May-Hologres 2020-05-14 1312浏览量

  • 干货 | 算法工程师入门第一期——罗恒讲深度学习

    雷锋网(公众号:雷锋网)按:本文为大牛讲堂算法工程师入门课程第一篇。地平线资深算法工程师罗恒、穆黎森、黄李超将分别带来深度学习、增强学习、物体检测的相关课程。本期地平线资深算法研究员罗恒将为大家带来深度学习简介,包括神经网络历史回顾和神经网络训练等内容。 ▼  整个神经网络,从历史上就可以把很多...

    文章 云栖大讲堂 2017-08-01 1525浏览量

  • 深刻!阿里、宝洁大数据实战

    虎嗅F&M;创新节的“如何洞察用户:阿里与宝洁的大数据实战”专场里,阿里巴巴数据委员会会长车品觉、宝洁中国市场研究部总经理李霈、英特尔中国研究院首席工程师吴甘沙和股票雷达创始人冯月聊到一个很有趣的话题:作为传统公司,宝洁很羡慕阿里能够轻易收集到真实、实时、全面的的数据,但车品觉却说,大数据...

    文章 小旋风柴进 2017-04-03 1390浏览量

  • 对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析

    1、背景 GAN作为生成模型的一种新型训练方法,通过discriminative model来指导generative model的训练,并在真实数据中取得了很好的效果。尽管如此,当目标是一个待生成的非连续性序列时,该方法就会表现出其局限性。非连续性序列生成,比如说文本生成,为什么单纯的使用GAN...

    文章 技术小能手 2018-08-22 1801浏览量

  • 论文笔记之: Deep Metric Learning via Lifted Structured Feature Embedding

      Deep Metric Learning via Lifted Structured Feature Embedding CVPR 2016      摘要:本文提出一种距离度量的方法,充分的发挥 training batches 的优势,by lifting the vector of pa...

    文章 wangxiaocvpr 2016-09-29 1632浏览量

  • 接下时序数据存储的挑战书,阿里HiTSDB诞生了

    近日,2017中国数据库技术大会在京召开,来自阿里巴巴中间件团队高级技术专家钟宇(花名悠你)在数据存储和加速技术专场分享了题为《时间序列数据的存储挑战》的演讲,主要介绍了时序数据的由来,时序数据处理和存储的挑战,以及目前业界的通用做法。在案例展示部分,他结合阿里内部业务场景和时序数据的特点,讲述阿...

    文章 技术小能手 2017-06-16 3117浏览量

  • 中间件性能挑战赛上线了两大黑科技,是高手就盘它!!

    本届挑战赛的评测环节完全使用了云上的产品和服务,是一场真正意义上的云端赛事。可能有人会说:这有什么了不起?其实不然,纵观每届挑战赛,这还是第一次完全抛弃了阿里集团内部的专有系统而完全拥抱公共云,这是具有里程碑意义的一次改变。 正因如此,本届比赛才得以用到更多云原生的产品和服务,选手能够在比赛中使用...

    文章 中间件小哥 2019-07-01 3799浏览量

  • 《基于模型的软件开发》——2.1 基本理念

    本节书摘来自华章计算机《基于模型的软件开发》一书中的第2章,第2.1节,作者:[美]H. S.莱曼(H. S. Lahman)著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.1 基本理念 OO范式较之以前的软件开发方法更加复杂精密。从硬件计算的角度我们并没有直观感受,因此需要一种...

    文章 华章计算机 2017-07-03 990浏览量

  • 数据仓库、数据湖崛起后,下一个应该是什么?

    作者:蒋晓伟(量仔) 阿里云研究员金晓军(仙隐) 阿里云高级技术专家 一、业务背景 1.1 典型实时业务场景 首先我们来看一个典型的实时业务场景,这个场景也是绝大部分实时计算用户的业务场景,整个链路也是一个典型的流计算架构:把用户的行为数据或者数据库同步的Binlog,写入至kafka,再通过...

    文章 May-Hologres 2020-05-14 15620浏览量

  • 机器学习性能改善备忘单:32个帮你做出更好预测模型的技巧和窍门

    机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。 而预测性建模的首要问题是: 如何才能得到更好的结果? 这个备忘单基于本人多年的实践,以及我对顶级机器学习专家和大赛优胜者的研究。 有了这份指南,你不但不会再掉进坑里,而且会提升性能,甚至在你自己...

    文章 知与谁同 2017-08-01 842浏览量

  • 机器学习性能改善备忘单:32个帮你做出更好预测模型的技巧和窍门

    机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。  而预测性建模的首要问题是: 如何才能得到更好的结果? 这个备忘单基于本人多年的实践,以及我对顶级机器学习专家和大赛优胜者的研究。 有了这份指南,你不但不会再掉进坑里,而且会提升性能,甚至...

    文章 小旋风柴进 2017-05-27 1232浏览量

  • 干货 | 算法工程师入门第二期——穆黎森讲增强学习(一)

    雷锋网(公众号:雷锋网)按:本期地平线资深算法工程师、增强学习专家穆黎森将为大家带来增强学习简介(一),本讲内容主要涉及增强学习基本概念及Deep Q Learning的相关内容。 传送门:干货 | 算法工程师入门第二期——穆黎森讲增强学习(二) 今天我很荣幸有机会在这里,跟大家分享增强学习(R...

    文章 云栖大讲堂 2017-08-01 1011浏览量

  • TICA 2019 如何保障智能硬件产品的快速迭代

    导读:随着无人机技术的不断发展,相关产品的软硬件和算法的经过了一系列的快速迭代,来自大疆的张晓明为我们分享大疆是如何做快速迭代与测试,在快速迭代之中,大疆的研发测试做了什么,遇到了什么样的困境和挑战,又是如何做到突破。 我们是做无人机的,我周围的朋友一提到无人机,基本上都会问我这个东西能够飞多远、...

    文章 KB小秘书 2020-03-03 334浏览量

  • 深度学习贝叶斯,这是一份密集的6天速成课程

    教师 多数讲师和助教都是贝叶斯方法研究团队的成员以及来自世界顶级研究中心的研究者。很多讲师曾经在顶级国际机器学习会议例如 NIPS、ICML、ICCV、CVPR、ICLR、AISTATS 等发表过论文。贝叶斯方法研究团队已经开发了一系列的大学课程,包括贝叶斯方法、深度学习、优化以及概率图模型,拥有...

    文章 技术小能手 2018-09-26 2972浏览量

  • 三角兽首席科学家分享实录:基于对抗学习的生成式对话模型

    本文来自AI新媒体量子位(QbitAI) 对抗学习和对话系统都是近年来的新热点。今年7月,三角兽研究组与哈工大ITNLP实验室合作完成的论文被自然语言领域顶级会议EMNLP录取。 上周三(8月9日)晚,量子位邀请到三角兽首席科学家王宝勋,与大家分享了论文中基于对抗学习的生成对话模型内容。 这...

    文章 行者武松 2018-01-15 821浏览量

1 2 3 4 ... 9 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT