• 关于

    增量模型是啥

    的搜索结果
  • 基于 Flink+Iceberg 构建企业级实时数据湖

    Apache Flink 是大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构。那么当 Apache Flink 遇见数据湖时,会碰撞出什么样的火花呢?本次分享主要包括以下核心内容: 数据湖的相关背景介绍; 经典业务场景介绍; 为什么选择 Apache Iceber...

    文章 阿里云实时计算Flink 2020-12-04 791浏览量

  • 基于MaxCompute/Dataworks实现数据仓库管理与全链路数据体系

    前言   就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家。也有很多伙伴执迷于数据,成为了行业的数据研发专家。当然还有很多小伙伴,热衷于工具系统开发,成为了数据技术专家。那么我们回过头来考虑,什么是大数据,什么又是数据仓库,什么又是数据技术。大数据其实是个...

    文章 隐林 2019-04-28 1817浏览量

  • 推荐系统笔记

    1、产生原因 信息过载 无明确需求 2、什么是推荐? 在信息过载又没有明确需求的情况下,找到用户感兴趣的东西。 《Mahout实战》上的定义是:推荐就是通过对喜好的这些模式进行预测,借以发现你尚未知晓,却合乎心意的新事物。 3、推荐和搜索区别: 相同点:快速发现有用信息的工具 不同点:搜索引...

    文章 雨客 2016-04-08 3834浏览量

  • Recommender Systems协同过滤

      第一部分是学习ID3时候积累的。 一.以前写的基础知识   1.信息:是用来消除不确定性的度量,信息量的大小,由所消除的不确定性的大小来计量(香农)。  2.由于不确定性是由随机性引起的,所以用概率来描述和计量;熵entropy:源于热力学,是分子混乱程度的度量。  3.X(离散型随机变量)的...

    文章 哈沙给 2015-05-14 732浏览量

  • 2. 妈呀,Jackson原来是这样写JSON的

    没有人永远18岁,但永远有人18岁。本文已被 https://www.yourbatman.cn 收录,里面一并有Spring技术栈、MyBatis、JVM、中间件等小而美的专栏供以免费学习。关注公众号【BAT的乌托邦】逐个击破,深入掌握,拒绝浅尝辄止。 前言 各位好,我是A哥(YourBatm...

    文章 YourBatman 2020-07-24 233浏览量

  • 为构建社交关系链手淘都做了啥?

    作者|王卫(泓冰) 出品|阿里巴巴新零售淘系技术部 01、淘宝社交关系推荐的背景 1、互联网下半场到来:互联网的下半场,人口红利消失,各大平台需要对用户做精细化运营,用户的增长和留存是每一个平台需要深耕的方向; 2、社交电商的兴起和趋势:社交电商的有效性和价值,已经在拼多多、小红书、云集和环球捕...

    文章 淘系技术 2019-10-16 927浏览量

  • Docker是个啥?

    谈到docker大家应该都不陌生,从2013年初诞生到现在,短短两年时间内,迅速成为仅次于openstack的最受欢迎的云计算开源项目。        那么是什么原因导致docker这么火热呢?        我也很感兴趣,因此我将用docker实践这一系列博文,记录我对docker的认识和实践。...

    文章 余二五 2017-11-16 1423浏览量

  • Docker是个啥?

         谈到docker大家应该都不陌生,从2013年初诞生到现在,短短两年时间内,迅速成为仅次于openstack的最受欢迎的云计算开源项目。        那么是什么原因导致docker这么火热呢?        我也很感兴趣,因此我将用docker实践这一系列博文,记录我对docker的认...

    文章 余二五 2017-11-15 614浏览量

  • 用Python对用户评论典型意见进行数据挖掘

    用户体验的工作可以说是用户需求和用户认知的分析。而消费者的声音是其中很重要的一环,它包含了用户对产品的评论,不管是好的坏的,都将对我们产品的改进和迭代有帮助。另外任何事情都要考虑金钱成本和人力成本,因此我希望能通过机器学习的算法来辅助分析,对用户的评论数据进行提炼和洞察。 一、数据获取和清洗 现在...

    文章 青衫无名 2018-03-14 1387浏览量

  • Java技术周刊第8期:JVM的GC(垃圾回收器)机制

    【点击订阅Java技术周刊】 Java的开发者们: 云栖社区已有5000位Java开发者,发布了30000+Java文章(文章列表),沉淀了7000+的Java精品问答(问答列表)。 Java技术周刊将会为大家介绍最新的Java技术与动态、预告活动、最热问答、直播教程等,欢迎大家订阅Java技术周...

    文章 李博 bluemind 2019-05-14 8284浏览量

  • 18个PPT,29个提问解答,都在这儿啦!

    4月25-26日,全球首个 Apache 顶级项目在线盛会 Flink Forward 中文精华版重磅开播,聚焦 Alibaba、 Google、AWS、Uber、Netflix、DellEMC、微博、滴滴等各大互联网公司实时计算的经典场景和业务故事,由 Flink 核心贡献者们对 19 个优质 ...

    文章 阿里云实时计算Flink 2020-04-28 806浏览量

  • 首次公开!阿里搜索中台开发运维一体化实践

    阿里妹导读:2015年底,阿里宣布启动阿里巴巴集团中台战略。战略定义为:构建符合DT时代的更具创新性、灵活性的“大中台、小前台”组织机制和业务机制。其中,前台作为一线业务,更敏捷更快速适应市场,中台将集合整个集团的数字运营能力、产品技术能力,对各业务前台形成强力支撑,而集团在中台布局中一个非常重要...

    文章 技术小能手 2018-08-01 5900浏览量

  • 开放下载!18个PPT,29个提问解答,都在这儿啦!

    点击免费下载18个PPT资料包>>> 4月25-26日,全球首个 Apache 顶级项目在线盛会 Flink Forward 中文精华版重磅开播,聚焦 Alibaba、 Google、AWS、Uber、Netflix、DellEMC、微博、滴滴等各大互联网公司实时计算的经典场景和...

    文章 阿里云实时计算Flink 2020-04-28 16528浏览量

  • 中华万年历CTO杭建:Java后端技术概览(赠书福利)

    软件开发的核心原则 此处所说的是软件开发应该遵循的一些核心原则: Don't Repeat Yourself: 这是软件开发的一个基础原则,即不要做重复性劳动。也是现在所说的“极客文化”的一种。代码重复、工作重复在软件开发中都是不合理的存在。利用各种手段消除这些重复是软件开发的一个核心工作准则。 ...

    文章 技术小能手 2018-05-16 2356浏览量

  • 初始化数据库和导入数据

    在Spring Boot应用的测试一文中,我们在StarterRunner类的run(...)方法中给数据库中添加一些初始数据。尽管通过编程方式添加初始数据比较快捷方便,但长期来看这并不是一个好办法——特别是当需要添加的数据量很大时。我们开发最好把数据库准备、数据库修改和数据库的配置与将要运行的程...

    文章 杜琪 2016-06-07 3193浏览量

  • 招募有志青年

    0 初衷 现在有很多的技术交流群,很多的群都是这样的: 1 经常扯淡 2 很多伸手党 3 一些道听途说的结论都拿来作为自己的观点 4 技术交流的深度不够 花费了很多时间在群上,但是收获缺并不多。而想找到一个有深度的交流群,而不是一个问答群。希望如下: 1 针对一个话题,感兴趣的人都能够进行深...

    文章 乒乓狂魔 2016-12-04 3107浏览量

  • Spark Streaming 1.6 流式状态管理分析

    关于状态管理 在流式计算中,数据是持续不断来的,有时候我们要对一些数据做跨周期(Duration)的统计,这个时候就不得不维护状态了。而状态管理对Spark 的 RDD模型是个挑战,因为在spark里,任何数据集都需要通过RDD来呈现,而RDD 的定义是一个不变的分布式集合。在状态管理中,比如Sp...

    文章 祝威廉 2016-09-09 1861浏览量

  • Java工程师成神之路(2019正式版)

    主要版本 更新时间 备注 v1.0 2015-08-01 首次发布 v1.1 2018-03-12 增加新技术知识、完善知识体系 v2.0 2019-02-19 结构调整,更适合从入门到精通;进一步完善知识体系; 新技术补充; 一、基础篇 面向对象 什么是面向对象 面向对象、面...

    文章 Hollis 2019-02-21 3711浏览量

  • 从零开始教你训练神经网络(附公式&学习资源)

    作者从神经网络简单的数学定义开始,沿着损失函数、激活函数和反向传播等方法进一步描述基本的优化算法。在理解这些基础后,本文详细描述了动量法等当前十分流行的学习算法。此外,本系列将在后面介绍 Adam 和遗传算法等其它重要的神经网络训练方法。 I. 简介 本文是作者关于如何「训练」神经网络的一部分经验...

    文章 技术小能手 2017-12-18 2490浏览量

  • 在MySQL和PostgreSQL之外,为什么阿里要研发HybridDB数据库?

    2016-12-09 来源:InfoQ 作者:萧少聪 阿里云为什么要做HybridDB?Pivotal么看待阿里云此举?Pivotal中国研发中心总经理冯雷(Ray Feng)、阿里云数据库总负责人余锋(褚霸)于12月13日线上发布会剖析自己的想法。点击回顾视频:除了发布外,我们还想告诉你——阿...

    文章 yq传送门 2016-12-09 13257浏览量

  • 系统架构-性能篇章2(系统拆分2-问题)

    在文章《系统架构-性能篇章2(系统拆分1)》有提及到过关于系统在什么情况下会拆分,拆分的目之类的问题,本文会阐述一些关于拆分过程中遇到的各种各样的常见问题进行分析,和上一个文章中提及到的一样,讲解的目录如下: 1、负载均衡设备的问题。 2、不同系统之间的通信问题。 3、数据写入和查找的问题。 4、...

    文章 钟隐 2011-11-15 1362浏览量

  • MapReduce论文中文翻译

    原文地址: http://labs.google.com/papers/mapreduce.html 译者: alex 摘要 MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合...

    文章 机械键盘 2015-03-18 1320浏览量

  • 软件工程的引入:Scrum开发框架总结

    俗话说,自己写的代码,6个月后也是别人的代码……复习!复习!复习!涉及的知识点如下: 软件工程概念 敏捷开发过程scrum 一、什么是软件工程?请用一句话描述。   软件工程是一门研究性的学科:它用工程化的方法(联系建筑工程……),构建和维护有效的、实用的,和高质量的软件。简单来说,软件工程有...

    文章 ghost丶桃子 2016-05-19 2600浏览量

  • ApsaraDB的左右互搏术 - 解决企业痛处 TP+AP混合需求 - 无须再唱《爱你痛到不知痛》

    标签 PostgreSQL , HybridDB , HTAP , OLTP , OLAP , 混合场景 , Oracle , 企业痛点 , 数据库痛点 背景 随着IT行业在更多的传统行业渗透,我们正逐步的在进入DT时代,让数据发挥价值是企业的真正需求,否则就是一堆废的并且还持续消耗企业人力,...

    文章 德哥 2017-01-01 4834浏览量

  • 解读 V8 GC Log(一): Node.js 应用背景与 GC 基础知识

    原作者:洗影 前言 本文基于我在 Node.js 基金会主办的 Node Live Beijing 的分享,因为微软准备了一个翻译,现场临时把英文的分享改成中文了,有点磕巴。加上分享时长有限很多地方没有展开,于是现在事后来用文字再详细写一下这个题目。 本文是该系列的第一篇,第二篇请点这里:解读 V...

    文章 _朴灵_ 2018-05-14 5410浏览量

  • MongoDB 杭州用户会全记录(千寻位置、妈妈帮、阿里云专家等精彩分享)

    MongoDB杭州用户交流会于2017年3月12日下午在阿里巴巴西溪园区举行,吸引了来自全国各地的近300名用户参与,千寻位置、妈妈帮、阿里云等公司的5位技术专家分享了MongoDB 的运维管理及使用经验,干货满满。 用户会进行过程中我已经在中文社区微信总群、二群里做了实时的图文直播,这里再做一...

    文章 张友东(林青) 2017-03-13 6371浏览量

  • 金三银四,2019大厂Android高级工程师面试题整理+进阶资料

    金三银四,很多同学心里大概都准备着年后找工作或者跳槽。最近有很多同学都在交流群里求大厂面试题。正好我电脑里面有这方面的整理,于是就发上来分享给大家。 这些题目是网友去百度、小米、乐视、美团、58、猎豹、360、新浪、搜狐等一线互联网公司面试被问到的题目。熟悉本文中列出的知识点会大大增加通过前两轮技...

    文章 Android进阶开发 2019-03-25 3188浏览量

  • 阿里人工智能这五年:天才的野心与自证

    来源:机器之心微信公众号 作者:四月 机器之能原创 「迈出象牙塔,踏进商业场,科学家如何自证价值?」 过去五年,阿里在全球人工智能的激烈赛道上悄然跑进了第一梯队,背后一群以达摩院称号对外示人的科学家群体愈发神秘撩人。 这是一群野心勃勃的科学家,亲手打破旁人艳羡的舒适区,踏入充满禁忌的未知地,...

    文章 开发者社区 2019-08-29 1092浏览量

  • PostgreSQL 逻辑同步

    简单概念: 1. 逻辑复制是基于数据对象的复制标识(通常是主键)复制数据对象及其更改的方法。 2. 物理复制是用准确的块地址以及逐字节的复制方式。 3. 逻辑比物理在数据复制和安全上有更细粒度的控制。 4. 逻辑复制使用发布(publish)和订阅(subscribe)模型(类似于sqlserve...

    文章 冰镇柠檬汁 2020-07-17 133浏览量

  • 阿里ARouter路由实现Android模块化开发

    概述 从 2016 年开始,模块化在 Android 社区越来越多的被提及。随着移动平台的不断发展,移动平台上的软件慢慢走向复杂化,体积也变得臃肿庞大,为了降低大型软件复杂性和耦合度,同时也为了适应模块重用、多团队并行开发测试等等需求,模块化在 Android 平台上变得势在必行。阿里 Andro...

    文章 code_xzh 2018-04-24 5267浏览量

1 2 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询