资深数据产品专家,人工智能探索者。
一、前言 这是系列博文《知识图谱实战开发案例剖析》第1部分:知识图谱基础,第2节:知识图谱和人工智智能。该系列内容同时已经录制成视频课程,感兴趣的可以访问网易云课堂。 二、正文 2.1 人工智能的业务架构 人工智能的业务架构 感知能力:听清; 认知能力:听懂; 服务能力:响应; 2.2 人工智能的技术架构 三大层:基础设施层、技术框架层、应用服务层; 2.3 人机对话系统业务模型 三、未完待续 系列内容持续更新,敬请关注。
一、前言 这是系列博文《知识图谱实战开发案例剖析》第1部分:知识图谱基础,第一节:知识图谱完整案例演示。该系列内容同时已经录制成视频课程,感兴趣的可以访问网易云课堂。作者:张子良,版权所有,转载请注明出处。
一、前言 人工智能时代,开发一款自己的智能问答机器人,一方面提升自己的AI能力,另一方面作为转型AI的实战练习。在此把学习过程记录下来,算是自己的笔记。 二、正文 2.1 下载pyaiml 下载pyaiml 2.
一、前言 知识图谱本质(Knowledge Graph)上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库; 图的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,比如说两个实体之间的相似关系;知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,一般用三元组表示; 知识图谱的存储,通常采用RDF和图数据的方式,我们接下来看一下当前RDF和图数据系统的排行。
一、前言 打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来。
一、前言 打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来。
1.1 人工智能的概念定义 1.1 人工智能的概念定义 1.2 人工智能、机器学习和深度学习的关系 1.3 人工智能的两大主要特征 1.4 人工智能的发展简史 1.5 人工智能的生态格局-市场篇 1.
用VMwareware虚拟机安装的 Linux 系统剩余空间不足,造成软件无法正常安装。如果重新装一遍系统就需要重新配置好开发环境和软件的安装配置。 一、空间扩展 (1)打开VMware,选择Edit Virtual mache settings,Utilities下拉框中找到Expand如下图 (2)将磁盘空间扩大到50G,点击Expand即可,随后进入一个较长的Expand过程,完成后这是新的空间已经增加,但linux环境下还不可见。
一、前言 1.espeak版本: espeak-1.48.04-source 2.开发环境:VC+2015 二、正文 2.1 错误提示 LNK1104: cannot open file 'LIBC.
一、前言 到目前为止,取得这样的成果,我总结了一条经验:就是预先要把事情想清楚,把战略目的、步骤,尤其是出了问题如何应对,一步步一层层都想清楚;要有系统地想,这不是一个人或者董事长来想,而是有一个组织来考虑。
一、前言 从互联网到移动互联网,谁占据了用户桌面/屏幕,谁就占据了流量入口。个人认为:移动互联网时代的成败其实是浏览器的成败。基于此,作者从不同渠道搜集了2016年全年,各品牌浏览器的市场份额变化趋势数据,与大家共享。
一、分布式数据仓库技术架构 二、核心内容解读 (1)分布式数据仓库存储技术:hive+hdfs; (2)事实计算平台技术框架:spark; (3)数据挖掘算法技术框架:mllib + sparkR 作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
一、程序化交易业务领域模型 二、核心业务内容解读 (1)一个核心业务流程:流量交易流程; (2)二类用户服务客户端;媒体主服务客户端+广告主服务客户端; (3)三类业务平台;需求方平台+流量交易平台+供应方平台; (4)四类参与者角色:用户+媒体主+运营商+广告主; 三、数据运营体...
一、数据仓库架构 二、数据主题域设计 三、星型模型设计 四、数仓技术架构 作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
一、数据化运营方法体系: (1)核心理念: a.横向数据整合-实现跨部门、跨体系、跨公司的数据打通; b.纵向价值链打通:实现数据信息化(构建元数据管理系统)、信息知识化(构建数据血缘关系和知识分享平台)、知识智慧化(设计领域分析模型); (2)指导思想: a.
一、说明 网上提供的一个例子,做了修改与订正。 二、程序 #调入分词的库 library("rJava") library("Rwordseg") #调入绘制词云的库 library("RColorBrewer") library("wordcloud") #读入数据(特别注意,read.
一、wordcloud安装说明 install.packages("wordcloud"); 二、wordcloud2安装说明 install.packages("devtools"); devtools::install_github("lchif...
一、前言 数据产品设计与业务产品设计差异还是比较大的,根据过往的经验,引入5w+1h分析方法,形成数据产品设计思维框架,解决数据产品经理,面相数据产品设计,无从下手的问题。 二、正文 三、解读 3.
一、背景 昨天和几个PM探讨一款数据产品的设计,发现很多有趣的地方,记录下来,算是笔记吧。该PM的产品的设计文档示意如下图所示: 该PM设计的设计论述可以归纳为: 1.本产品提供功能1、2、3.
一、前言 Many of you are already familiar with the data warehouse bus architecture and matrix given their central role in building architected data marts.
一、总线架构 维度建模的数据仓库中,有一个概念叫Bus Architecture,中文一般翻译为“总线架构”。总线架构是Kimball的多维体系结构(MD)中的三个关键性概念之一,另两个是一致性维度(Conformed Dimension)和一致性事实(Conformed Fact)。
一、前言 Over the years, I have found that a matrix depiction of the data warehouse plan is a pretty good planning tool once you have gathered the bus...
一、大佬眼中的互联网思维-从一呼百应到烂大街,岁月留声机 如同一千个人眼里有一千个哈姆雷特(There are a thousand Hamlets in a thousand people's eyes)一样,一千个人眼中就有一千种互联网思维。
一、前言 刚刚有一个好友向我咨询数据相关的问题,朋友目前是IT设备生产厂商的人。从好友的描述中,提到对用户特征获取的需求。包括:人的兴趣爱好、关注焦点等,在用户的描述中其实只是直觉性的列决出了几点,然后基于此作相应的后续产品或服务推荐。
一、安装包 1.andorid studio; 2.Java sdk; 二、操作步骤 1.安装Java SDK; 2.安装android studio; 3.创建Helloword工程并运行;遇到问题: 三、问题及解决方案 3.
原则1:吃进肚子里的算你的; 1.野蛮生长阶段:为快不败; 原则2:一切皆过程; 一切都是过程,数据标准化是一个水道渠成的过程,不要拘于细节;昨日之结果,恰是今日之过程,业务驱动,以快速满足数据online为第一目标。
一、前言 网络用户行为数据采集的趋势渐成,尤其是移动应用普及的今天,不再只是传统的互联网公司的专宠,传统企业也是趋之若鹜。但是遗憾的却始终没有一个规范标准,全凭企业自发与自愿的到底底线来控制,数据立法尚未见曙光,无德者如支付宝,通讯录、短信已经不能满足他们的窥私欲,改而录音,偷拍种种,无所不用其极。
一、电商分类(平台+自营+复合) (1)平台型电商:淘宝+天猫+百度Mall等; (2)自营型电商: 2.1 综合型:京东(早期)+当当(早期); 2.2 垂直型:好像这种类型越来越少了; (3)复合型电商(平台+自营):京东+当当+亚马逊等; 二、平台...
一、总决 “天下武功唯快不败”,数据化运营战略在不同的行业、不同的企业之间是不同的,但是亦有其共性,即:快速的数据就绪和响应能力。完美主义者适合生活在保温箱里,唯有实践者才是真英雄。 二、纵向打通:数据价值链 通则不痛,纵向打通的是底层数据到上层业务应用之间的通路。
一、模型示意图 二、模型解读 Knowledge is also defined using taxonomy, with levels describing data, information, knowledge and wisdom.
一、前言 这是关于互联网上一篇文章的读后感,原文标题《大数据成变量,BAT入口生态或生变局》。读这篇文章既有醍醐灌顶之顿悟,亦有如履薄冰之恐惧,阿里好强,动作好快。其实,最近一直在思考当代企业信息化架构EA框架的调整,基本的一个思路是数据上提,与业务架构平齐,不再只是作为业务系统的功能支撑,而是自成一片天地,独立运营。
Information Engineering采用Crow's Foot表示法(也有叫做James Martin表示法的),中文翻译中对使用了Crow's Foot表示法的模型也有笼统的称做鸭掌模型的(关联关系的关联基数中采用到了一个鸭掌形的三叉线来表示)。
1引言 IDEF的含义是集成计算机辅助制造(Integrated Computer-AidedManufacturing,ICAM)DEFinition。最初的IDEF方法是在美国空军ICAM项目建立的,最初开 发3种方法:功能建模(IDEF0)、信息建模(IDEF1)、动态建模(IDEF2)...
一、前言 数据仓库建设往往伴随业务逻辑梳理、数据逻辑梳理 二、说明 作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
前言: 准备系统化整理一套分布式数据仓库建模实践指南,先把目录列出来吧,算是给自己设计一个目标吧。 第一部分 基础篇 第一章 数据仓库概念与定义 1.1 数据管理体系 1.2 数据仓库概念 1.
数据仓库建设原则第一条:一切为就绪数据让路; 数据仓库建设原则第二条:业务分析和数据分析深浅有度; 数据仓库建设原则第三条:数据价值挖掘切莫求之过急,水到渠才能成; 数据仓库建设原则第四条:团队目标必须一致,可以有异议,但是不可有异声; 数据仓库建设原则第五条:资深行业专家团队系统建设采用自顶向...
一、概述 星型模型设计,经常遇到的问题便是,此业务过程之维度,恰恰是另外一个业务过程的事实。最简单的例子如,产品销售业务活动,以订单为事实,以客户、产品、销售人员等为维度;而产品维度,在产品生产业务过程中则作为事实存在。
一、图谱最新版 二、更新说明 广告交易平台:新收录 广点通、及新创公司PMADX视频广告交易平台 DSP (需求方平台):新收录两家进入中国不久的国际DSP,xAd 和 Sociomantic SSP (供应方平台):新增 广告家、Adcosystem 和百度SSP Ad Verification (广告验证): 新收录两家业务开始进入中国的国际公司Sizmek(Peer39)和Forensiq, 以及本土新创公司Bigsec 数据提供和管理:新收录了艾沃互动DMP,比邻弘科DMP,以及国内最准确的公开IP库服务,IPIP.net。
一、数据分类模型 二、数据分类定义 元数据(metadata,Reference DataMaster DataEnterprise structure Data,Transaction Activity Data) 引用数据(), 主数据(), 企业结构数据() 交易活动数据() 交易审计数据(Transaction Audit Data) 元数据:数据的数据,平时我们设计表时,大部分属性字段就是元数据。
KDT#13 可以作为维度表使用的事实表 事实表从粒度的角度分为三种,分别是交易粒度事实表、周期快照事实表和累计快照事实表。 交易粒度事实表能提供某个确切时刻的描述信息。以银行帐户中保存的客户信息为例来说,代理机构会周期的更新客户的名称、地址、电话号码、客户分类、信用等级、风险等级及其他描述性信息。
一、杂项维度 在维度建模的数据仓库中,有一种维度叫Junk Dimension,中文一般翻译为“杂项维度”。杂项维度是由操作系统中的指示符或者标志字段组合而成,一般不在一致性维度之列。 在操作系统中,我们定义好各种维度后,通常还会剩下一些在小范围内取离散值的指示符或者标志字段。
一、前言 openrtb是一套开源的竞价广告系统,来自IAB的贡献,非常好。有非常多的值得借鉴的地方,最近基于其所提供sdk api接口文档介绍,整理了相关的资料。主要包括其生态图体系、业务流程和主要的对象模型和数据模型。
一、案例描述 在一个零售业数据仓库中,事实表保存着各销售人员的销售记录,某天一个销售人员从北京分公司调到上海分公司了,那么如何来保存这个变化呢?也就是说销售人员维度要怎么恰当的处理这一变化。 先来回答一个问题,为什么要处理,或保存这一变化?如果我们要统计北京地区或上海地区的总销售情况的时候,这个销售人员的销售记录应该算在北京还是算在上海?当然是调离前的算在北京,调离后的算在上海,但是如标记这个销售人员所属区域?这里就需要处理一下这个维度的数据,即我们缓慢变化维需要做的事情。
一、定义-impression This object describes an ad placement or impression being auctioned. A single bid request can include multiple Imp objects, a use c...
一、背景 Native Advertising (Native Ads), 又称为原生广告, 是2013全球媒体界爆红的关键词,从2012年年底,就有人开始提了这个名词,接着到处都可以看到这个名词,再接着,许多国外的研讨会开始有专题演讲, 更甚者,有专作原生广告的媒体创意代理商由此诞生。
一、背景 数据仓库建模过程中,针对事务型事实表设计,经常会遇到维度属性选择的问题,比如客户维度,在操作型系统中,为了跟踪客户状态的变化,往往会附加客户记录的四个属性: 1.add time:添加时间; 2.
一、前言 特别声明:本文整理自互联网。 遵循这些原则进行维度建模可以保证数据粒度合理,模型灵活,能够适应未来的信息资源,违反这些原则你将会把用户弄糊涂,并且会遇到数据仓库障碍。