中国餐馆过程(CRP)

简介:   查如何事先确定聚类簇数目发现的,是对狄利克雷过程的(DP)的一种解释。   假设一个中国餐馆有无限的桌子,第一个顾客到来之后坐在第一张桌子上。第二个顾客来到可以选择坐在第一张桌子上,也可以选择坐在一张新的桌子上,假设第n+1个顾客到来的时候,已经有k张桌子上有顾客了,分别坐了n1,n2,...,nk个顾客,那么第n+1个顾客可以以概率为ni/(\alpha+n)坐在第i张桌子上,ni为第i张桌子上的顾客数;同时有概率为\alpha/(\alpha+n)选取一张新的桌子坐下。

  查如何事先确定聚类簇数目发现的,是对狄利克雷过程的(DP)的一种解释。

  假设一个中国餐馆有无限的桌子,第一个顾客到来之后坐在第一张桌子上。第二个顾客来到可以选择坐在第一张桌子上,也可以选择坐在一张新的桌子上,假设第n+1个顾客到来的时候,已经有k张桌子上有顾客了,分别坐了n1,n2,...,nk个顾客,那么第n+1个顾客可以以概率为ni/(\alpha+n)坐在第i张桌子上,ni为第i张桌子上的顾客数;同时有概率为\alpha/(\alpha+n)选取一张新的桌子坐下。那么在n个顾客坐定之后,很显然CRP把这n个顾客分为了K个堆,即K个clusters,可以证明CRP就是一个DP。

  注意这里有一个限制,每张桌子上只能有同一个dish,即一桌人喜欢吃同一道菜。

  可以看出每个桌子已经有的数据越多,那么下一次被选中的概率越大,因为是与在桌子上的个数成正比的。

目录
相关文章
|
数据采集 自然语言处理 JavaScript
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等
程序人生 - 国有划拨和国有出让的区别 & 国有划拨参照什么标准进行
程序人生 - 国有划拨和国有出让的区别 & 国有划拨参照什么标准进行
163 0
程序人生 - 国有划拨和国有出让的区别 & 国有划拨参照什么标准进行
证监会发布IPO 50问,涉及对赌协议等关键问题
相比坊间传闻的51条,正式解答有部分改变。
607 0
「镁客早报」夏普分拆半导体业务;教育部要求高校组织开展基因编辑相关研究项目自查工作
财富网公布2018年度最具影响力创新公司;科学家首次正式量子通讯优于传统信息传输方式。
420 0
|
JavaScript HTML5 移动开发
DOM 4.1 规范成为候选推荐标准陷困境,只因巨头齐反对
一直在推进网络技术标准的组织 —— 万维网联盟(W3C)最近遇到了困境:苹果、谷歌、微软和 Mozilla 这四大浏览器制造商纷纷对 W3C 拟定的 DOM 4.1 规范表示反对。
1405 0

热门文章

最新文章