全文链接:http://tecdat.cn/?p=32660
肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战(点击文末“阅读原文”获取完整代码数据)。
现代医学治疗肿瘤的手段和方式已经日臻完善,主要为手术配合放、化疗联合治疗。
但传统西医治疗在提高缓解率的同时易产生较强的毒副作用与耐药性。作为传统医学主体的中医药与西医相结合辨证施治,在提高疗效、缓解不良反应等方面有其独特的优势。
本研究帮助客户在收集数据建立抗肿瘤中药数据库的基础上,运用数学模型探寻抗肿瘤中药性效关系及现代药理学研究,为抗肿瘤中医及中西医综合治疗的临证用药提供理论依据。
读取数据
siqi=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=1 ) wuwei=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=2 ) guijing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=3 ) duxing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=4 ) gongneng =read.xlsx("性效挖掘一列0616 2.xlsx",sheet=5 )
(一)频数统计
四气、五味、归经、有(无)毒、药理功能基础分析
(1)抗肿瘤中药四气、五味、归经、有无毒性、功能、药理作用→频数统计( or 数据分布)
(四气、五味、归经、有毒无毒考虑数字、直方图、饼图表示)
绘制直方图
barplot(table(unlist(x[,2]))) tab1=table(unlist(x[,2])) tab2=table(unlist(x[,2]))/sum(table(unlist(x[,2]))) res=cbind(tab1,tab2) colnames(res)=c("频数","频率")
a_df3=merge(siqi,wuwei,by="流水号" ) a_df3=merge(a_df3,guijing,by="流水号" )
交叉表
药味和四气那两列要和功效分别做两张这种图
tab=table(a_df$功能,a_df$四气) for(i in 1:ncol(tab)){
导出为excel文件:
(二)关联规则
对经典的 Apriori 算法进行改进,编程实现双向强关联规则挖掘方法,采用此方法分析药 - 药性 - 功效之间的联系
将数据转换成事务类型
for(i in 2:ncol(a_df3))a_df3[,i]=as.factor(a_df3[,i]) rulesmodel=function(X){ rules <- sort(rules, by="support") arules::inspect(head(rules, n=20)) #查看最高置信度样本规则 rules <- sort(rules, by="confidence")
(1)药性 功效关联性分析
1)药性关联性分析
①四气、五味
rulesmodel(c("四气","五味"))
点击标题查阅往期内容
PYTHON在线零售数据关联规则挖掘APRIORI算法数据可视化
01
02
03
04
②四气、归经
点击标题查阅往期内容
R语言APRIORI关联规则、K-MEANS均值聚类分析中药专利复方治疗用药规律网络可视化
01
02
03
04
R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究(下):https://developer.aliyun.com/article/1496808