1 简介
在中医智能舌诊项目中需要舌体胖瘦的自动分析
舌体胖瘦是中医诊断中重要的观察依据,。胖大舌“舌色淡白,舌体胖嫩,比正常舌大而厚,甚至充满口腔”,主脾肾阳虚,气化失常,水湿内停。舌体比正常舌瘦小而薄,称为“瘦薄舌”,主气血两虚和阴血不足。中医一般通过与正常舌比较来判断舌的胖瘦。但由于年龄、性别、区域的差异,正常舌本身就没有一个大小标准,给舌体胖瘦的自动定量分析造成困难。并且由于用户上传的图像比例差异比较大,这使得舌形判断难上加难。
在进行舌体胖瘦判断应有两个前提:
(1)用户上传的舌象图片已经被分割完成;
(2)舌体处于“垂直状态”;
这两个步骤的处理方案已在之前的文章中有所介绍:
【python-Unet】计算机视觉 舌象舌头图片分割 机器学习(三)
下面我们来详细讲解如何让计算机智能判别用户上传的舌象胖瘦!
2 原理讲解——多项式曲线拟合
2.1 舌体曲线拟合参数与形状的关系
通过对舌体轮廓进行曲线拟合,可以用较少的参数表示舌体轮廓。对舌前部轮廓采用4次多项式拟合
发现曲线拟合参数与曲线形状的尖锐与圆钝有以下关系:
(1)由于舌体接近对称,因此奇次项系数一般相对较小,对舌体形状的影响较小,而常数项根本不影响曲线的形状。
(2)舌体的总体形状趋势取决于其最高项——四次项,在其他各项系数相同的情况下,四次项系数越大,曲线越尖锐;越小,曲线越圆钝。
(3)尖锐和圆钝的程度不但与四次项和二次项的符号关系有关,还与两个系数的绝对值关系有关。二次项与四次项系数绝对值之比越大,曲线的尖锐与圆钝越显著。
2.2 胖瘦指数定义
通过上述函数图像的特点总结胖瘦指数。
胖瘦指数与四次项系数绝对值成反比,并且与二次项系数和四次项系数的符号关系和绝对值之比有关。胖瘦指数越大,舌体越胖。根据胖瘦特征已知的舌图像样本确定分级标准,可以将舌体描述为“胖”、“不胖不瘦”、“瘦”3种类型。
其中a4为四次项系数,a2为二次项系数。
3 具体实现过程
首先是要将舌象图片进行舌体分割(参照【python-Unet】计算机视觉 舌象舌头图片分割 机器学习(三))
舌体胖瘦分析的主要的对象是中下舌位,上舌位会影响分析的准确性,因此取舌体轮廓标记点的下0.75舌位。示意图如下图所示:
对下0.75舌位标记像素点进行舌体轮廓的多项式曲线拟合。由于分析的是曲线的“胖瘦”,因此多项式曲线的奇数次项影响较小,且项数较大较好。权衡模型的运行效率,中e诊采用4次项多项式曲线拟合。进行多张图片拟合的确定系数(R-square=SSR/SST)为0.82~0.95,说明4次多项式曲线拟合效果较好。舌体轮廓4次多项式拟合示意图如下:
将得到4次多项式拟合曲线系数代入如下公式,计算胖瘦指数。通过胖瘦指数来判断用户舌体的胖瘦。
其中a4为四次项系数,a2为二次项系数。
胖瘦值数越大说明舌体越宽大,胖瘦指数越小说明舌体越瘦小;胖瘦指数位于4.3-7.8范围内是正常舌,小于4.3是瘦小舌,大于7.8是肥大舌。
注:这里的数据可能准确度并不高,应当在大量样本数据验证后得出结论,需要后面继续验证!
4 代码实现
注:此后的代码是在已经分割好舌象以及舌体倾斜判断后,其中代码参照前文!
4.1 contour_to.py
from PIL import Image import numpy as np def contour_to(in_path=r"result\blend.png", out_path=r"result\inline.png"): """ 将分隔好的图像数据进行描点 in_path为绿底+原图图片 put_path为黑底+白点图片 返回对称轴坐标以及轮廓坐标 """ img_before = Image.open(in_path) img_before_array = np.array(img_before) #把图像转成数组格式img = np.asarray(image) shape_before = img_before_array.shape height = shape_before[0] width = shape_before[1] dst = np.zeros((height,width,3)) wire = [] axle_wire = [] outcome_wire = [] for h in range(0,height): lis = [] h_all = 0 w_all = 0 for w in range (0,width-1): (b1,g1,r1) = img_before_array[h,w] (b2,g2,r2) = img_before_array[h,w+1] if (b1, g1, r1) == (1,204,182) and (b2,g2,r2) != (1,204,182): dst[h, w] = (255,255,255) lis.append((h,w)) outcome_wire.append((h,w)) elif (b1, g1, r1) != (1,204,182) and (b2,g2,r2) == (1,204,182): dst[h, w+1] = (255,255,255) lis.append((h,w+1)) outcome_wire.append((h,w+1)) else: pass if len(lis) == 0: pass else: for i in lis: h_all += i[0] w_all += i[1] h_avg = h_all//len(lis) w_avg = w_all//len(lis) dst[h_avg, w_avg] = (255,255,255) axle_wire.append((h_avg, w_avg)) img2 = Image.fromarray(np.uint8(dst)) img2.save(out_path,"png") wire.append(axle_wire) wire.append(outcome_wire) return wire
4.2 outline_cut.py
import numpy as np from PIL import Image def outline_cut(outcome_wire): """ 截取轮廓下1/4像素点 """ save = outcome_wire pool = [] for i in outcome_wire: pool.append(i[0]) pool.sort() judge = pool[int(1 + (float(len(pool)) - 1) * 1 / 4)] del_data = 0 for i in range(len(outcome_wire)): if outcome_wire[i][0] < judge: del_data = i else: pass del save[0:del_data] height = 256 width = 256 dst = np.zeros((height,width,3)) for i in outcome_wire: h = i[0] w = i[1] dst[h,w] = (255,255,255) img2 = Image.fromarray(np.uint8(dst)) img2.save(r"result\0.5cuted.png","png") return save
4.3 linger.py
import matplotlib.pyplot as plt import numpy as np from sklearn import linear_model #导入线性模型和多项式特征构造模块 from sklearn.preprocessing import PolynomialFeatures def linger(wire): a1, a2 = zip(*wire) x = list(a2) y = list(map(lambda i: i * -1, a1)) datasets_X = x datasets_Y = y #求得datasets_X的长度,即为数据的总数。 length =len(datasets_X) #将datasets_X转化为数组, 并变为二维,以符合线性回 归拟合函数输入参数要求 datasets_X= np.array(datasets_X).reshape([length,1]) #将datasets_Y转化为数组 datasets_Y=np.array(datasets_Y) minX =min(datasets_X) maxX =max(datasets_X) #以数据datasets_X的最大值和最小值为范围,建立等差数列,方便后续画图。 X=np.arange(minX,maxX).reshape([-1,1]) #degree=4表示建立datasets_X的四次多项式特征X_poly。 poly_reg =PolynomialFeatures(degree=4) X_ploy =poly_reg.fit_transform(datasets_X) lin_reg_2=linear_model.LinearRegression() lin_reg_2.fit(X_ploy,datasets_Y) #查看回归方程系数 #print('Cofficients:',lin_reg_2.coef_) #查看回归方程截距 #print('intercept',lin_reg_2.intercept_) plt.scatter(datasets_X,datasets_Y,color='red') plt.plot(X,lin_reg_2.predict(poly_reg.fit_transform(X)),color='blue') plt.xlabel('x') plt.ylabel('y') plt.show() return lin_reg_2.coef_
4.4 调用总函数
coefficient = linger.linger(contour_to.outline_cut(contour_to()[1])) print(coefficient)
后根据coefficient中的多项式系数代入如下公式判断舌体胖瘦:
舌体判别算法至此结束
总的来讲就是:
step1:舌象图片自适应调节
step2:舌体分割
step3:舌体倾斜判断
step4:曲线拟合判断舌形