亚太传统医药 ›› 2023, Vol. 19 ›› Issue (2): 41-45.DOI: 10.11954/ytctyy.202302009

• 传统药学研究 • 上一篇    下一篇

基于回归算法与决策树思想的秦艽产地划分

杨友,包彩银,丁跃武,李四海   

  1. 甘肃中医药大学信息工程学院
  • 出版日期:2023-02-06 发布日期:2023-02-16
  • 基金资助:
    甘肃省科技计划(21JR1RA272)

  • Online:2023-02-06 Published:2023-02-16

摘要: 目的:药材产地对药材品质优劣影响很大,不同产地秦艽品质差异较大,使用秦艽样本近红外光谱数据构建模型,实现秦艽样本产地划分。方法:将多元线性回归算法(MLR)、偏最小二乘回归算法(PLS)、支持向量回归算法(SVR)和岭回归算法(RR)与决策树思想相结合对样本进行分类。结果:秦艽数据集包含207个样本,其中107个样本来自甘肃玛曲县,100个秦艽样本来自甘肃临洮县,模型的误判率在0.3%左右。结论:将回归算法与决策树思想相结合的方法可以提高模型的性能,使得算法既拥有回归算法强大的拟合能力,又拥有决策树的分类能力。在秦艽样本数据上得到了很好的分类效果。

关键词: 秦艽;产地;多元线性回归;偏最小二乘回归;支持向量机回归;岭回归;决策树近红外光谱