摘 要: 亚麻、汉麻与苎麻纤维的成分组成和物化性质高度相似,三者间的分类鉴别是纺织品检验检测领域的难点。本文对不同种类麻纤维的傅里叶变换衰减全反射红外光谱(ATR-FTIR)作主成分分析(PCA)和线性判别分析(LDA),创建麻纤维分类判别模型以鉴别三种易混麻纤维。选取亚麻、汉麻和苎麻纤维各60 组作为样品集进行脱胶清洗处理并采集ATR-FTIR光谱。光谱归一化后对800~2000cm-1波长的光谱作主成分分析,分析结果显示:随着主成分个数增加,主成分分数依据麻纤维类别逐渐显现聚类趋势,同时前12个主成分对归一化红外光谱数据的累计贡献率超过99.5%。以训练集前12主成分数为自变量,以麻纤维种类为因变量,通过线性判别分析构建了分类判别模型(典型判别函数和分类函数)。模型验证结果显示:典型判别函数可使12个主成分分数矩阵根据麻纤维样品类型形成良好的聚类,分类函数对训练集和测试集中所有纤维样品的分类准确率达到100%。此外,PCA-LDA分类判别模型留一交叉验证的分类准确率仍能达到99. 6%。结果表明,不同类别麻纤维的ATR-FTIR光谱存在差异,基于麻纤维ATR-FTIR 光谱的PCA-LDA统计分析可实现亚麻、汉麻和苎麻三种易混麻纤维的快速无损鉴别。
关键词:亚麻;汉麻;苎麻;鉴别;红外光谱;主成分分析;线性判别分析
麻纤维自古以来就是纺织品的重要原材料[1-2],如今依旧是纺织工业中产量仅次于棉花的植物纤维。其中,亚麻、汉麻和苎麻纤维具有出色的可纺性和亲肤性,被大量应用于服装面料生产。由于用途和产量的差异,不同种类麻纤维的市场价格存在明显差距,以低价麻纤维冒充高价麻纤维的不法现象时有发生。 目前国内鉴别麻纤维的主要依据为FZ/T01057.3—2007《纺织纤维鉴别试验方法 显微镜法》,标准给出了各种麻纤维的纵横向微观照片,由检测人员观察比较实际麻纤维样品的显微镜影像从而确定样品的种类。然而亚麻、汉麻和苎麻的微观形态高度相似,检测人员较难根据该方法准确鉴定麻纤维,以三者为代表的易混麻纤维的鉴别一直是业界的难题,因此健全麻纤维鉴别技术对维护市场稳定和加强质量监管尤为重要。
亚麻、汉麻和苎麻纤维(以下简称麻纤维)均由纤维素、半纤维素、果胶和木质素等物质构成[3],它们的构成比例差异较小且物理化学性质几乎相同,传统的化学溶解法和燃烧法等无法达到鉴别效果。 尽管麻纤维来源于不同的植物物种,
DNA鉴定技术却难以应用于麻纤维鉴别,原因在于纺织加工用的麻纤维内部已不存在细胞核[4]。 学者们研究发现麻纤维旋转方向、着色反应及草酸钙晶体等特征[5-8] 可作为区分亚麻、汉麻和苎麻纤维的依据,然而这些微观影像的特征差异十分微弱,检测人员的认知差异极易影响麻纤维鉴别准确性,同时面临操作难度大、检测成本高等问题。
亚麻、汉麻和苎麻纤维的傅里叶变化红外(Fourier transform infrared reflection,FTIR)光谱类似,尚无法通过红外图谱数据库检索鉴别。近年来研究人员致力于通过比较分析麻纤维的红外光谱特性,试图破解定性鉴别难题。 王成云等[9] 测试麻纤维FTIR光谱后提出光谱吸收峰处吸光度之比是鉴别亚麻、汉麻和苎麻的重要依据。任清庆等[10] 通过燃烧法、显微镜法、扫描电镜法及红外光谱法比较亚麻、汉麻和苎麻的异同点,并认为可以通过观察纤维纵横向形态和 FTIR 光谱上1 033 cm- 1和 2 917 cm- 1处吸收峰的微小差别来区分汉麻和其他二者。 相较于传统的 FTIR 光谱技术,傅里叶变换衰减全反射红外光谱技术(Attenuated total reflection Flourier transformed infrared spectroscopy,ATR-FTIR)具有高效无损的检测优势。Garside等[3]测试了包括亚麻、汉麻和苎麻在内的6 种原麻纤维的 ATR-FTIR光谱,其指出木质素含量是区分纤维素纤维种类的重要参数,并尝试采用红外特征波段吸光度之比来区分麻纤维,然而效果并不理想。综上所述,前人虽已发现不同种麻纤维间存在较为微弱的红外光谱差异,但目前仍未能利用红外光谱间的数据差异开发出一套快速准确的麻纤维分类鉴别方法,有待进一步研究。
统计学分析方法有利于挖掘不同种类麻纤维间的红外光谱差异并建立与纤维类别间的联系。其中, 主成分分析(Principal component analysis,PCA)是一种无监督降维方法,其通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,借此可将大量原始变量压缩为有限几个主成分(Principal component,PC)[11],原始数据中的微小差异得以通过主成分分数表达。 线性判别分析(Linear discriminant analysis,LDA)则是一种集“有效特征选择与状态识别”功能于一身的监督学习方法[12],该统计方法能基于训练集建立判别准则,并根据准则确定未知样本所属的类别。迄今为止,基于ATR-FTIR 光谱的PCA-LDA 统计分析方法已广泛应用于血迹[13]、纸张[14]、朱砂[15]、塑料[16]、动物皮毛[17]、病毒[18]、榛子[19]及物质结构差异较为显著的纺织纤维[20] 的检测鉴别,为基于红外光谱的麻纤维鉴别研究提供了借鉴。
综上所述,亚麻、汉麻和苎麻纤维难以通过传统检测方法实现准确鉴别,本文采集不同种类的麻纤维ATR-FTIR光谱并归一化处理,运用主成分分析提取光谱间数据差异并简化变量,而后通过线性判别分析建立麻纤维分类模型,以期实现亚麻、汉麻和苎麻三种易混麻纤维的快速无损鉴别。
1实验
1.1材料
亚麻、汉麻、苎麻等麻纤维样品(桐乡尚德纺织有限公司、嘉兴市荣华麻纺织有限公司),三种麻纤维(产自中国湖南、湖北、广东、广西、四川及安徽),其种类信息由厂家提供并经过宁波纤维检验所的纤维定性专家抽检验证。每个省份每种麻纤选取10个样品,建成由180个麻纤维样品(亚麻、汉麻和苎麻样品各60 个)组成的样品集。这些麻纤维样品在白度、果胶含量和杂质含量等方面存在差异,为避免这些因素对光谱的影响,需对纤维进一步脱胶并去除黏附的杂质。脱胶所需的碱性果胶酶(适活条件为pH值 7~9,温度 50~60 ℃) (淄博联特生物酶有限公司),分析纯磷酸氢二钠十二水合物(西陇科学股份有限公司)。
1.2仪器
配有ATR附件和OMNI采样器的 Nicolet IS 10 FTIR 光谱仪(赛默飞世尔科技),JSM-5610扫描电子显微镜(日本电子株式会社),SK2210LHC超声波清洗机(上海科导超声波仪器有限公司),YB902G烘箱(温州大荣纺织仪器有限公司),FE20 pH值计(梅特勒托利多仪器有限公司),JM-B5002电子天平(余姚市纪铭称重校验设备有限公司)及配有IBM SPSS Statistics 25软件的电脑。
1.3试样预处理
实验采用碱性果胶酶溶液对纤维样品在超声下进行酶脱胶预处理[21]。 其过程如下:首先,调制酶质量分数2%为酶液后加入磷酸氢二钠十二水合物调节pH 值至8,取各溶个麻纤维样品适量放入锥形瓶中,以浴比1︰25将纤维与酶溶液混合并搅拌至纤维完全润湿浸没。而后将超声波清洗仪工作频率设置为35kHz,锥形瓶置于超声波清洗仪中55 ℃水浴温度下超声清洗脱胶6h,脱胶后对纤维样品用蒸馏水冷洗并烘干。最后,使用扫描电子显微镜(SEM)观察脱胶前后麻纤维表面的清洁程度。脱胶预处理前后亚麻纤维样品的SEM照如图1所示,可见该碱性果胶酶预处理过程能有效去除麻纤维表面的果胶和杂质。
图1 亚麻纤维酶脱胶预处理前后的扫描电镜照
1.4 ATR-FTIR 光谱采集与处理
红外光谱仪预热,设置扫描样品次数为32次,分辨率4cm- 1,抽取预处理后的麻纤维样品约0.2g放置于ATR附件上, 旋转OMNI采样器固定钮压紧样品,采集400 ~4000 cm- 1波长的ATR-FTIR光谱,使用内置软件对获得的光谱进行5点平滑和基线校正,获得的光谱数据保存为csv格式。为了在相同尺度下比较麻纤维样品的红外光谱,根据下式对光谱数据进行归一化。
式中:Nλ 和 Aλ 分别是波长λ处的归一化值和红外吸光度,而Amax和 Amin分别是该波长内的最大和最小红外吸光度。
1.5红外光谱的 PCA-LDA 分析
若将归一化红外光谱中每个波段的归一化值视为一个变量,则整个红外光谱包含7469个变量,鉴于主吸收峰位于800~2000 cm- 1波长内,本文仅统计分析归一化红外光谱中该指纹区域2490个波段的光谱数据。在SPSS中通过“分析→降维→因子分析”执行主成分分析操作,将这些波段的光谱变量压缩为多个主成分(PC),可得到主成分特征值、方差贡献率及累计方差贡献率等主成分特征指标。 同时借助该分析过程,所有180个麻纤维样品的归一化红外光谱数据将转化为180组主成分分数矩阵。其中,特征值大于等于1且累积方差贡献率超过99.5%的前若干个主成分的分数矩阵,可被认为代表了所有原变量所包含的大部分信息,将用于后续分析。
按照5︰1比例分配训练集样本和测试集样本,随机选取150组麻纤维样品的主成分分数矩阵及其纤维种类,作为线性判别分析(LDA)的训练集。其中,第1~50组主成分分数矩阵来自亚麻纤维,第51~100组主成分分数矩阵来自汉麻纤维,第101~150组主成分分数矩阵来自苎麻纤维。以训练集的主成分分数作为自变量,纤维种类作为分组变量(亚麻、汉麻和苎麻分别标记为1、2和3),在SPSS软件中执行“分析→分类→判别”操作,可得到麻纤维LDA分类模型,以典型判别函数和分类函数表示。其余30组麻纤维的主成分分数矩阵及其纤维种类作为测试集,用于对所建函数模型的外部验证,其中第151~160组主成分分数矩阵来自亚麻纤维,第161~170组主成分分数矩阵来自汉麻纤维,而第171~180组主成分分数矩阵来自苎麻纤维。
2结果与分析
2. 1 麻纤维的红外光谱特征
麻纤维800~2000cm- 1 波长的归一化红外光谱如图2所示。由图2可见,亚麻、汉麻和苎麻纤维的红外光谱具有高度相似性,这是由于三种麻纤维的主要组分均为纤维素和半纤维素等多糖物质,且这些组分的组成比例较为接近。 麻纤维红外光谱的共同特征表现为:多糖物质内的C-OH键对麻纤维的红外光谱影响最为明显,其伸缩振动在1029cm- 1处存在最强吸收峰,而在1053cm- 1处存在第二强吸收峰,其面内摇摆振动在1203cm- 1处有微弱的吸收峰。而多糖物质中的C-H键在红外光谱中存在较多的吸收峰,但这些吸收峰强相对较弱,其面内对称伸缩振动的吸收峰出现在895cm- 1处,面外摇摆振动的吸收峰则出现在984cm- 1 和1000cm- 1处,摇摆振动的吸收峰出现在1315cm- 1和1428cm- 1处。此外,1104cm- 1处为C-O-C糖苷键的伸缩振动吸收峰,1159cm- 1处为C-C键的不对称伸缩振动吸收峰,而1280cm- 1处则为CH2键的摇摆振动吸收峰。
图2 麻纤维800~2000cm-1波长的归一化红外光谱
尽管麻纤维的归一化红外光谱十分相似,麻纤维组分的比例差异仍会导致典型化学键的含量差异,因此其归一化红外光谱中若干波段的吸光度略有不同,如C—OH键和CH键在1053cm- 1和1280cm- 1波长处的吸收峰强度差异。即便如此,仅通过人眼对比光谱图的微弱差异来鉴别麻纤维也很难具有说服力,因此需对光谱数据进一步统计分析。
2.2主成分分析结果
对所有麻纤维的归一化红外光谱进行主成分分析,成分特征指标如表1所示。前2个主成分的累积方差贡献率达到84.74%,前3个主成分的累积方差贡献率达到92.06%,而前12个主成分累积方差贡献率达到99.58%,因此可认为前12主成分足以代表光谱中2490个波段光谱变量所包含的大部分信息。 对麻纤维样品主成分分数矩阵作进一步统计,前2主成分分数聚类分布如图3所示,前两个主成分分数分
表1 主成分特征指标统计
布显得杂乱分散;而前 3 主成分分数聚类分布如图 4 所示,前3 主成分分数在三维坐标空间中已表现出聚类趋势;可以推断若高于三维的坐标空间可以被刻画,前 12 主成分在多维坐标系中极有可能按照纤维分类形成聚类,该麻纤维样品光谱的主成分分数聚类特征为基于红外光谱统计分析鉴别麻纤维提供了可能。
图3 麻纤维样品前两主成分分数的聚类分布
图4 麻纤维样品前三主成分分数的聚类分布
2.3 基于麻纤维光谱的 PCA-LDA 模型
以训练集麻纤维样品主成分分数矩阵中前12个主成分作为自变量x1~x12 ,以麻纤维种类为分组变量,经线性判别分析,获得麻纤维典型判别函数y1(x) 和 y2(x),分别如式(2)(3)所示;亚麻、汉麻和苎麻的分类函数 yf(x)、yh(x)和 yr(x)分别如式(4)(5)(6)所示。
典型判别函数用以表征纤维分类的聚类效果,分类函数则用于预测判断麻纤维样品种类。当未知麻纤维样品的前1个主成分分数代入三种麻纤维分类函数后,该未知麻纤维种类的判别规则如下:若yf(x)取值最大则该麻纤维为亚麻纤维,若yh(x)取值最大则该麻纤维为汉麻纤维,若yr(x)取值最大则该麻纤维为苎麻纤维。
2.4 麻纤维鉴别模型的验证
为了验证PCA-LDA模型的聚类效果,将训练集中的150组主成分分数代回典型判别函数y1(x)和y2(x),在二维坐标平面上以每个纤维样品的y1(x)为横坐标、y2(x)为纵坐标,构建二维坐标,如图5所示。由图5可见,亚麻样品的典型判别函数结果集中在第一象限,汉麻样品的典型判别函数结果出现在第四象限,而苎麻样品的典型判别函数结果则集中在第二和第三象限;典型判别函数结果根据麻纤维种类展现出较好的聚类效果,这进一步证明不同类别麻纤维的ATR-FTIR光谱之间存在差异。
图5 训练集样品对应的典型判别函数值
同时,将训练集中的150组主成分分数代回分类函数进行内部验证,结果如图6所示。由图6可见,所有亚麻纤维样品的主成分分数矩阵在亚麻分类函数中取得最大值,而汉麻与苎麻纤维样品的主成分分数也在其各自对应的分类函数中获得最大值,所有训练集样品均被正确分类,内部验证结果表明所建立的PCA-LDA模型对训练集自身样品具有高效稳定的鉴别能力。而后将测试集的主成分分数矩阵代入分类函数进行外部验证,其结果如表2所示。由表2可见,所有麻纤维样品的实际种类与预测结果完全一致,意味着本文所建立的麻纤维分类模型的分类正确率达到100% 。
图6 训练集样品对应的分类函数值
表2 麻纤维分类函数的外部验证结果
为进一步探讨PCA-LDA统计方法鉴别麻纤维的的准确性,由SPSS软件对180 组麻纤维样品的主成分分数矩阵作留一交叉验证[22]。即将每一个样品作为测试样本,其他179个样品作为训练样本,这样得到180个分类器和180个测试结果,用这180个结果的平均值来衡量模型的性能。 留一交叉验证的结果如表3所示,验证结果显示仅有一个汉麻纤维样品在分类判别分析中被误判为亚麻,判别模型的分类正确率仍达到99.6%。综上所述,基于麻纤维红外光谱PCA-LDA统计分析获得的麻纤维分类判别模型能够准确鉴别亚麻、汉麻及苎麻等易混麻纤维。
表3 分类判别的留一交叉验证结果
3 结论
亚麻、汉麻和苎麻纤维的成分组成及物理化学性能高度相似,传统的检测方法难以鉴别,因此本文提出一种基于红外光谱PCA-LDA统计分析的麻纤维分类鉴别方法。选取亚麻、汉麻和苎麻纤维各60组,脱胶清洗处理进一步去除内部果胶和杂质,而后获取其ATR-FTIR光谱并作归一化处理,对比不同种类纤维间的归一化光谱发现, 仅1053cm-1和1280cm-1波长等处的吸收峰强度略有差异,但仍无法借此准确区分麻纤维。对归一化光谱数据作主成分分析发现:随着主成分个数增加主成分分数依据麻纤维类别逐渐显现聚类趋势,并且前12个主成分对归一化光谱数据的累积方差贡献率达到99.58%。以训练集前12主成分数为自变量,以麻纤维种类为因变量,通过线性判别分析构建了包括典型判别函数和分类函数的麻纤维分类判别模型。 模型验证结果表明:典型判别函数能够使训练集主成分分数矩阵依据麻纤维种类形成聚类,分类函数对训练集和测试集中所有纤维样品的分类准确率达到100%。留一交叉验证模式下麻纤维分类判别函数的分类正确率依旧达到99.6%。由此可见,不同类别麻纤维的ATR-FTIR光谱存在差异,基于麻纤维ATR-FTIR光谱的PCA-LDA统计分析可快速准确鉴别三种易混麻纤维。
参考文献
[1]YAGI C, YOSHIMURA N, TAKAYANAGI M, et al. Discrimination of traditional plant fibers used in Japanese cultural artifacts by infrared spectroscopy [ J ]. Vibrational Spectroscopy, 2022(123):103466.
[2]LUKEŠOVÁ H, PALAU A S, HOLST B. Identifying plant fibre textiles from norwegian merovingian period and viking age graves: The late ironage collection of the university museum of bergen[ J]. Journal of Archaeological Science: Reports, 2017(13): 281-285.
[3]GARSIDE P, WYETH P. Identification of cellulosic fibres by FTIR spectroscopy: Thread and single fibre analysis by attenuated total reflectance[J]. Studies in Conservation, 2003, 48(4): 269-275.
[4]DUNBAR M, MURPHY T M. DNA analysis of natural fiber rope [J]. Journal of Forensic Sciences, 2009, 54(1): 108-113.
[5]HAUGAN E, HOLST B. Determining the fibrillar orientation of bast fibres with polarized light microscopy: The modified Herzog test (replate test) explained[ J]. Journal of Microscopy, 2013, 252 (2): 159-168.
[6]NAYAK R, HOUSHYAR S, KHANDUAL A, et al. Identification of natural textile fibres [ M ] / / Handbook of Natural Fibres. Cambridge: Woodhead Publishing, 2020: 503-534.
[7]BERGFJORD C, HOLST B. A procedure for identifying textile bast fibres using microscopy: Flax, nettle / ramie, hemp and jute [ J]. Ultramicroscopy, 2010, 110(9): 1192-1197.
[8] WANG H M, WANG X. Surface morphologies and internal fine structures of bast fibers[J]. Fibers and Polymers, 2005(6): 6-12.
[9]王成云, 刘彩明, 李丽霞, 等. 麻纤维的定性鉴别[J]. 中国纤检, 2007(8): 38-41. WANG C Y, LIU C M, LI L X, et al. Qualitative identification of bast fibers[J]. China Fiber Inspection, 2007(8): 38-41.
[10]任清庆, 冯云, 杨力生, 等. 汉麻纤维定性分析方法[J]. 上海纺织科技, 2013(1): 50-51. REN Q Q, FENG Y, YANG L S, et al. Methods for qualitative analysis of hemp fiber[J]. Shanghai Textile Science &Technology, 2013(1): 50-51.
[11]LIU J, KANG H, TAO W, et al. A spatial distribution: Principal component analysis (SD-PCA) model to assess pollution of heavy metals in soil[J]. Science of the Total Environment, 2023(859): 160112.
[12]SINGH G, PAL Y, DAHIYA A K. Classification of power quality disturbances using linear discriminant analysis [ J]. Applied Soft Computing, 2023(138): 110181.
[13] SHARMA S, CHOPHI R, JOSSAN J K, et al. Detection of bloodstains using attenuated total reflectance-Fourier transform infrared spectroscopy supported with PCA and PCA-LDA [ J ]. Medicine, Science and the Law, 2021, 61(4): 292-301.
[14] XIA J, ZHANG J, ZHAO Y, et al. Fourier transform infrared spectroscopy and chemometrics for the discrimination of paper relic types[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019(219): 8-14.
[15]CHOPHI R, SHARMA S, SINGH R. Discrimination of vermilion ( sindoor ) using attenuated total reflectance fourier transform infrared spectroscopy in combination with PCA and PCA-LDA[J]. Journal of Forensic Sciences, 2021, 66(2): 594-607.
[16] WU X, LI J, YAO L, et al. Auto-sorting commonly recovered plastics from waste household appliances and electronics using nearinfrared spectroscopy [ J ]. Journal of Cleaner Production, 2020 (246): 118732.
[17]ZHAO G, LUO X, YUAN X, et al. Study on principal component analysis and multi-class discrimination against the combination to identify easy-confused fur[J]. Journal of Industrial Textiles, 2021, 50(6): 794-811.
[18]MO H, YANG L, WU G, et al. Rapid and non-invasive screening of high-risk human papillomavirus using Fourier transform infrared spectroscopy and multivariate analysis [ J]. Optik, 2020 ( 206 ): 164292.
[19]MANFREDI M, ROBOTTI E, QUASSO F, et al. Fast classification of hazelnut cultivars through portable infrared spectroscopy and chemometrics [ J] . Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018(189): 427- 435.
[20] PEETS P, KAUPMEES K, VAHUR S, et al. Reflectance FT-IR spectroscopy as a viable option for textile fiber identification [ J]. Heritage Science, 2019(7): 93.
[21]王倩丽, 刘丽芳, 俞建勇, 等. 碱性果胶酶处理对亚麻落麻纤维性能的影响[ J]. 东华大学学报: 自然科学版, 2011, 37 (6 ): 703-707. WANG Q L, LIU L F, YU J Y, et al. Effects of alkaline pectinase on properties of flax noil fibers[J]. Journal of Donghua University (Natural Science), 2011, 37(6): 703-707.
[22]袁旭政, 李鹏妮, 张红, 等. 红外光谱联合主成分分析在貂毛皮鉴别中的应用[J]. 皮革科学与工程, 2022, 32(4): 71-76. YUAN X Z, LI P N, ZHANG H, et al. Application of infrared spectroscopy combined with principal component analysis in identification of mink fur [ J]. Leather Science and Engineering, 2022, 32(4): 71-76.
文章摘自:蒋晶晶, 金肖克, 李伟松, 庄莉, 袁绪政,祝成炎.基于红外光谱PCA-LDA统计分析的麻纤维鉴别研究[J].丝绸,2024 ,61(07).