【摘要】 一般来说,有两种主要的污染物随着实际信号溢出到拉曼通道

利用拉曼成像技术获得彩色化学图像,只是研究样品化学性质的一个开始。化学家们对解释光谱成像数据中锁定的秘密更感兴趣。进一步的数据分析,例如多变量方法,允许根据原始数据是由有限数量的重要因素重建的假设对复杂的信息内容进行排序。然而,这样的分析对异常值的存在特别敏感,因此涉及光谱污染物的原始光谱不能被直接拉曼数据分析。

 

一般来说,有两种主要的污染物随着实际信号溢出到拉曼通道: (1)样品和背景荧光,以及电荷耦合器件(CCD)的热起伏,可以显着影响基线漂移的光谱基线; (2)宇宙射线是敏感探测器检测到的零星的背景伪影,在光谱中表现为窄带尖峰。这些样品或仪器相关的污染物在测量过程中是不可避免的。因此,在实现其他算法之前,必须使用仪器软件或分析程序中常用的方法对光谱数据进行预处理。

 

处理基线漂移和峰值的方法是两个独立的主题。背景噪声和附加噪声来源的多样性使得实验光谱数据的基线校正变得困难。采用小波变换、导数、鲁棒局部回归和多项式拟合消除背景变化。然而,有些缺点,例如在低信噪比环境中的性能较差和依赖给定用户的体验,必须予以消除,因为这些缺点可能导致校正结果的可重复性较差。根据算法设计的不同,去除尖峰的方法通常分为两类。

 

第一类方法试图通过小波处理、中值滤波和多项式滤波等滤波算法来排除单扫描频谱上的峰值。这些方法受到严重的限制,因为它们依赖于最大峰值带宽的假设。当尖峰的带宽与感兴趣的光谱特征相当时,就会发生光谱失真。

 

替代类别通过比较测量的相似光谱(参考光谱)来抑制峰值。一个典型的例子是“最近邻相关算法”,它首先通过比较相邻光谱之间的互相关系数来确认参考光谱,其次通过根据用户的经验设置阈值来消除峰值。这一范畴的核心是如何确定参考谱,而互相关系数不足以描述数值的特征。此外,经验设定的阈值也会导致结果不稳定。因此,虽然该算法为解决这一问题提供了一种新思路,但大多数应用仍然局限于仿真数据。这种方法的实例特别稀少。

 

本文提出了一种“拉曼成像数据集自动预处理方法”,包括自适应迭代加权惩罚最小二乘(airPLS)算法和主成分分析(PCA)算法。它利用光谱特征本身消除了基线漂移和宇宙尖峰。APRI 的实用性是通过从木材样品的拉曼成像数据集中去除光谱污染物来说明的。此外,APRI 的计算效率高,概念简单,有潜力推广至其他光谱分析方法,例如红外线(IR)、核磁共振(nMR)、 X 射线衍射(xRD)等。在我们的方法的帮助下,一个典型的光谱分析可以由一个非专家用户执行,以获得有用的信息从光谱成像数据集。

 

1.Zhang, X., Chen, S., Ling, Z. et al.Method for Removing Spectral Contaminants to Improve Analysis of Raman Imaging Data. Sci Rep 7, 39891 (2017). https://doi.org/10.1038/srep39891

 

科学指南针为您提供材料测试,主要业务范围包括XPS,普通XRD,透射电子显微镜TEM,全自动比表面及孔隙度分析BET等测试。

 

免责声明:部分文章整合自网络,因内容庞杂无法联系到全部作者,如有侵权,请联系删除,我们会在第一时间予以答复,万分感谢。