近日,我院智能信息感知团队在国际顶级期刊《IEEE Transactions on Medical Imaging》(IEEE TMI)上以杭州电子科技大学为第一单位发表了题为《SASAN: Spectrum-Axial Spatial Approach Networks for Medical Image Segmentation》的论文。这是我校首次以杭州电子科技大学为第一单位在该期刊发表论文,论文第一作者为我院黄星儒特聘研究员。
IEEE TMI由国际电气和电子工程师协会(IEEE)于1982年创办,致力于刊登医学影像技术及其应用的高质量研究论文,涉及从图像采集、处理到分析的各个方面,是人工智能医学影像领域最具影响力的期刊之一,属于中国科学院一区Top期刊,五年影响因子11.3。
诸如中枢浆液性脉络膜视网膜病变和糖尿病性黄斑水肿等眼科疾病,对全球数百万人的视力造成了严重损害。然而,人工分析眼底脉络膜和黄斑水肿的光学相干断层扫描(OCT)序列不仅劳动密集且耗时,还存在准确性问题。在3D医学图像分割领域,现有方法主要利用频域分析和空间域信息来提升分割精度,由于设备和环境的限制,现有网络难以处理干扰和识别复杂结构。为了充分利用频域和空间域的信息优势并克服环境等局限性,本文提出了一种频谱分析协同轴向-空间网络SASAN,使用快速傅里叶变集成频谱特征用于过滤噪声。模型集成了两个关键模块:用于减轻噪声干扰的频率集成神经增强器(FINE)和用于增强特征提取的轴向-空间元素乘法器(ASEM)。其中,FINE在深度学习网络中巧妙地结合了空间和频域信息,减少了噪声干扰,提高了分割的准确性和鲁棒性;而ASEM在合并基本空间特征的同时,沿x、y、z轴对复杂特征信息进行分解,降低了特征分析的难度,提高了计算效率。此外,为了平衡图像区域、分布和边界,本文还引入了自适应多方面损失,在训练过程中自适应更新权值。
在多个公开大型数据集上进行的评估中,SASAN超过了多个SoTA模型,具有最低的误识别率,并且在边界划分上有显著改进。证明SASAN在融合低频信号后,增强了对结构信息的理解和以及对高频噪声的鲁棒抑制能力,为玻璃体浑浊病人的眼底结构分析重建产生了全新的思路。
文章第一作者为通信工程学院智能信息感知团队黄星儒特聘研究员,本科毕业于北京邮电大学,博士毕业于英国伦敦玛丽女王大学。研究方向为医疗图像处理、深度学习、计算机视觉、语言大模型等。现为国防大数据专业委员会委员,在MIA,IEEE TMI, Medical Physics, International Journal of Cardiology等期刊上发表SCI检索期刊论文29篇,包含中科院一区期刊7篇,中科院TOP期刊11篇。
通信工程学院智能信息感知团队,负责人为江劭玮研究员,主要方向为智能光学信息感知及处理等,共有专任教师18人。团队隶属于杭州电子科技大学智能信息处理实验室。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于通信、自动化、计算机、电子信息等学院。