报告时间:2023年8月12日上午09:30
报告地点:永利集团3044官网欢迎您中区科技楼报告厅
报告题目一:文档识别与理解研究前言
报告人简介:
刘成林,中国科学院自动化研究所副所长,研究员、博士生导师,中国科学院大学人工智能学院副院长。任国际模式识别学会副主席,中国人工智能学会副理事长、会士,中国自动化学会会士、模式识别与智能系统专委会主任,中国图象图形学学会常务理事。美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。
1989年、1992年、1995年分别在武汉大学、北京工业大学、中国科学院自动化研究所获学士、硕士和博士学位。1996年至2004年先后在韩国科学技术院、日本东京农工大学、日立中央研究所从事博士后和研发工作。2005年起在中国科学院自动化研究所任研究员。2008年获得国家杰出青年科学基金。研究兴趣包括模式识别、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文400余篇,合著英文专著一本。现任Pattern Recognition期刊和《自动化学报》的副主编,以及多个期刊的编委。
报告摘要:
文档图像识别的任务包括版面分析、文本识别、图形符号识别、信息抽取等。近年来,得益于深度学习方法的发展,文档识别性能快速提升,在文档数字化、票据处理、笔迹录入、智能交通、信息检索等领域得到广泛应用。然而,实际应用也表明,现有技术在识别精度和可靠性、可解释性、自适应性等方面还有明显不足,还有很多技术问题有待解决。另一方面,人工智能大模型的快速发展促使我们重新思考文档识别领域今后的发展方向,除了解决识别层次的遗留问题,应面向文档语义理解和应用,在语义信息抽取和决策层面开展研究。本报告对文档识别和理解技术现状做简要回顾和分析,指出现有技术的不足,并提出今后的研究问题和发展方向。
报告题目二:矢量化视觉感知及遥感应用
报告人简介:
夏桂松,武汉大学教授,博士生导师,法国巴黎高等师范学院数学和应用系访问学者,现任国家多媒体软件工程技术研究中心副主任、武汉大学计算机学院副院长。长期从事计算机视觉和遥感图像智能解译研究,主持国家自然科学基金项目7项。先后获得湖北省自然科学二等奖、测绘科技进步一等奖、IEEE GRSS最有影响力论文奖、中国图象图形学会优秀博士论文指导教师等荣誉。研制的遥感图像智能解译基础数据集(DOTA、AID、GID等)和遥感图像智能解译系列模型被业内同行广泛使用,相关成果在国家重要工程和知名企业的相关业务场景中成功应用。
担任2个SCI一区期刊ISPRS Journal of Photogrammetry and Remote Sensing编委(Associate Editor)、中国图象图形学学会遥感图像专业委员会副主任、中国自动化学会模式识别和机器智能委员会常务委员、中国遥感应用协会黄土高原遥感分会常务理事等。
报告摘要:
图像几何结构是诸多视觉计算和认知任务的重要特征,在视觉场景结构理解和空间环境感知等方面有重要应用。本报告分享我们在图像几何结构矢量化感知建模和计算问题上的新进展,包括图像中线段的非监督计算模型和有监督深度感知方法、图像线结构与二维区域之间的对偶计算框架、wireframe的深度计算模型和稀疏平面重建等,同时分享这些成果在高分遥感图像建筑物提取和识别等方面的应用。
报告题目三:基于图像及视频处理的智能临床辅助诊疗研究及应用
报告人简介:
陈俊颖,香港大学博士,浙江大学学士(优秀毕业生),CCF杰出会员,ACM杰出演讲者,广东省高等学校青年创新人才项目入选者,现任华南理工大学软件学院副教授,担任大数据与智能机器人教育部重点实验室主任助理、智能医学图像处理研究室负责人,华南理工大学智能软件与机器人科研团队核心成员。
致力于智能医学图像处理及成像、深度神经网络建模、多源多模态特征融合研究;以第一作者或通讯作者在TPAMI、TNNLS、TMI、TUFFC、JBHI、CVPR、SMC等学术期刊和会议上发表超过40篇论文,单篇论文最高被引360次(发表于CVPR 2021);授权3项发明专利、5项实用新型专利和27项软件著作权;研究成果以微信小程序形式上线2年,已在广东省、江西省等地多家医院推广应用,入选《2022 CCF 技术公益年度案例集》;获得CCF科学技术奖技术发明二等奖等奖励。
报告摘要:
智能临床辅助诊疗技术能有效提升临床诊疗效率和准确度,而且随着深度学习技术的发展,用于智能临床辅助诊疗的深度神经网络模型研究蓬勃发展。然而,智能临床辅助诊疗面临一些挑战,包括医学成像模态的固有特性可能导致医学图像质量低下、摄像环境可能会给医学图像和视频引入干扰噪声、以及缺乏精准的专家标注数据等。本报告将围绕解决智能临床辅助诊疗的难点问题,介绍课题组的相关研究进展。首先,针对图像质量低和精准专家标注数据稀缺问题,提出了深度学习粗分割结合图像处理算法自动演化的框架并改进了图像处理算法。接着,针对脊柱微创减压手术环境下内窥镜视野内存在较多干扰物的问题,提出了视频帧间注意力和通道自注意力模块来获取全局特征信息,在内窥镜视频图像中分割出脊柱神经区域。然后,针对智能颈椎功能评估,提出了一种分析手部运动异常症状的轻量级视频分析神经网络模型,应用于临床实践高效辅助临床诊断。最后,介绍课题组在深度神经网络模型设计和训练方面的研究进展。