博士学位

研究生毕业

中国科学院计算技术研究所

Personal Information:

Gender:Male
Business Address:西土城校区科研楼408
E-Mail:

VIEW MORE

Other Contact Information:

email :


Personal Profile

熊永平,北京邮电大学计算机学院特聘教授,博士生导师,网络与交换技术国家重点实验室-网络体系结构研究中心,北邮-井冈山实验室常务副主任,光场计算与视觉智能LIVIN实验室负责人,实验室团队主页:https://livin.github.io/作为项目负责人,主持和参与国家自然科学基金面上项目、国家重点研发计划、江苏省自然科学基金,教育部科研基金、国家电网总部科技项目、欧盟合作框架项目等国家及省部级项目,荣获广东省科技进步二等奖1项、中国人工智能学会创新创业二等奖1项,参与制定国家标准《工业互联网平台技术要求及测试方法》。入选南京市“紫金山英才”计划,IEEE Senior Member,担任中国计算机学会物联网专委会委员、教育部重点领域教学资源及新型教材建设专家组专家、国家教育部评审专家、国家电网技术专家等。近年来专注于视觉智能领域,在文档识别、三维重建、多模态大模型、光场AIGC等领域取得了一系列代表性成果,先后在ACM MM、ACL、Pattern Recognition、NAACL、IEEE TMC等顶级会议和期刊上发表论文,申请和授权了20余项专利。实验室未来将进一步聚焦光场计算与视觉智能,具体研究主题包括:l 光场显示生成:研究将3D AIGC技术用于光场显示内容的生成。l 实时三维重建技术:研究能够快速捕捉并精确重建动态场景的技术。l 光场编码与高效传输:研究如何在有限带宽下实现三维光场的高质量编解码和传输。l 端云协作渲染技术:探索端设备与云端如何协同工作,以实现低算力设备上的高真实感光场渲染。l 3D数字人建模与智能驱动:研究如何创建逼真的3D数字人模型,并实现基于多种模态输入的智能驱动。 近3年发表的代表性论文如下:1. Siyuan, Huang, Yongping Xiong*, and Wu Guibin. "LayoutPointer: A Spatial-Context Adaptive Pointer Network for Visual Information Extraction." Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers). 2024. (NAACL 2024,CCF B类会议,文档信息抽取)2. Junjie Zhou, Zheng Liu, Shitao Xiao, Bo Zhao, Yongping Xiong*. "VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval." Association for Computational Linguistics.2024.(ACL 2024, CCF A类会议,多模态对齐检索)3. Junjie Zhou,Baolin Liu,Yongping Xiong*,Chinwai Chiu,Fangyu Liu,Xiangyang Gong."FAT: Field-Aware Transformer for Point Cloud Segmentation With Adaptive Attention Fields." IEEE Transactions on Industrial Informatics .2024. (TII,SCI 1区TOP期刊,差异化点云分割)4. Baolin Liu, Zongyuan Yang, Pengfei Wang, Junjie Zhou, Ziqi Liu, Ziyi Song, Yan Liu, Yongping Xiong*. “Textdiff: Mask-guided residual diffusion models for scene text image super-resolution”.(文本图像超分辨率)5. Zongyuan Yang, Baolin Liu, Yongping Xiong*, Lan Yi, Guibin Wu, Xiaojun Tang, Ziqi Liu, Junjie Zhou, Xing Zhang."Docdiff: Document enhancement via residual diffusion models." Proceedings of the 31st ACM international conference on multimedia. 2023.(ACM MM,CCF A类会议,扩散模型去噪)6. Zongyuan Yang, Baolin Liu, Yongping Xiong*, Guibin Wu.” GDB: Gated convolutions-based Document Binarization.” Pattern Recognition.2024.( CCF B类及SCI 1区TOP期刊,文档二值化)7. Zongyuan Yang,Yongping Xiong*, Guibin Wu.”Document Binarization with Multi-Branch Gated Convolutional Generative Adversarial Networks”. IEEE International Conference on Image Processing.2023.(ICIP, CCF C类会议,文档二值化)8. Guibin Wu, Zheng Zhang, Yongping Xiong*. “CarveNet: A Channel-wise Attention Based Network for Irregular Scene Text Recognition.” International Journal on Document Analysis and Recognition .2022.(IJDAR, CCF C类期刊,复杂背景文字识别)9. Yu Bai, Yue Mi, Yihan Su, Bo Zhang,Zheng Zhang, Jingyun Wu, Haiwen Huang, Yongping Xiong*, Xiangyang Gong,Wendong Wang. “A Scalable Graph-Based Framework for Multi-Organ Histology Image Classification.” IEEE Journal of Biomedical and Health Informatics ( Volume: 26, Issue: 11, November 2022) .(IEEE J BIOMED HEALTH,CCF C类期刊, 医学图像) 团队立足于应用驱动的科研,在工程中定位关键研究问题,着力推动技术成果的落地应用,目前技术成果产业化方面进展如下:1. 组建北邮-井冈山实验室,将视觉智能技术与吉安千亿级电子信息制造业深度融合,将三维视觉和视频理解技术应用在智能焊接机器人、智能喷涂机器人、组装工艺控制、器件溯源等多个领域,用户覆盖立讯精密、柏兆电子、方舟流体等多个行业龙头企业。2. 作为教育部专家,将团队研发全球领先的公式识别和文档智能解析技术,结合多模态大模型应用于重点领域资源共享服务平台、虚拟教研室平台以及数字出版平台等一系列国家高等教育智能化平台,技术成果应用于全国七百多个虚拟教研室,覆盖近10万高校教师。3. 与全球最大的公用事业公司-国家电网合作,研发的多光谱光纤传像和视觉理解技术,可实现GIS、开关柜等各类封闭式高压电气设备的内部可视化,实现高精度的过热和放电等缺陷检测,可覆盖从超高压到配网等多个不同电压等级设备,成功应用于多个省网公司。

2006.9  to  2010.7
中国科学院计算技术研究所 | 计算机系统结构 | With Certificate of Graduation for Doctorate Study | 博士学位
2003.9  to  2005.7
哈尔滨工业大学 | 计算机科学与技术 | With Certificate of Graduation for Study as Master's Candidates | 硕士研究生

No content

光场AIGC
多模态大模型
文档智能

教育部重点领域教学资源及新型教材建设专家组专家
中国计算机学会物联网专委会委员