许信顺教授团队在人工智能领域取得系列研究成果

2019年05月21日 11:46 点击：[]

近期，软件学院许信顺教授带领的机器学习与媒体分析团队在人工智能相关领域取得系列研究成果。多项成果发表于领域知名国际期刊和会议，包括图像处理领域国际知名期刊IEEE Transactions on Image Processing（影响因子：5.072）、多媒体领域知名国际期刊IEEE Transactions on Multimedia（影响因子：3.977）、模式识别领域知名国际期刊Pattern Recognition（影响因子：3.962）、视频图像处理领域知名国际期刊IEEE Transactions on Circuits and Systems for Video Technology（影响因子：3.558）、人工智能领域知名国际会议AAAI和IJCAI（CCF A类）、信息检索领域知名国际会议SIGIR（CCF A类）、多媒体领域知名会议MM（CCF A类）和互联网领域知名会议WWW（CCF A类）等,这些成果均以山东大学为第一完成单位。

许信顺教授团队的研究兴趣包括机器学习、文本/图像/视频的内容分析、大规模媒体检索、图文识别等。团队的具体研究包括三方面：一是在机器学习领域，团队开展了多标记学习、多示例学习、深度学习、哈希学习等相关理论和模型的研究，尤其在哈希学习研究领域进行了深入的探索。相似性学习是机器学习的基本问题之一，而哈希学习又是近年来被广泛关注的一种可以进行相似性学习和快速相似性检索的重要方法。该方法可以将高维特征向量映射到海明空间中的短的二进制编码。同时，通过机器学习的方式使二进制编码保持原始空间中的相似性，进而在海明空间中实现样本的快速查询。在该方向上，团队相继提出了利用多种监督信息的离散哈希方法、监督鲁棒的离散跨模态哈希方法和离散可扩展的基于矩阵分解技术的跨模态哈希方法等。二是在文本/图像/视频的内容分析与理解领域，团队开展了基于机器学习的面向该类数据的内容分析和理解研究，提出了基于双流深度神经网络的内容分析模型和基于对抗生成网络的视频描述等模型。使用该类模型可以有效对图像或者视频等数据进行内容分析，并能够通过文本对该类数据所包含的内容进行描述。三是在图文识别领域，团队开展了面向图文检测和识别的相关研究，并提出了有效的基于深度学习的检测和识别模型。通过相关模型可以有效检测图像中所包含的文本，并进一步对文本进行识别。基于相关研究，团队提出了针对考试场景的图文识别相关模型。使用相关模型可以有效实现图像中的文本定位、文本切割和文本识别等任务。目前，相关技术已成功应用于大规模高考试卷的识别等场景中。

以上研究得到了国家自然科学基金、教育部新世纪优秀人才支持计划、山东省自然科学基金重点研发计划等项目的支持。

【关闭】

人工智能研究中心

Research Center of Artificial Intelligence, Shandong University

许信顺教授团队在人工智能领域取得系列研究成果