2015年以来科研成果介绍
2015年以来,重点实验室一方面针对本领域国际前沿科学问题,承担前沿研究课题,出高水平的论文成果;另一方面针对国家信息安全重大需求,在多领域开展应用研究。已经在数字声像取证、密码技术与应用、人脸识别技术等理论研究和技术应用方面研究取得了一批富有意义的成果,2015以来承担包括973课题、国家支撑计划课题、国家自然科学基金重点项目、国家自然科学基金项目等项目超过78项,项目金额超过5484万元。在IEEE Trans on PAMI、IEEE Trans on IT、IEEE Trans.on ISFs、IEEE Trans on IP、IEEE Trans on Multimedia等国际权威刊物以及ICCV、CVPR、IH&MMSec等专业重要学术会议上发表富有影响的论文65篇,获得授权发明专利和软件著作权一批。实验室成员获得国家自然科学奖二等奖1项、广东省科学技术奖励二等奖1项,另有其他省市科学技术奖励3项。
1、多媒体信息安全技术
实验室一直保持着数字媒体技术研究的优势和特色,在数字媒体智能信息处理取得重大研究进展。经过十几年研究,数字水印抵抗常规信号处理的问题已经得到较好的解决,但对抗几何失真,尤其是抗恶意几何攻击还面临巨大挑战。成果的主要思路是寻找高鲁棒性的几何不变量作为水印载体,解决图像失真下水印的正确提取问题。主要创新点如下:(1)结合频域均值分量、直方图、纹理等底层特征,构建了多种几何不变量,可以抵抗旋转、缩放、噪音、滤波等多种变换,极大扩展了不变量抵抗变换的能力,为面向安全的图像水印生成等应用提供理论基础;(2)分析了局部直方图、频域不同分量的几何不变性质,揭示了局部直方图的几何不变机理,通过实验证明了频域均值分量相比其它分量的鲁棒性和优越性;(3)将提出的几何不变量用于水印生成等面向安全的典型应用,并取得了对几何变换鲁棒的水印效果。上述成果是2015年度国家自然科学二等奖的重要组成部分。
2、密码技术及其应用
密码技术是保护信息安全的主要手段之一。近几年,实验室研究人员在密码技术,特别是基于双线性对的密码体制和ECC、编译码理论,量子计算和量子密码方面取得了许多具有国际水平的成果。重要成果包括:(1)椭圆曲线离散对数问题求解方法,创新点:在求解椭圆曲线离散对数问题(ECDLP)方面,利用“二元域上椭圆曲线的半点比倍点快”这一事实,我们提出提高二元域上ECDLP计算的算法。仿射坐标下半点所需的运算量大概在[21/8M, 19/6M]范围内。仿射坐标下点加和倍点所需的运算量通常大于10M。文章对于美国国家标准技术局推荐的二元扩域F2^233上的随机曲线,新的算法比以前最好的算法快约12-17%;(2)块马尔科夫叠加传播方法,创新点:在线配置任意给定码长、任意码率、任意星座,满足任意给定误码率;(3)我们首次将强迫攻击者引入到对称搜索加密方案中,并给出对应的解决方案:可否认对称搜索加密方案。其主要思想是参与者利用似真的密钥和随机数使敌手确信搜索token与提交的似真的“关键词”之间的正确关系。根据敌手扮演的角色,我们还考虑两种场景:内部强迫攻击者和外部强迫攻击者。因为他们所处的位置不同,因此构造的方案也有所不同。这个工作是SSE功能上的一个提高。
3、网络安全技术
实验室研究人员在网络流量分析、入侵检测、网络安全风险评估等方面取得了许多具有国际水平的成果。研究成果包括:(1)代理穿透攻击检测,创新点:本研究通过时空局地性描述代理行为,从而使检测方案与服务内容和攻击强度无关。通过非线性映射函数保护弱检测信号,用参数化隐半马尔科夫模型描述时空局地性演变过程。提出两种不同尺度的检测方法,并通过“软控制”方案改造可疑代理流,有效降低传统“硬丢弃”方式对合法用户的影响。(2)通用网络流模型,创新点:本研究采用两层隐马尔科夫模型实现网络流的建模,该模型包含两个嵌套的隐马尔科夫链和一个观测链。针对带状态停留的两层隐马尔科夫模型,设计了有效的算法。实验表明该方案在以下几个方面优于传统的流模型,包括:时间结构、统计属性、自相似性、队列行为及多尺度属性。(3)SACA-K,创新点:对IS后缀排序算法提出新的子串命名方法,设计了目前文献所载唯一实用的O(1)工作空间、线性时间O(n)的常数字符集后缀排序算法SACA-K。
4、生物特征识别技术
实验室在人脸识别、行人再标识与行为分析的研究方面产生了比较广泛的国内外影响。在科技部国家支撑课题、国家自然科学基金-广东省政府联合重点等项目等的资助下,多年来,本实验室主要研究鲁棒不变特征和高度鲁棒的度量来克服非可控环境的影响。主要创新点如下:(1)研究非线性人脸光照图像处理,包括提出基于原像学习在内的一系列多频带分解算法以去除光照影响;解决了跨光照条件人脸图像不变特征的理论解释问题;近期结合深度学习,提出一套包含多项指标的人脸图像质量自动检测方法和提出一套高效的人脸识别深度学习算法;(2)在国内外较早并长期开展实现行人大范围追踪的行人重识别这一关键技术研究(它在人工智能顶级期刊IEEE TPAMI上, ESI 高被引论文,该论文的会议版本近5年获得了768次谷歌引用),近期主要提出非对称建模框架,克服了跨摄像机视域图像数据分布偏差问题,该框架已经全面在低分辨率、遮挡、跨模态行人重识别及快速行人检索傻姑上应用并首次建立相应的计算机视觉模型;(3)实验室近年来开展多模态行为识别研究,提出了“特有-共享”的异质特征联合协同学习模型等一系列工作,实现了对未观测行为的实时预测(达到40帧每秒)。
研究成果成功应用于外交部唯一的因公护照照片质量检测平台(http: //www.mrtdephoto.net)和广州高铁南站的乘客自助检票通关系统以及广州市高考考生身份验证系统,在2016年获得中央电视台新闻联播节目的报道,是广东省科学技术进步奖二等奖的重要组成部分;获微软全球竞赛The Malmo Collaborative AI Challenge二等奖、2017国际顶级学术会议ICCV大规模手势识别竞赛 ChaLearn LAP第二名。已有包括IEEE TPAMI、IEEE TIP、ICCV、CVPR等在内的著名期刊和会议上10多篇论文已经发表,申请国家发明专利10项以上,获ICDM最佳论文提名奖。
5、成果—原型系统和应用
重点实验室积极开展了在产、学、研相结合的应用研究,研发了一批数字声像取证和网络空间环境下的信息安全技术,形成了音质分析网络音乐搜索引擎、RFID防伪技术与产品、网络脆弱性探测系统、人脸识别平台系统等产品,满足了国家和广东省信息安全领域的一些实际和重大应用需求,对维护国家和广东省信息安全做出了实质性贡献,均取得了显著成果和社会经济效益。
代表性研究成果简介
1、代表性成果一:可视媒体几何计算的理论与方法
可视媒体几何计算的理论与方法获得2016年国家自然科学奖二等奖,黄继武(中山大学)排名第二。
项目简介:该项目属信息技术领域。可视媒体计算是数字内容产业、公共安全和可视媒体在线服务等国家重大需求的共性基础。本项目从可视媒体的几何属性入手,发现其内在的几何结构及其不变机理,提出了内嵌几何结构的新型计算模式,突破了传统方法缺乏结构化、参数化表达的局限,为可视媒体处理引入了符合视觉认知的计算智能,形成了可视媒体几何计算的理论与方法,有效解决了可视媒体检索、识别、合成与版权保护中的系列难题。主要发现点为:
(1)建立了可视媒体形状几何的计算模式,开创了基于海量可视媒体进行图像合成的新方向;以形状几何作为全局结构化描述,提出了基于全局对比的显著性检测、非刚体匹配等方法,形成了形状几何的计算模式,基于形状几何抽取与匹配的创新发现,提出了互联网图像合成方法Sketch2Photo。相关成果得到IEEE Fellow、MIT 的Freeman 教授,马尔奖得主Zhuowen Tu 教授等的引用和高度评价,被法国Netexplorateur 委员会评选为2009 年全球互联网数字媒体领域十大创新技术;
(2)提出了可视媒体几何不变量的计算模型,揭示了局部直方图和矢量树形结构的几何不变机理,提升了几何不变量抵抗形变的鲁棒性;基于几何不变量的计算模型,提出了几何不变的图像信息隐藏方法和支持任意旋转角度的多视角人脸检测方法。相关成果被谷歌街景负责人Vincent博士誉为“清华检测器”,获计算机视觉领域顶级会议CVPR 2007最佳学生论文奖;
(3)提出了内嵌网格几何的思想,基于高维层次网格和梯度网格等内嵌网格几何,提出了可视媒体参数化表达,将可视媒体计算问题从图像空间映射到参数化空间,具有保持拓扑和计算复杂度低的优点,解决了复杂拓扑条件下的图像矢量化难题,为突破可视媒体计算中的性能瓶颈提供了新的思路。
项目成果20 篇论文共被他引3116 次,SCI 他引804 次;8 篇代表性论文共被他引1847 次,SCI 他引510 次,得到MIT、斯坦福等220所大学/机构和27位ACM/IEEE Fellow的引用,得到英国《每日电讯报》、德国《明镜周刊》、美国《赫芬顿邮报》等国际媒体的报道,被编入国外大学经典教材和课程讲义。项目组1 人入选第一批国家“万人计划”科技创新领军人才,2 人获国家杰出青年基金资助,主要成员入选教育部创新团队。
2、代表性成果二:面向公共安全的视频大数据智能分析关键技术及应用
面向公共安全的视频大数据智能分析关键技术及应用获得广东省科学技术奖励二等奖(2016),赖剑煌(中山大学)排名第三、郑伟诗(中山大学)排名第四。
项目简介:公共安全是关乎国家社会稳定、经济发展的重大社会问题。公共安全事件大多发生在复杂监控场景下,具有“目标类型多样”、“异常行为隐蔽”和“数据存储海量”的特点,如何在复杂场景下的海量非结构化视频数据中深层次挖掘高价值的信息,给传统的公共安全治理实践带来了新的机遇与挑战。
本项目根据新时期多种复杂场景下的视频大数据智能分析需求, 面向视频监控系统中“目标识别跟踪”、“异常行为感知”和“多维语义检索” 3个主要处理过程,针对4个关键技术难题,取得了6项技术创新突破,包括:
(1)针对复杂场景下运动目标的检测率低、误检率高的难题,提出了基于改进HOG特征的目标复检算法对显著图输出的目标结构进行高精度的复检,将目标检测率提高至94.62%,同时降低误报率至1.35%;
(2)针对复杂场景下目标之间相互遮挡情况影响目标整体检测的问题,提出了基于改进的Weber局部描述子 (MWLD)的目标检测及分类方法,在INRIA数据库上,在误报率为0.1的情况下,提高遮挡人车识别率至91%;
(3)针对低分辨率设备下的人脸超分辨率重建难题,提出了基于“形态学成分”和“核主成分”分析的人脸超分辨率重构方法,获得了高分辨率原像,在FERET数据库上提高人脸的首位识别率至80%;
(4)针对剧烈人脸图像变化引起人脸识别难题,提出一种光照不变描述子和一种更适合用于人脸识别的稀疏的局部特征描述子(FSD),完成快速人脸匹配,在CAS-PEAL-R1数据库上提高人脸的首位识别率至97. 49%;
(5)针对人体周边物体对异常行为分析的影响,提出一种基于模板学习的人物交互分析技术,并结合分析稀疏光流熵的模式来判断剧烈运动,在SPORTS数据库上提高异常行为检测率至92.5%;
(6)针对复杂场景下的运动目标结构化分析难题,提出了“一种基于多维特征向量的关键帧提取算法”, 提高完整目标提取率至96%,结合哈希及Euler大规模聚类算法,在Caltech 101等五个数据库上,提高归一化互信息至58%(高于传统方法15%)。
本项目申请发明专利16件,其中已授权发明专利5件,获得软件著作权10项,在国际重要学术刊物和国际学术会议上发表SCI论文10篇,他引总次数达240。经广州市科技创新委员会组织有院士参加的鉴定委员会鉴定,认为整体技术处于国际先进水平(市科技局-GK14097),并于2014年获得广州市科学技术奖一等奖(证书号:2014-电子-1-02-D01)。
本项目研发的视频大数据智能分析技术与系统让视频监控从人工抽检,进步到高效事前预警、事后分析 ,实现智能化的信息分析、预测,为视频监控领域业务带来深刻的变革。目前已经广泛应用到广东、广西、山东、新疆等多个省份,涉及公安、金融、交通、教育等多个行业,2010-2015年项目累计获得合同额超过12亿元,取得了良好的经济和社会效益。
3、代表性成果三:数字声像资料鉴别分析技术及系统
重点实验室在数字音频、数字图像和数字视频检验分析和司法取证方面取得了一批具有国际水平的理论成果,例如:相机源取证的贝叶斯博弈模型和框架。该成果的创新点在于:图像信息取证技术在存在攻击情况下检测性能的研究越来越受到研究者的关注。基于模式噪声的相机源取证是一种用于关联照片和其对应相机的主要技术,这种技术所基于的相机指纹虽然可靠性很高,但存在易于被伪造的缺陷,其中一种典型的伪造是指纹拷贝攻击。基于相机传感器模式噪声的相机源取证容易受到相机传感器模式噪声指纹拷贝的攻击,因此相机源取证技术的最终性能如何评估是个问题。为此,我们利用博弈论来分析在这种存在攻击情况下的取证技术安全性和性能评估。首先提出了使用图像的噪声水平来检测相机传感器指纹拷贝的攻击的方法,然后考虑到信息取证方和反取证方之间的博弈,提出了基于相机传感器模式噪声的相机源取证的完全信息博弈模型和不完全信息贝叶斯博弈模型,以及由此建立了相机源取证的框架,并分析了完全信息博弈模型和不完全信息贝叶斯博弈模型两种框架下的纳什均衡,分别得到了两种框架下混合策略纳什均衡下求解方法和检测性能曲线(receiver operating characteristic curves),仿真实验结果也直观地反映出信息不对称对贝叶斯博弈模型博弈结果有着显著影响。 研究成果获得本领域重要国际会议IWDW 2013的论文最佳奖。
基于理论研究成果的积累,实验室于2014年负责研制了具有重要应用和推广价值的“数字声像资料鉴别分析系统”,该平台针对数字声像资料鉴定领域中的真实性检验分析问题而开发的综合性平台,融合有数字音频、数字图像和数字视频检验分析三大子系统,支持常见的音频、图像、视频格式,具有数字声像元数据分析、录制设备特性分析、数字信号统计特性分析、剪辑痕迹分析和定位等功能。该系统同时经过司法部司法鉴定科学技术研究所和司法部司法鉴定中心试用,得到了各方的一致肯定。该系统在数字声像资料完整性和真实性鉴别等方面实现了国内外领先的实用方法,达到了较好的应用水平,经过不断的产学研合作研发和完善,实现了产业化推广,为司法部司法鉴定科学技术研究所,公安部三所,广东省监察厅,广东天正司法鉴定中心,广东移动,平安银行等部门提供了大量的技术服务,并完成产值超过3000万元。
4、代表性成果四:人脸识别技术方法及系统
实验室在人脸识别实用化的光照处理、姿势矫正、超分辨率处理等方面取得了一系列突破性的理论成果,例如:基于直推式的异质人脸识别算法。该成果的创新点为:从理论上补充了已有的特征表达方法在可见光与近红外人脸匹配问题上的适用性分析;首次将可见光与近红外人脸匹配问题作为直推式学习问题来处理,由此发展出一种全新的直推形式特征子空间学习方法。发表在IEEE Transactions on Information Forensics and Security。
基于理论研究成果的积累,实验室与广州像素数据技术股份有限公司联合研法了多项产品,主要包括面向静态照片与动态视频的人脸检测、人脸照片质量评测、人脸照片标准化处理、人脸识别等关键技术。主要应用如下:
(1)人脸检测处理技术应用于:港澳居民来往内地通行证及往来港澳通行证数字相片检测处理平台;首个外交部批准的因公电子护照检测处理平台:(http://www.mrtdephoto.net);黑龙江、新疆等多省份电子护照检测平台及广州市、陕西省、江苏省、青岛市、南昌市等多省市二代证相片检测平台。
(2)建设广州市公安局2000万人像库“人像应用共享服务平台”项目。
(3)中国银行广州分行旗舰店智能人脸识别VIP项目。
(4)广州高铁南站的乘客自助检票应用项目人脸识别技术提供方。
(5)人脸识别技术产品“人脸指纹身份证信息采集验证移动终端”2016至2017年连续两年应用于广州市高考考生身份验证,获中央电视台新闻联播节目的报道。
(6)广州地铁保安勤务系统建设项目、佛山市公安局祖庙地铁站动态人脸识别平台项目。
5、代表性成果五:可否认对称搜索加密方案
对称可搜索加密(SSE)是当前云安全研究领域的热门研究方向之一。鉴于SSE的灵活性和实用性,许多相应的加密方案相继被提出。在这些提出的方案中所关心的敌手模型要么是半诚实的,要么是恶意的。然而在现实生活中,还存在这样一种敌手,它可以强迫参与者中的任何一个打开通信中间值,进而追踪参与方的隐私行为。现存的方案是不能抵抗这类敌手的。基于此,我们首次将强迫攻击者引入到对称搜索加密方案中,并给出对应的解决方案:可否认对称搜索加密方案。其主要思想是参与者利用似真的密钥和随机数使敌手确信搜索token与提交的似真的“关键词”之间的正确关系。根据敌手扮演的角色,我们还考虑两种场景:内部强迫攻击者和外部强迫攻击者。因为他们所处的位置不同,因此构造的方案也有所不同。这个工作是SSE功能上的一个提高,发表在2017年的Information Sciences上。