在人工智能和计算机视觉技术不断发展的背景下,人体动作识别技术已成为军事训练和体育运动等领域的核心应用。然而,现有基于计算机视觉的人体动作识别方法受到多种因素影响,如复杂背景、人体穿着以及光线强弱等,导致识别率较低。为解决这一问题,本文提出了一种基于双目视觉和深度学习的算法来提取骨骼点,通过骨骼点变化特征来识别人体动作的方法。该方法旨在提高识别准确率,为相关领域的发展提供有力支撑。
该方法首先使用双目视觉技术获取人体的三维点云数据。由于双目视觉能够获取物体的三维信息,因此可以更好地处理复杂背景和人体穿着等问题。然后,使用深度学习技术对点云数据进行处理和识别。具体来说,我们采用卷积神经网络(CNN)对点云数据进行特征提取,并使用支持向量机(SVM)进行分类识别。
为了提高识别率,我们采用了多视角和多姿态的采集方式,并对数据进行预处理和增强。此外,我们还采用了迁移学习和数据集扩充等技术,进一步提高了模型的泛化能力。
有实验结果表明,该方法在不同场景下均能取得较好的识别效果。与传统的基于计算机视觉的方法相比,该方法在识别率和稳定性方面均有所提升。同时,该方法还具有较好的实时性和鲁棒性,能够在实际应用中得到广泛应用。
1背景与意义
全军深化军体训练内容改革提出了“实现科技赋能,从常规手段向智慧训练转变”的口号。遵循运动训练规律,强化实战牵引,坚持问题导向,注重科技赋能,以新理念新方法新手段促进军体训练高质量发展。
为了实现这一目标,全军深化军体训练内容改革正在积极推进。通过引入先进的科技手段,双目视觉算法对骨骼点进行立体提取,将传统训练方式与现代科技相结合,提高训练的针对性和实效性。同时,改革还注重实战化训练,以实战需求为牵引,强化官兵体能、技能和战斗意志的全面提升。
为了解决传统训练中的问题,全军深化军体训练内容改革还注重创新训练理念和方法。例如,针对不同兵种、不同岗位的特点,制定个性化的训练计划和方案,提高训练的针对性和实效性。同时,通过引入科学化的训练方法和手段,减少训练中的盲目性和低效性,提高训练的质量和效益。
全军深化军体训练内容改革正在积极推进科技赋能、实战化牵引和问题导向的原则,以新理念新方法新手段促进军体训练高质量发展。通过改革,将进一步增强官兵的身体素质、战斗技能和战斗意志,提高部队的战斗力和凝聚力,为维护国家安全和发展作出更大的贡献。
2立体视觉骨骼点提取研究概况
计算机视觉技术,它是自然界中三维客观实体在二维图像平面上的完美再现。这种技术模拟了人类如何根据三维物体在二维图像平面上形成的灰度层次(或彩色层次)图像及经验来判断不同目标实体的属性及关系。如今,双目立体视觉技术主要聚焦于图像获取、摄像机标定、特征提取、图像匹配以及深度信息提取等几个核心研究领域。目前国内学者已对摄像机标定、特征提取、图像匹配等方面投入了大量研究,并取得了令人瞩目的成果。清华大学国家重点实验室研究开发了采用最典型的平行双目立体视觉系统的拟人机器人TBIPR-1,哈尔滨工业大学采用异构双目视觉系统设计了一款机器人用于足球导航。
针对计算机视觉在人体识别过程中面临的复杂背景、光线强弱、人体穿着,尤其是迷彩服强大伪装效果等挑战,本文提出了一种基于双目立体的人体骨骼点预测的动作识别方法。首先,利用传统的图像识别技术来替代红外传感器,以便获取人体彩色图像数据、深度图像数据及骨骼点数据。双目摄像机的使用,增强了数据获取的准确性和可靠性。其次,结合二维骨骼点检测算法对骨骼点进行优化处理。一种基于RGB图像的算法模型,可以检测识别单人或多人的二维骨骼点数据。即使在小部分被遮挡的情况下,该算法也能推断并预测被遮挡骨骼点的位置,从而提高了识别的鲁棒性。接下来,将获取的三维骨骼点坐标作为待优化坐标,再将二维骨骼点坐标映射处理得到三维骨骼点坐标作为优化参数。通过算法对两者进行拟合优化,得到稳定的三维人体骨骼点序列。此外,针对传统算法运算量大、速度慢的问题,通过调整约束系数和约束项对传统算法流程进行改进,从而减少了运算量,提高了识别速度。
3立体视觉的关键技术
目前主流的三种立体成像技术有:
(1)结构光(StructuredLight):结构光投射特定的光信息到物体表面后,由摄像头采集。根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。
(2)TOF(TimeOfFlight,飞行时间):通过双目摄像机代替专有传感器,捕捉可见光从发射到接收的飞行时间,判断物体距离。
(3)双目测距(StereoSystem):利用双目摄像头拍摄物体,再通过三角形原理计算物体距离。
双目测量原理研发的立体智能视觉产品已广泛应用于物体空间位置定位、尺寸测量、物体识别等场景。
4技术特点
二维图像处理在人体动作识别领域的应用已得到广泛认可,然而,现有的处理方法大多仅依赖二维图像的识别算法。这些方法通常以人体的某些部位作为特征,通过在图像中寻找匹配项来实现识别。目前,人体识别技术还有其他常用方法,例如基于人体模型和结构元素的方法。此类方法对获取完整人体图像信息的要求较高,难以处理运动中的物体变形,并且对图像采集的实时性要求严格。另外,还有基于小波变换和支持向量机的方法,该方法主要依据小波模板原理,需要在不同尺度上搜索整张图像,因此计算量较大。这些方法虽然在某些情况下具有一定的应用价值,但仍存在一些局限性和不足之处,需要进一步改进和完善。
双目智能立体视觉技术,作为一项引领行业前沿的人体动作识别技术,通过双目立体视觉系统模拟人的双眼对人体动作进行三维建模,实现了对人体动作的精准识别。该技术基于深度学习算法,能够快速对人体动作骨骼点位置进行精准识别,进而准确获取人体动作的角度、距离等参数信息。这一技术的应用,提升了人体动作识别的精度和效率,更为军事体育训练领域提供了重要的技术支持。在军事体育训练中,双目智能立体视觉技术可对参训人员的身体姿态进行分析,为组训者提供精准评估运动动作的工具。该技术的应用将提升军事体育训练的现代化水平,为提升训练效果和质量发挥重要作用。
(1)小数据量快速认知能力
人体动作认知能力只需非常小数据物体图像信息,借助三维立体空间人体的多特征信息进行识别认知,无需大量通过二维平面的图像数据进行训练识别,大大缩短了技术的落地化时间。
例如识别举手动作,利用双目智能立体视觉认知技术只需采集三张张图像信息,即可进行识别,且在不同光线、不同角度、不同人员举手情况下都能保持稳定的识别准确率,而现有平面图像训练方式,需要成千上万张不同光照、不同状态、不同角度姿态的照片进行前期训练,才能基本保证识别率。
(2)能快速收集人体立体数据,无需提前进行标记
基于三维立体空间人体认知,可对图像中的人体数据进行完美分割并对每个分割的动作空间特征数据进行数据采集及存储,并且无需提前在图片上进行人工的标记过程。相比于二维平面视觉认知需要提前对图像信息进行标记相比,大大节约了人工成本,且采集收集到的人体数据信息更加全面、可靠。
5技术优势
在三维空间双目立体视觉核心算法技术方面,当前国外的多数研究机构和企业尚处于研发和科研阶段,尚未出现大规模落地化的双目立体视觉产品项目。我国已经过长期的研发与实践,在双目立体视觉感知及认知算法、图像分割算法、立体定位算法、立体测量算法、立体检测算法、计数算法以及双目硬件载体等方面积累了深厚的核心技术实力,并成功研发出多套系统产品及解决方案。这些技术的突破不仅突破了二维平面视觉技术的局限性,还在工业、制造业、钢铁、物流、教育、农业等领域得到广泛应用,并已开展了一系列场景合作。在核心技术和创新能力上,已具备领先水平。
值得一提的是,我国已有企业和研究机构在双目立体视觉技术应用于军事训练考核方面实现了行业首创。
与传统的平面图像识别方法相比,该技术的应用在训练动作考核的准确率和识别效率方面得到了显著提升,其性能明显优于二维图像产品。这一创新之举将为军事体育训练提供更加精准高效的解决方案,进一步推动相关行业的技术进步。
6总结及下步研究方向
本文以军事体育训练为研究背景,以双目摄像机骨骼点识别为研究方向,实现了基于双目立体视觉的特征点提取与定位,包括关键技术核心、技术特点技术优势三个部分。现将研究工作进行总结,并指出双目人体特征骨骼点提取与定位系统需要进一步解决的问题。
本文研究了军事训练场景下的双目骨骼点提取,虽然已成功开发了特征点提取与定位系统,并在已有的智能训练考核机器人平台运行,但仍需改进。需进一步研究的问题包括:
1.摄像机标定:考虑距离对标定的影响,即标定板距离摄像机的距离大小对于标定参数的影响以及标定后参数的可适用范围。
2.立体匹配:改进算法,可以考虑针对首幅图像进行BOX区域限制,以后采集到的图像对已知大小的BOX区域进行位置累积,实现对BOX区域的定位和跟踪,提高程序的实时性和便捷性,实现机器人定位的全自动化。
3.环境信息:本文所指的算法只适配了有限的训练场环境和军队21式林地和荒漠迷彩服,未针对所有军队服装进行适配,这是后期算法优化升级的重点。
总之双目立体骨骼点提取对军事体育运动的矢量分析具有重要意义,值得深入研究,必将“为从常规手段向智慧训练转变”提供强大的助力。
参考文献
【1】黎洪松.数字视频处理[M].北京: 北京邮电大学出版社,2006.
【2】丁剑飞,刘永进.三维立体显示中的视觉机理综述[J].全国第15届计算机辅助设计与图形学学术会议,2008,64-76.
【3】周颖.深度图像的获取及其处理[D].西安: 西安电子科技大学,2008.
【4】李德广,李科杰,高丽丽.基于多方向多尺度方向相位匹配的立体视觉方法[J].仪器仪表学报,2004,25(4):600-602.
【4】马颂德,张正友.计算机视觉一计算基础与算法基础[M].科学出版社,2003.
【5】李嗣旺.基于物理的柔性体运动编辑技术[D].浙江大学,2015.
【6】曾庆化,潘鹏举,刘建业,等.惯性信息辅助的大视角目标快速精确定位[J].航空学报,2017,38(8):188-200.
【7】吕金泽.基于Kinect的动作学习辅助系统[D].中北大学,2019.
【8】李梦荷,许宏吉,石磊鑫,等.基于骨骼关键点检测的多人行为识别[J]. 计算机科学,2021,48(04):138-143.
【9】胡新荣,王梦鸽,刘军平,等.基于Kinect的人体三维动作实时动态识别[J].科学技术与工程,2020,20(34):14133-14137.