我正在开发一个人必须模仿预定姿势的项目。照片是由模仿此预定义姿势的人制作的。 然后,从这个图像中提取人的人体姿势,并与预定义的姿势进行比较。最后一个得分机制决定两个姿势的匹配程度,或者它们完全匹配。智能手机上的人体姿势估计/匹配
我想为智能手机开发,因此理想情况下,所有内容都嵌入智能手机本身。这意味着,该实现能够在CPU或智能手机GPU上运行(例如Moto G5 Plus,板载Adreno 506 GPU - 支持OpenGL)。 工作嵌入式不是必须的,我认为也可以将估算/匹配算法外包给包含体面GPU的中央服务器。嵌入式或外包式这种特殊选择是一个涉及许多参数(性能/计算能力,服务器成本,准确性,移动电池使用率,延迟服务器通信,多平台,可扩展性,移动数据使用量 - 无重要 - ,...)
我知道有一些框架可用于人体姿态估计,如Openpose和更深切。但是,由于他们都使用深度学习,他们需要一个下降GPU。目前,大多数新智能手机都配备了GPU,但它们是否能够运行这些框架? 为了适应这种情况,(多人)关键点检测不需要是实时的,因为只有1个图片(没有实时视频),并且延迟时间为2到5秒是可以接受的。
由于我还处于研究阶段,我不知道该走什么方向。 它甚至有可能将这些框架移植到智能手机平台上吗?就像Openpose一样,它使用Caffe和OpenCV。假设我想将Openpose移植到Android;我知道有一个库CNNdroid能够将使用Caffe制作的CNN模型转换为CNNdroid格式。进一步的OpenCV也不应该是一个大问题,因为有一个Android版本可用。所以,从理论上讲似乎是可能的,但在实践中......
我的问题是:是否有人在智能手机上使用人体姿势检测/匹配的经验?智能手机上现有的GPU可用吗?我知道这是一个很宽泛的问题,但一些方向/建议/经验可以真正帮助
UPDATE: 我正在考虑移植的选项Openpose(使用来自Caffe为ML框架)来TensorFlow。 TensorFlow支持的Android &的iOS