新闻中心

EEPW首页>嵌入式系统>设计应用> 瑞萨AI视觉识别方案应用笔记3

瑞萨AI视觉识别方案应用笔记3

—— 轻松实现高效口罩人脸检测

作者：刘刚瑞萨电子中国MPU产品部高级经理时间：2021-09-03 来源：电子产品世界收藏

我们基于瑞萨RZ/A2M和它独有的DRP技术，构建了多款解决方案，包括工业自动化中的目标物体检测与追踪、二维码编码类型的快速检测等。这次，我们就来拆解如何使用RZ/A2M的DRP与嵌入式AI结合实现口罩人脸检测。

本文引用地址：//m.amcfsurvey.com/article/202109/427999.htm

在示例中我们通过MIPI接口连接Sony IMX219 CMOS传感器，输入一个1280x720分辨率的图像，通过RZ/A2M的DRP对输入图像做Simple ISP处理，图像缩放处理，然后运行一个轻量级且高效的口罩，人脸检测模型。它能够实现在人脸检测模式下30FPS的检测速度，在区分是否戴口罩的模式下实现20FPS的检测速度。下面让我们看一下它是如何实现的。

下图是他的数据处理流程：

蓝色部分的处理由DRP硬件加速实现，其中Simple ISP库将CMOS传感器的Bayer格式数据转换为灰阶数据，并统计一帧图像中三个预设区域的平均亮度用于调整自动曝光参数。

第二个DRP库实现图像的缩放处理，将1280x720分辨率的灰阶图像压缩成640x360大小的图像，它将大大提高人脸的检测速度。

图中绿色部分是由Cortex A9处理器运行的轻量级口罩及人脸检测模型，用于标定出当前帧是否有人脸，是否带有口罩。

在此示例中我们将不依赖外部RAM，只使用RZ/A2M的4MB片上高速RAM。

步骤1

由于人脸检测只需要使用灰阶图像，我们需要将CMOS传感器的Bayer格式图像转换成灰度图，此时我们载入一个simple_isp_2_tiles的DRP库，这个DRP库需要具有以下特性：

√ 占用2个Tile的DRP硬件资源

√ 实现Bayer转灰阶

√ 对3个独立的区域中所有像素的亮度值进行累加

√ 支持多Tile并行处理

由于这个库具有多Tile并行化(segmented)的处理特性，我们可以把它载入到3组DRP 的tile中。其中Tile0和1的simple_isp_2_tiles库处理顶部1/3的图像，Tile2和3的simple_isp_2_tiles库处理中间1/3的图像，Tile4和5的simple_isp_2_tiles库处理底部1/3的图像。且这三部分图像是同时并行化处理的，这让处理速度又增加了3倍。

由于DRP库提供了非常便捷的API接口，实现以上功能只需要简单的编程操作即可实现。

请根据DRP库的应用文档中关于 Number of tiles和Segmented Processing属性来决定如何加载DRP库

● Number of tiles: 表示DRP库需要占用几个硬件Tile

● Segmented processing:表示DRP任务十分可以拆分到多个tile中并行执行

DRP库在Tile中的摆放方式共有11种，可根据DRP的Number of tiles 和 Segmented属性灵活选择使用哪种加载方式，举例如下：

步骤2

在得到一帧灰阶图像后，我们载入一个resize_bilinear_fixed的DRP库将这一帧图像进行缩放。这个DRP库具有以下特性：

● 输入8bpp灰阶图像

● 支持 ⅛ ¼ ½ 1x 2x 4x 8x 16x 固定缩放比例

● 水平和垂直缩放比例单独控制

● 输入宽度范围128~1280，输入高度范围8~960

● 占用4 tiles硬件资源，不支持segmented

经过步骤2的处理，我们将灰阶图像从Video RAM1读入，宽和高均缩小为原来的½，并将图像写入到Video RAM2，用于下一步的人脸检测。

这两步的执行时间约为4.6ms和8.2ms，采用并行化处理和小于1ms的DRP库加载速度极大优化了人脸识别之前图像预处理的执行速度。

步骤3

我们移植了一个轻量级的开源人脸识别算法

在此基础上添加了口罩人脸的数据集，并对新数据集进行了训练，经过测试其识别速度和识别精度均比较理想。

首先需要准备数据集，可以直接通过我们示例包中的数据集训练或从网络下载

此数据集包含7092张人脸图片及4283张口罩人脸图片，并对图片中的人脸关键特征进行了标定。

AI模型并非普遍采用的神经元网络模型，而是使用了决策树模型，其具有执行速度快的特点，而且其模型大小只有几十KB到2百多KB，

以下是AI领域比较常用的算法：

决策树是一种非参数化的监督学习模型，它能够让你跟随树状的决策分支结果一步一步从根节点到达顶端叶节点，从而根据顶端叶节点的结果来预测目标值，常用于目标分类(classification)和回归(regression)

在人脸检测过程中，我们使用一个滑动窗口一步一步的扫描步骤2生成的图像，先使用最小滑动窗口，然后逐步增大窗口的大小。使用决策树模型检测每一个滑动窗口内是否存在人脸。

如下是一些关键参数的配置，我们可以通过参数调整在检测精度和性能之间进行平衡。

以下为1280x720分辨率输入，分别针对画面中1张人脸，3张人脸和7张人脸进行检测，在口罩人脸模式下可实现约15fps以上的检测速度。

如下视频是针对快速切换的图像进行人脸检测的测试结果，可以看到RZ/A2M在经过了DRP加速及和运行轻量级高效AI算法后，能够实时捕获到图像中的人脸。

关键词：AI视觉

评论

相关推荐

机器视觉软件sherlock在生产线零件对准方面的应用

设计方案机器视觉软件 sherlock 生产线零件对准方面 | 2009-09-03

聋人用视觉门铃

设计方案人用视觉门铃 | 2009-08-19

聋人视觉门铃

设计方案聋人视觉门铃 | 2009-08-21

如何快速搭建手写体识别演示系统

视频 digikey AI 手写体识别 | 2022-07-29

电子元件培训教材

资源下载 NBA 电子元件识别电阻识别电容识别 AI MI SMT DIP 静电防护 | 2008-09-20

AI算力芯片天下一分为四，中国实力渐显

智能计算算力大模型 AI | 2023-12-15

机器视觉的好网站

hpnet | 2004-11-23

瑞萨推出面向图形显示应用和语音/视觉多模态AI应用的全新RA8 MCU产品群

嵌入式系统瑞萨图形显示应用语音/视觉多模态AI MCU | 2023-12-12

视觉检测中高速图像采集技术的研究

资源下载视觉检测中高速图像采集技术的研究 | 2013-09-18

TI成功演示1GHz DSP，适合人工视觉等实时应用

liujt_ic | 2003-05-16

基于机器视觉的清洁机器人设计电路图

设计方案基于机器视觉清洁机器人设计电路图 | 2010-01-27

视觉：嵌入式的下一个方向

视频 Embedded Vision Alliance 视觉手势 | 2012-05-28

研华携手Hailo，扩展高算力边缘 AI 产品组合

工控自动化研华 Hailo 边缘 AI | 2023-12-11

英特尔推出新的人工智能芯片以与Nvidia和AMD竞争

智能计算英特尔 AI | 2023-12-15

康耐视发布200万像素视觉传感器

zhaodek | 2006-03-10

工信部：我国新能源汽车发展正带动产业生态全面重塑

汽车电子新能源汽车 AI 大数据 | 2023-12-12

意法半导体推出NanoEdge AI免费部署服务,打破边缘人工智能应用障碍

嵌入式系统意法半导体 NanoEdge AI 边缘人工智能 | 2023-12-13

AI驱动的嵌入式声音和振动识别

视频 ADI AI 嵌入式 OtoSense | 2018-10-23

基于计算机视觉的汽车四轮定位技术研究

资源下载计算机视觉汽车四轮定位技术研究 | 2012-05-24

AIGC手机处理器与传统AP挥手告别

手机与无线通信手机处理器 AP AI | 2023-12-14

AI PC 助力复苏，2024 年笔记本电脑出货量预计增长 11%

智能计算 AI PC 笔记本电脑 | 2023-12-11

2024智能制造展望：Industry 4.0、AI和自动化的发展

工控自动化自动化，工业，AI | 2023-12-15

开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

智能计算 OpenAI ChatGPT AI | 2023-12-12

iCAN-4017 AI功能模块

资源下载周立功单片机功能模块 iCAN-4017 AI | 2007-03-30

小型家庭智能安防视觉系统电路图

设计方案小型家庭智能安防视觉系统电路图 | 2010-01-21

[原创]想成立机器视觉公司的朋友看过来！

china-image | 2006-02-08

2021春晚黑科技，火爆全网的\"打工牛\"是什么来头？

视频 AI 机器人 | 2021-02-26

求职：图象处理，机器视觉

yangcheng | 2005-07-07

“破局AI开发，释放边缘算力开发者访谈”，干货满满！

视频 intel AI OpenVINO | 2021-06-10

IBM如何卖创意

资源下载如何卖创视觉中国 | 2013-09-16

技术专区

关闭