JavaCV人脸识别三部曲之二:训练

javacv,人脸识别,三部曲,之二,训练 · 浏览次数 : 373

小编点评

**代码解析** 该代码展示了一种使用Java开发的人脸识别应用程序的步骤,包括: **1. 初始化** * 创建一个名为`TrainFromDirectory`的类。 * 使用`List`存储所有要训练的图片路径。 * 创建一个`MatVector`用于存储每个照片的索引和类别。 **2. 读取图片** * 使用`opencv_imgcodecs`读取指定路径的灰度图像并将其转换为`Mat`对象。 * 对图像进行大小调整。 **3. 获取文件路径** * 遍历指定目录,查找所有文件路径。 * 将非目录的文件过滤出来。 * 将所有图像路径添加到`paths`列表中。 **4. 训练模型** * 实例化FisherFaceRecognizer类进行模型训练。 * 将图像路径和类别路径添加到训练集合中。 * 训练模型。 **5. 存储模型** * 将训练好的模型保存到指定路径中。 **6. 测试模型** * 使用`faceRecognizer.load`加载模型。 * 将模型用于检测摄像头中的人脸。 * 显示识别结果。 **一些要注意的地方** * `TrainFromDirectory`类的`imageIndexMatMap`和`lables`用于存储训练图像的索引和类别。 * `read`方法可以根据需要进行图像大小调整。 * 训练完成后,模型会被保存在`faceRecognizer.xml`文件中。 * 该代码展示了一种使用Java开发的人脸识别应用程序的常见流程,并提供了代码示例。

正文

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos

本篇概览

  • 本文是《JavaCV人脸识别三部曲》的第二篇,前文《视频中的人脸保存为图片》咱们借助摄像头为两位群众演员生成大量人脸照片,如下图,群众演员A的照片保存在E:\temp\202112\18\001\man,B的照片保存在E:\temp\202112\18\001\woman
    在这里插入图片描述
  • 照片准备好,并且每张照片的身份都已确定,本篇要做的就是用上述照片生成模型文件,今后新的人脸就可以中这个模型来检查了
  • 关于训练,可以用下图来表示,一共六张照片两个类别,训练完成后得到模型文件faceRecognizer.xml
    在这里插入图片描述

编码

  • 训练的代码很简单,在一个java文件中搞定吧,simple-grab-push是整个《JavaCV的摄像头实战》系列一直再用的工程,现在该工程中新增文件TrainFromDirectory.java,完整代码如下,有几处要注意的地方稍后提到:
package com.bolingcavalry.grabpush.extend;

import com.bolingcavalry.grabpush.Constants;
import org.bytedeco.opencv.global.opencv_imgcodecs;
import org.bytedeco.opencv.opencv_core.Mat;
import org.bytedeco.opencv.opencv_core.MatVector;
import org.bytedeco.opencv.opencv_core.Size;
import org.bytedeco.opencv.opencv_face.FaceRecognizer;
import org.bytedeco.opencv.opencv_face.FisherFaceRecognizer;

import java.io.File;
import java.io.IOException;
import java.nio.IntBuffer;
import java.util.LinkedList;
import java.util.List;

import static org.bytedeco.opencv.global.opencv_core.CV_32SC1;
import static org.bytedeco.opencv.global.opencv_imgcodecs.IMREAD_GRAYSCALE;
import static org.bytedeco.opencv.global.opencv_imgproc.resize;

/**
 * @author willzhao
 * @version 1.0
 * @description 训练
 * @date 2021/12/12 18:26
 */
public class TrainFromDirectory {

    /**
     * 从指定目录下
     * @param dirs
     * @param outputPath
     * @throws IOException
     */
    private void train(String[] dirs, String outputPath) throws IOException {
        int totalImageNums = 0;

        // 统计每个路径下的照片数,加在一起就是照片总数
        for(String dir : dirs) {
            List<String> files = getAllFilePath(dir);
            totalImageNums += files.size();
        }

        System.out.println("total : " + totalImageNums);

        // 这里用来保存每一张照片的序号,和照片的Mat对象
        MatVector imageIndexMatMap = new MatVector(totalImageNums);

        Mat lables = new Mat(totalImageNums, 1, CV_32SC1);

        // 这里用来保存每一张照片的序号,和照片的类别
        IntBuffer lablesBuf = lables.createBuffer();

        // 类别序号,从1开始,dirs中的每个目录就是一个类别
        int kindIndex = 1;

        // 照片序号,从0开始
        int imageIndex = 0;

        // 每个目录下的照片都遍历
        for(String dir : dirs) {
            // 得到当前目录下所有照片的绝对路径
            List<String> files = getAllFilePath(dir);

            // 处理一个目录下的每张照片,它们的序号不同,类别相同
            for(String file : files) {
                // imageIndexMatMap放的是照片的序号和Mat对象
                imageIndexMatMap.put(imageIndex, read(file));
                // bablesBuf放的是照片序号和类别
                lablesBuf.put(imageIndex, kindIndex);
                // 照片序号加一
                imageIndex++;
            }

            // 每当遍历完一个目录,才会将类别加一
            kindIndex++;
        }

        // 实例化人脸识别类
        FaceRecognizer faceRecognizer = FisherFaceRecognizer.create();
        // 训练,入参就是图片集合和分类集合
        faceRecognizer.train(imageIndexMatMap, lables);
        // 训练完成后,模型保存在指定位置
        faceRecognizer.save(outputPath);
        //释放资源
        faceRecognizer.close();
    }

    /**
     * 读取指定图片的灰度图,调整为指定大小
     * @param path
     * @return
     */
    private static Mat read(String path) {
        Mat faceMat = opencv_imgcodecs.imread(path,IMREAD_GRAYSCALE);
        resize(faceMat, faceMat, new Size(Constants.RESIZE_WIDTH, Constants.RESIZE_HEIGHT));
        return faceMat;
    }

    /**
     * 把指定路径下所有文件的绝对路径放入list集合中返回
     * @param path
     * @return
     */
    public static List<String> getAllFilePath(String path) {
        List<String> paths = new LinkedList<>();

        File file = new File(path);

        if (file.exists()) {
            // 列出该目录下的所有文件
            File[] files = file.listFiles();

            for (File f : files) {
                if (!f.isDirectory()) {
                    // 把每个文件的绝对路径都放在list中
                    paths.add(f.getAbsolutePath());
                }
            }
        }

        return paths;
    }

    public static void main(String[] args) throws IOException {

        String base = "E:\\temp\\202112\\18\\001\\";

        // 存储图片的两个目录
        // man目录下保存了群众演员A的所有人脸照片,
        // woman目录下保存了群众演员B的所有人脸照片
        String[] dirs = {base + "man", base + "woman"};

        // 开始训练,并指定模型输出位置
        new TrainFromDirectory().train(dirs, base + "faceRecognizer.xml");
    }
}
  • 上述代码有以下几处要注意:
  1. 静态方法read用于将图片转为Mat
  2. 静态方法getAllFilePath可以遍历指定目录下的所有文件,把它们的绝对路径返回
  3. train一共获取了man和woman两个目录下的照片,man目录下的照片的类别是1,women目录下的照片类别是2
  4. 识别类是FisherFaceRecognizer,现在的训练和下一篇的识别都用这个类

执行

  • 运行main方法,待执行完成后,如下图,可见目录E:\temp\202112\18\001下已经生成模型文件faceRecognizer.xml
    在这里插入图片描述
  • 至此,本篇任务已完成,下一篇进入终极实战,用本篇训练的模型识别摄像头中的人脸,并把识别结果展示在预览页面上;

源码下载

名称 链接 备注
项目主页 https://github.com/zq2599/blog_demos 该项目在GitHub上的主页
git仓库地址(https) https://github.com/zq2599/blog_demos.git 该项目源码的仓库地址,https协议
git仓库地址(ssh) git@github.com:zq2599/blog_demos.git 该项目源码的仓库地址,ssh协议
  • 这个git项目中有多个文件夹,本篇的源码在javacv-tutorials文件夹下,如下图红框所示:
    在这里插入图片描述
  • javacv-tutorials里面有多个子工程,《JavaCV的摄像头实战》系列的代码在simple-grab-push工程下:
    在这里插入图片描述

欢迎关注博客园:程序员欣宸

学习路上,你不孤单,欣宸原创一路相伴...

与JavaCV人脸识别三部曲之二:训练相似的内容:

JavaCV人脸识别三部曲之二:训练

用分好类的人脸照片做训练,可以得到模型文件,该文件用于新照片的识别

JavaCV人脸识别三部曲之一:视频中的人脸保存为图片

先介绍人脸识别,再用JavaCV,将摄像头中的人脸提取出来保存为小图片,用于训练

JavaCV人脸识别三部曲之三:识别和预览

借助JavaCV,识别出摄像头内的人员身份,并展示在实时视频中

JavaCV的摄像头实战之八:人脸检测

在预览摄像头内容的时候增加识别功能,实时框选出人脸

JavaCV的摄像头实战之十四:口罩检测

使用JavaCV与百度AI开放平台,实现对摄像头内人脸的口罩检测

JavaCV的摄像头实战之十二:性别检测

实现性别检测并在预览窗口实时展现

JavaCV的摄像头实战之十三:年龄检测

在前面《性别检测》的基础上,修改少量代码,即可实现年龄检测和实时预览的效果

科大讯飞:说说零拷贝技术和多路复用技术?

零拷贝技术和多路复用技术是现代计算机系统和网络编程中两项重要的优化手段,旨在提高数据处理和传输的效率。如高性能框架 Netty 中,即使用了零拷贝技术又使用了多路复用技术,同时来保证 Netty 框架的高性能运行。 1.零拷贝技术 零拷贝(Zero-copy)技术是一种计算机操作系统中用于提高数据传

闲鱼面试:说说JWT工作原理?

JWT(JSON Web Token)一种开放的标准规范(RFC 7519),用于在网络上安全的传输信息,通常被用于身份验证。 简单来说,你可以把 JWT 想象成一张小巧的、自包含的电子通行证。这张通行证里面包含了用户的身份信息,就像你在某个俱乐部的会员卡,上面有你的名字、会员等级等信息,拿着这张卡

哈啰面试:说说Dubbo运行原理?

Dubbo 是一款高性能、轻量级的开源 RPC(远程过程调用)框架,主要用于构建分布式服务和微服务架构。那 Dubbo 又是如何运行的呢?让我们一起来看。 1.核心组件 要说 Dubbo 运行流程就不得不先来了解一下 Dubbo 的核心组件了,因为 Dubbo 的交互流程是和核心组件息息相关的。 D