自学记录鸿蒙API 13:实现人脸比对Core Vision Face Comparator

简介: 在完成文本识别和人脸检测项目后,我深入学习了HarmonyOS Next API 13中的Core Vision Face Comparator API,开发了一个简单的人脸比对工具。该API能进行高精度人脸比对并给出相似度评分,应用场景广泛,如照片分类、身份认证、个性化服务等。通过初始化服务、加载图片、实现比对功能和构建用户界面,最终实现了可靠的人脸比对功能。未来计划将此技术应用于更复杂的场景,如照片管理和个性化服务,并探索与其他AI能力的结合。如果你也对人脸比对感兴趣,不妨从简单的比对功能开始,逐步实现自己的创意!

完成了文本识别和人脸检测的项目后,我发现人脸比对是一个更有趣的一个小技术玩意儿。我决定整一整,也就是对HarmonyOS Next最新版本API 13中的Core Vision Face Comparator API的学习,这项技术能够对人脸进行高精度比对,并给出相似度评分,判断是否为同一人。于是,我决定基于这个API开发一个简单的人脸比对小工具。


开始我的开发之旅

应用场景的思考

学习之前,我花了一些时间思考人脸比对技术的实际应用场景,例如:

  • 照片分类管理:基于相似度对图库中的照片进行智能分类,方便用户快速整理。
  • 身份认证:在人脸识别基础上,进一步验证是否为同一人。
  • 个性化服务:识别用户身份后,推荐个性化内容。
  • 社交互动:通过比对相似度寻找“脸型相近”的朋友,促进社交联系。
  • 家庭管理:比如家长在家庭监控中,快速识别视频中是否为家庭成员。

有了这些场景的启发,我更坚定了学习这项技术的决心。


第一步:理解Face Comparator API的核心功能

核心功能

Face Comparator API 提供了以下核心功能:

  • 高精度人脸比对:输入两张图片,分析其中的人脸,给出是否为同一人的判断。
  • 相似度评分:提供0到1的相似度评分,帮助开发者精确控制比对结果。
  • 高性能端侧计算:比对算法在设备端执行,无需上传到云端,确保用户隐私。
  • 便捷扩展性:支持与其他视觉服务如人脸检测、活体检测的无缝集成。

应用场景

人脸比对的应用场景非常广泛,包括但不限于:

  • 安全场景:如支付验证、门禁识别。
  • 社交平台:为用户推荐相似的照片或好友。
  • 相册管理:快速整理相似人像照片。
  • 证件核验:比如在远程认证场景中比对身份证照片与自拍照片。

第二步:项目初始化与配置

初始化与权限配置

在使用Face Comparator API前,我们需要确保项目的权限配置正确:

{
  "module": {
    "abilities": [
      {
        "name": "FaceComparatorAbility",
        "permissions": [
          "ohos.permission.INTERNET",
          "ohos.permission.READ_MEDIA",
          "ohos.permission.WRITE_MEDIA"
        ]
      }
    ]
  }
}

以上权限确保应用可以访问图库和网络资源。

在配置完成后,我会继续检查日志以确认权限被正确调用,确保服务能够初始化。


第三步:实现人脸比对功能

初始化Face Comparator服务

初始化服务是开发的第一步,以下代码展示了如何实现服务的初始化与释放:

import faceComparator from '@kit.CoreVisionKit';
async function initializeFaceComparator() {
    try {
        const isInitialized = await faceComparator.init();
        if (isInitialized) {
            console.info('人脸比对服务初始化成功');
        } else {
            console.error('人脸比对服务初始化失败');
        }
    } catch (error) {
        console.error('初始化过程中发生错误:', error);
    }
}
async function releaseFaceComparator() {
    try {
        await faceComparator.release();
        console.info('人脸比对服务已释放');
    } catch (error) {
        console.error('释放过程中发生错误:', error);
    }
}
initializeFaceComparator();

这一过程非常关键,因为初始化成功与否直接决定了后续比对操作的可靠性。服务的释放同样重要,可以避免资源浪费。

加载图片并比对人脸

人脸比对需要两张包含人脸的图片,以下代码展示了如何从图库加载图片并调用比对功能:

async function compareFaces(imageUri1: string, imageUri2: string) {
    try {
        const pixelMap1 = await loadPixelMap(imageUri1);
        const pixelMap2 = await loadPixelMap(imageUri2);
        const visionInfo1 = { pixelMap: pixelMap1 };
        const visionInfo2 = { pixelMap: pixelMap2 };
        const result = await faceComparator.compareFaces(visionInfo1, visionInfo2);
        console.info(`是否为同一人: ${result.isSamePerson}`);
        console.info(`相似度: ${(result.similarity * 100).toFixed(2)}%`);
        // 清理资源
        pixelMap1.release();
        pixelMap2.release();
    } catch (error) {
        console.error('人脸比对失败:', error);
    }
}
async function loadPixelMap(imageUri: string) {
    // 假设有工具库可以加载图像
    return await someImageLibrary.loadPixelMap(imageUri);
}

关于加载图像可以看我之前的文章~,或者查一下API,本身并不难。

错误处理

在开发过程中,遇到的常见错误包括:

  • 图片中缺少人脸
  • 图片格式不支持
  • 比对超时

这些问题可以通过增强日志和用户提示来解决。例如,提供清晰的错误信息并指导用户上传合适的图片。


第四步:构建用户界面

以下代码展示了一个简单的人脸比对应用界面,支持图片选择与结果展示:

import { View, Text, Button, Image } from '@ohos.arkui';
export default View.create({
    build() {
        return (
            {
                type: "flex",
                flexDirection: "column",
                children: [
                    {
                        type: Text,
                        content: "人脸比对应用",
                        style: { height: "50vp", fontSize: "20vp", textAlign: "center" },
                    },
                    {
                        type: Button,
                        content: "选择图片1",
                        style: { height: "50vp", marginTop: "20vp" },
                        onClick: this.onSelectImage1,
                    },
                    {
                        type: Button,
                        content: "选择图片2",
                        style: { height: "50vp", marginTop: "10vp" },
                        onClick: this.onSelectImage2,
                    },
                    {
                        type: Button,
                        content: "开始比对",
                        style: { height: "50vp", marginTop: "10vp" },
                        onClick: this.onCompareFaces,
                    },
                ],
            }
        );
    },
    onSelectImage1() {
        // 模拟选择图片1
        this.imageUri1 = '/data/media/sample_image1.jpg';
        console.info('图片1已选择:', this.imageUri1);
    },
    onSelectImage2() {
        // 模拟选择图片2
        this.imageUri2 = '/data/media/sample_image2.jpg';
        console.info('图片2已选择:', this.imageUri2);
    },
    async onCompareFaces() {
        try {
            const pixelMap1 = await loadPixelMap(this.imageUri1);
            const pixelMap2 = await loadPixelMap(this.imageUri2);
            const visionInfo1 = { pixelMap: pixelMap1 };
            const visionInfo2 = { pixelMap: pixelMap2 };
            const result = await faceComparator.compareFaces(visionInfo1, visionInfo2);
            console.info(`是否为同一人: ${result.isSamePerson}`);
            console.info(`相似度: ${(result.similarity * 100).toFixed(2)}%`);
            // 清理资源
            pixelMap1.release();
            pixelMap2.release();
        } catch (error) {
            console.error('人脸比对失败:', error);
        }
    },
});

第五步:性能优化与功能扩展

性能优化

通过调整参数可以优化比对性能,例如限制图片分辨率,减少不必要的计算。

const configuration = { enableHighPrecision: false };
const result = await faceComparator.compareFaces(visionInfo1, visionInfo2, configuration);

在实际应用中,我还建议对图片进行预处理,例如裁剪人脸区域或调整图片大小,以进一步提高比对效率。

功能扩展

  • 实时比对:结合相机模块,实时分析两张图片是否为同一人。
  • 结果可视化:在界面上展示比对结果和置信度。
  • 批量比对:支持一次比对多张照片,快速分类图库。
  • 增强互动性:结合语音助手实现语音指令触发比对功能。
  • 隐私保护:在比对结果中对敏感信息进行模糊处理,确保数据安全。

最后的小总结

整完了这个API,我发现还真是挺有意思的。毕竟目前这个算是比较新的AI API,可以去做很多新鲜的事,当然这不仅是一项技术创新,更是一种赋能开发者的方式,让我们能够轻松构建智能化、人性化的应用。


未来,我计划将这一技术融入更复杂的场景,如照片管理和个性化服务。此外,还可以探索如何将人脸比对与其他AI能力结合,开发更加智能的综合解决方案。如果你也对人脸比对感兴趣,不妨从简单的比对功能开始,逐步实现自己的创意!


当然如果你也在这一领域研究,不妨关注我,我们一起进步~!

目录
相关文章
|
3天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
对话 | ECS如何构筑企业上云的第一道安全防线
|
11天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
179614 22
|
20天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
9592 28
|
6天前
|
机器学习/深度学习 分布式计算 供应链
阿里云先知安全沙龙(上海站) ——大模型基础设施安全攻防
大模型基础设施的安全攻防体系涵盖恶意输入防御和基础设施安全,包括框架、三方库、插件、平台、模型和系统安全。关键漏洞如CVE-2023-6019(Ray框架命令注入)、CVE-2024-5480(PyTorch分布式RPC)及llama.cpp中的多个漏洞,强调了代码安全性的重要性。模型文件安全方面,需防范pickle反序列化等风险,建议使用Safetensors格式。相关实践包括构建供应链漏洞库、智能化漏洞分析和深度检测,确保全方位防护。
|
4天前
|
存储 缓存 运维
阿里云先知安全沙龙(上海站)——后渗透阶段主机关键信息自动化狩猎的实现与应用
本文介绍了在后渗透测试中使用LSTAR工具和PowerShell脚本进行RDP状态查询、端口获取及凭据收集的过程,强调了高强度实战场景下的OPSEC需求。通过MITRE ATT&CK框架的应用,详细阐述了凭证访问、发现和收集等关键技术,确保攻击者能够隐蔽、持续且高效地渗透目标系统,最终获取核心数据或控制权。文中还展示了SharpHunter等工具的自动化实现,进一步提升了操作的安全性和效率。
|
4天前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
|
24天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
5185 15
资料合集|Flink Forward Asia 2024 上海站
|
1月前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
16天前
|
Docker 容器
|
5天前
|
监控 NoSQL Java
若依RuoYi项目环境搭建教程(RuoYi-Vue + RuoYi-Vue3版本)
若依(RuoYi)是一款基于Spring Boot和Vue.js的开源Java快速开发脚手架,支持OAuth2、JWT鉴权,集成多种安全框架和持久化框架。它提供了系统管理、监控管理、任务调度、代码生成等常用功能模块,适合中小型公司快速搭建Web应用。本文主要介绍若依框架的特点、版本发展、优缺点及项目部署步骤,帮助开发者快速上手并部署若依项目。
若依RuoYi项目环境搭建教程(RuoYi-Vue + RuoYi-Vue3版本)