超越文本，GPT-4在虹膜生物识别的创新应用

Aceryt

发布于 2024-9-2 10:34

浏览

0收藏

虹膜识别作为识别人类身份的特殊验证方法，已经在门禁监控、在线支付、飞机场等广泛应用。但在应用的过程中也面临一些挑战。例如，佩戴眼镜、隐形眼镜或是虹膜受到部分遮挡等情况可能会干扰虹膜图像的采集，进而影响识别的准确性。

美国密歇根州立大学的研究人员对GPT-4的虹膜识别能力进行了一系列评估，使用了零样本学习方法，在各种挑战条件下对模型进行综合测试，包括不同的数据集、呈现攻击、眼镜遮挡等。

结果显示，GPT-4对虹膜的识别能力非常优秀，同时在软生物识别方面也很强，例如，通过观察虹膜特征，能判断出使用睫毛膏人的性别等相关识别信息。

超越文本，GPT-4在虹膜生物识别的创新应用-AI.x社区

研究人员通过利用Python与GPT-4的API设计了实验参数和提示。这种方法允许以一致、可复制的方式与模型进行交互，同时能够根据不同实验的需求轻松调整参数。

在初步实验中，研究人员从 ND - Iris - 0405 和 IIT - Delhi - Iris 数据集中选取了两个明显不同的虹膜图像，让 GPT - 4 判断它们是否属于同一个人。

起初，系统因伦理考虑而拒绝进行生物识别分析，但通过调整提示，明确查询的非生物识别性质并寻求GPT 的意见，GPT - 4 成功参与了任务，并提供了关于虹膜特征和组件的详细解释，认为图像可能代表不同的身份。

超越文本，GPT-4在虹膜生物识别的创新应用-AI.x社区

随后增加了实验的难度，研究人员从 CASIA - Iris - Intervalv3数据集中精心挑选了更为相似的图像，这些图像在虹膜的纹理、颜色和形态等特征上的差异极其细微，几乎达到了肉眼难以分辨的程度。

同时还特意引入了高斯噪声，这是一种在图像处理中常见的随机噪声，它会使图像的像素值发生随机的波动，从而严重干扰虹膜图像的清晰度和准确性。

超越文本，GPT-4在虹膜生物识别的创新应用-AI.x社区

GPT - 4通过对虹膜特征的精细建模和对噪声的有效过滤，依然能够分析虹膜纹理的细微变化、颜色的微妙差异以及形态的微小改动，精准判断出这些图像是否属于同一个虹膜。

在相似性测试实验中，通过让GPT - 4 对虹膜图像进行概率评估并给出相似性评分（0 - 100）和 “是” 或 “否” 的判断，研究发现尽管眼镜可能会遮挡虹膜，但 GPT - 4 能够准确预测匹配，展示了其先进的视觉处理技能和对实际应用中变化和障碍的应对能力。

超越文本，GPT-4在虹膜生物识别的创新应用-AI.x社区

在 PA 检测实验中，GPT - 4 能够检测到通过死后虹膜图像和带纹理的隐形眼镜试图绕过生物识别系统的行为。例如，在使用 Warsaw - vl 死后虹膜数据集的实验中，GPT - 4 怀疑其中一个图像是人工伪造的，因为其清晰度非常不自然。

超越文本，GPT-4在虹膜生物识别的创新应用-AI.x社区

在跨模态匹配实验中，最初 GPT - 4 在匹配虹膜图像与面部照片时遇到点困难，但通过将任务重新描述为谜题，并使用眼睛代替虹膜以及引入明显不同的眼睛颜色时，模型的匹配准确性得到了显著提高。当图像数量增加到 12 和 20 时，GPT - 4 能够始终正确识别匹配，证实了其在该任务中的稳健性。

此外，研究人员还对谷歌的Gemini 进行了实验。与GPT - 4 能够同时处理多个图像不同，Gemini 一次只能处理一个图像，这需要使用外部工具将图像组合成一个文件进行分析，增加了实验的复杂性并降低了效率。

论文地址：https://arxiv.org/abs/2408.04868

尽管 Gemini 在某些情况下能够提供准确的响应，但它在保持查询间的上下文连续性方面存在显著局限性，与 ChatGPT - 4 相比，在图像理解和生物识别验证任务中的 Sophistication和 Userfriendliness 方面还有差距。

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/Btmx2omlueRf0pUwY9VEjQ

标签

谷歌

模型

相关推荐

港中文深圳提出ALLaVA-4V：百万级别的开源多模态GPT-4V数据集

kcoufee • 2735浏览 • 0回复
长文本之罪：Claude团队新越狱技术，Llama 2到GPT-4无一幸免

轻薄滴假象 • 3574浏览 • 0回复
超越GPT-4！最强大模型 Claude 3 完全解读

开发者阿橙 • 6534浏览 • 0回复
GPT-4 Turbo更新：视觉能力+无限制使用

echo_ning • 4313浏览 • 0回复
苹果推出理解、转化模型ReALM，性能超GPT-4

Aceryt • 3094浏览 • 0回复
使用LLMLingua-2压缩GPT-4和Claude提示

51CTO内容精选 • 2781浏览 • 0回复
超越GPT-4！腾讯AI新研究打破长文本生成模型限制，序列并行技术再突破

AI论文解读 • 6399浏览 • 0回复
OpenAI开源GPT-4 SAE，提供1600万个解释模式

Aceryt • 4333浏览 • 0回复
GPT-4系列模型，在文档理解中的多维度评测

Aceryt • 2526浏览 • 0回复
超越CVPR 2024方法，DynRefer在区域级多模态识别任务上，多项SOTA

轻薄滴假象 • 2427浏览 • 0回复
如何通过压缩提示降低GPT-4的成本

51CTO内容精选 • 2947浏览 • 0回复
超越GPT-4！香港科技大学破解Transformer算术难题，乘法准确率超99.9%

AI论文解读 • 2700浏览 • 0回复
超越GPT-4！LoRA技术引领大型语言模型新革命

AI论文解读 • 3352浏览 • 0回复
自然（Nature）科学数据子刊：用于对话情境中情绪识别的 EEG-音频-视频数据集的创新应用

xuxiangda • 6260浏览 • 0回复
GPT-4和GPT-4V能否像人类一样进行抽象推理

lintoms • 2199浏览 • 0回复
视觉文本语音强强联合！南大&腾讯优图发布GPT-4o级别的实时视觉语音交互——VITA1.5

angel • 2728浏览 • 0回复
基于 LlamaFactory 微调大模型的实体识别的评估实现

AI悠闲区 • 2644浏览 • 0回复
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o

Halo咯咯 • 1.2w浏览 • 0回复
不用魔法，直接访问微软 Copilot GPT-4

丢翅膀的鱼 • 1601浏览 • 0回复

Aceryt

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

超越文本，GPT-4在虹膜生物识别的创新应用

目录