AI-大模型的可行性验证

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

李雪亮

2024-06-30

0 评论 3128 浏览 4 收藏

大模型作为当前的前沿技术，有着强大的计算能力和复杂的数据处理能力，但是，面对大规模数据和高复杂度任务，模型的可行性如何？本文希望为大家提供了一个全面的视角，揭示了AI大模型在理论和实践中的潜力。

随着信息技术的飞速发展，人工智能（AI）逐渐从科幻走向现实，成为驱动现代社会变革的核心力量。

AI大模型作为这一领域的前沿技术，凭借其强大的计算能力和复杂的数据处理能力，正引领着技术创新的潮流。

然而，面对大规模数据和高复杂度任务，这些模型的可行性和有效性究竟如何？

本文希望为大家提供了一个全面的视角，揭示了AI大模型在理论和实践中的潜力。

那么今天我们要做的是基于大模型进行证件过期，来进行实现思路构思和选型。

一、目标

基于身份证图片判断其是否过期。

二、OCR技术

OCR（Optical Character Recognition，光学字符识别）技术可以将各种票据、报刊、书籍、文稿及其他印刷品的文字通过扫描转化为图像信息，并利用文字识别技术将图像信息转化为可使用的文本。这项技术可以帮助我们从身份证图片中提取出有效的文字信息，用于后续的过期判断。

OCR:OCR技术是光学字符识别的缩写(Optical Character Recognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的文本的计算机输入技术—–扫描图片转文字。

第一步：数据集准备

数据集准备-日常生活中首先我们收集身边人员。

#手机内容：身份证、居住证等符合场景要求的身份信息：例如身份证、驾驶证、护照、居住证、港澳通行证等。

#收集数量：10-30张

“在收集到足够的数据后，接下来我们要进行数据汇总，以便后续的处理和分析。”

第二步：数据汇总

数据汇总方便我们后续对数据质量评价和应用，制作一个Excel表格，格式如下

首先我们可以将图片上传到云盘，获取图片链接。第二列为OCR结果复制粘贴

进去。

第三步：OCR提取

OCR 内容提取可行性验证，并不需要开发代码有界面，可操作交互的 OCR 产品即可腾讯 OCR：https://cloud.tencent.com/product/ocr

第四步：大预言模型能力提取所需的关键信息

OpenAI 的 platform 平台举例:https://platform.openai.com/playground?mode=chat可选择其他大语言模型，要求可以设置prompt，可以调整模型、参数。

注释：“Prompt工程是一种设计和改进AI提示的方法，以提高AI的表现。”

Prompt Engineering 是一种人工智能(AI)技术，它通过设计和改进 AI 的 prompt来提高 AI 的表现。Prompt Engineering的目标是创建高度有效和可控的 AI 系统，使其能够准确、可靠地执行特定任务。

因为人类的语言从根本上说是不精确的，目前机器还没法很好地理解人类说的话，所以才会出现 Prompt 工程这个技术。

·如果你是产品设计师，或者研发人员，你可以通过它来设计和改进AI系统的提示，从而提高AI系统的性能和准确性，为用户带来更好的AI体验。

第五步：迭代调优

输入OCR内容—查看结果—-调整Prompt—调整模型/参数—最后统一输出所有。

第六步：完善数据

把第三列输出结果补充进去，人工判断第四列是True正确还是False错误

第七步：整体效果评估

汇总样本统计：样本数20

1. 精确率：95%

2. 召回率：100

精确率：对预测结果为正的样本中实际正确的个数

召回率：实际正样本中有多少被预测了回来

例如：面前有很多只狗和猫，扔一只骨头出去希望狗能跑过来精确率就是所有跑回来的动物中有多少只是狗，10只跑回来，其中有8只狗，精确率80%在所有的动物中有20只狗，召回率就是8/20.

综上所述，通过《AI-大模型的可行性验证》，我们深入探讨了如何利用AI大模型和OCR技术来判断身份证是否过期。整个过程包括数据收集、OCR提取、模型应用及结果评估，展示了AI大模型在处理复杂数据任务中的优异表现。

在实际应用中，我们成功实现了高精度的身份证过期判断。在测试的20个样本中，我们达到了95%的精确率和100%的召回率，充分证明了AI大模型的潜力。例如，通过OCR技术，我们准确提取了身份证上的有效期信息，并通过大语言模型的分析，准确判断出身份证是否过期。

然而，在这个过程中也遇到了一些挑战。例如，部分OCR结果存在误识别问题，特别是在处理模糊或低质量图片时。此外，Prompt工程的设置和模型参数的调优也需要不断尝试和优化，以获得最佳的判断结果。面对这些挑战，我们通过不断迭代和改进，逐步提高了系统的准确性和可靠性。

尽管如此，我们仍需继续优化技术，解决在图像质量和识别准确性方面的不足，并加强对AI模型的道德审查和安全性测试。未来，随着技术的进一步发展，AI大模型有望在更多领域实现突破，带来更多创新和便利。

本文由 @李雪亮投稿发布于人人都是产品经理，未经许可，禁止转载。

题图来自 Unsplash，基于CC0协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

李雪亮

四场公众号

10篇作品 75013总阅读量

【用户标签设计】房产资源位使用为例提升曝光留资

08-311888 浏览

ChatGPT 来了，对产品经理有何影响

02-0713085 浏览

中国需要什么样的SaaS？

08-076483 浏览

从供需角度，洞察智能学习产品的策略和机会点

04-058227 浏览

从产品经理的角度，为淘宝做积分商城的设计

12-155154 浏览

目前还没评论，等你发挥！

专题

13509人已学习15篇文章

解构私域流量

私域流量是与公域流量相对的概念，本专题的文章主要通过几个核心的问题，为大家解读私域流量背后的底层逻辑。

专题

17002人已学习16篇文章

ERP系统设计指南

ERP是一种以系统化的方式，将企业内部所有的业务流程和数据进行整合和管理的软件系统。本专题的文章分享了ERP系统设计指南。

专题

13041人已学习12篇文章

产品经理如何挖掘数据？

数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中通过算法搜索隐藏于其中信息的过程。本专题的文章分享了如何挖掘数据。

专题

12295人已学习12篇文章

广告营销指南

广告营销是为了销售产品，既然花了钱当然希望能给产品的销量带来增长。本专题的文章分享了广告营销指南。

专题

16623人已学习16篇文章

界面设计方法

对于很多软件工程师来说，工作内容都与界面设计有很大的关联。本专题的文章分享了界面设计方法。

专题

15428人已学习10篇文章

APP广告投放指南

再好的产品，没有优质的推广渠道加持和App投放增长的方法，也很难实现有效传播和增长。本专题的文章分享了App投放推广指南。

网站统计