业界动态
【原】【CCIG技术论坛回顾】展望AI时代,把握文档图像智能分析与处理的未来
2025-01-02 19:13


2023年5月11~14日,中国图象图形大会(CCIG 2023)在苏州举办,谭铁牛院士、赵沁平院士、吴一戎院士、徐宗本院士、胡事民教授、高新波教授确定莅临CCIG 2023大会,并作大会主旨报告。

众多专家学者将齐聚苏州,开启“最强大脑”,为大家带来一场精彩的学术盛宴。大会以“图象图形向未来”为主题,汇集100余位国内顶尖学者以及知名企业专家、2000余名科研院校师生、一线技术工程师,共同探索图像图形技术行业的最新进展。

本篇文章就来回顾一下大会的内容及问题探讨,主要是针对智能图像处理技术进行展开。



大会开场一开始是由 中国科学院自动化研究所副所长——刘成林老师 介绍《人工智能大模型时代的文档识别与理解》。

文档领域分为物理文档和合成文档。过去我们只关注文字,现在文档中的图像也十分重要。

场景文本识别检测的现状。早期基于边缘、区域的方法比较有限,后基于深度学习的回归、分割的方法,场景文本检测的趋势由水平文本行到多方向文本行再到任意形状的文本检测。

1.识别理解技术

  • 手写文本识别:大数据训练得到高精度
  • 版面分析:深度学习(FCN+GNN)可解决大部分问题
  • 文件检测与识别:进步很快,手写识别已可实用
  • 新问题和技术:信息抽取、文档问答,预训练模型

2.不足

  • 可靠性、可解释性、自适应性
  • 复杂环境下性能:自然场景、古籍文档、拍照手写文档
  • 复杂问题:复杂版面、数学公式、表格、结构化符号/图形
    -语义理解能力:信息抽取,问题求解(推理,回答问题

ChatGPT, GPT-4等大模型的特点

  • 语言大模型:超强的语言联想能力,用于文本生成、代码生成、问答、翻译等
  • 多模态大模型:跨模态特征提取和对齐,跨模态生成,多模态问题回答

ChatGPT是一种基于人工智能技术的自然语言处理模型,它是由OpenAI公司开发的。它可以模拟人类的对话,并根据用户输入的问题进行回答。它使用了深度学习和自然语言处理技术,可以理解并生成自然语言。

ChatGPT的三个关键技术

  1. 情景学习(In-context learning
    大模型的涌现能力,改变传统学习范式。
  2. 思维链(Chain-of-Thought,CoT
    大模型的涌现能力,打破模型参数约束。
  3. 自然指令学习(Learning from Natural Instructions
    人在环路增强,对齐人类意图。

大模型的文档识别和理解能力目前已经是非常强了。

解物理题和文档摘要完全不在话下,未来我们的最强导师。

  1. 文档分析与识别快速进步,但仍有很大的研究空间
  2. 从提升性能角度
    · 文本识别可靠性、可解释性
    · 全要素识别、长尾问题、多语言
    · 复杂版面分割与理解,变形文档分析与识别
  3. 从应用扩展角度
    · 新的应用:凡有文字符号的场合,机器人流程自动化(RPA),很多细分行业
    · 新问题:语义信息提取,跨模态融合,面向应用的推理决策等
  4. 从学习能力角度
    · 小样本学习,迁移学习,多任务学习,领域自适应,结构化预测,弱监督学习,自监督学习,开放集(零样本、增量学习

这部分内容在之前的文章中也有介绍过


对此部分感兴趣的小伙伴也可以看一下直播回放和查阅更多资料,这部分不多作讲解,主要还是针对图像文档处理技术展开啦~


本部分内容由上海合合信息科技股份有限公司高级工程师——丁凯老师讲解,主题内容为《智能文档处理技术在工业界的应用与挑战》。

合合科技在文档图像的分析与预处理、手写板反光擦除及文档图像篡改检测都是业界标杆级的存在。

图像处理技术 是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。

其中图像一般有两种表达形式

  1. 几何图形(Graphics) :由点、线、面、颜色等组成,由绘图程序产生,是一系列绘图指令的集合,一般用各种绘图软件制作。
  2. 点阵图像(Image) :由各像素点和颜色组合而成,使用摄像机、扫描仪、数码相机等设备获得,也可以使用绘图软件生成。图像表示的画面细腻,层次和色彩丰富。图像的各像素点逐点存储在计算机中,占用的存储空间大。

目前对于图像的处理技术包括 、、 和 四种方法。

  1. 点处理方法 是处理图像最基本的方法,由于该方法处理的对象是像素,故此得名。点处理方法简单而有效,主要用于图像的亮度调整、图像对比度的调整,以及图像亮度的反置处理等。
  2. 图像的 组处理方法 处理的范围比点处理大,处理的对象是一组像素,因此又叫“区处理或块处理”。组处理方法在图像上的应用主要表现在:检测图像边缘并增强边缘、图像柔化和锐化、增加和减少图像随机噪声等。
  3. 图像的几何处理方法 是指经过运算,改变图像的像素位置和排列顺序,从而实现图像的放大与缩小、图像旋转、图像镜像、以及图像平移等效果的处理过程。
  4. 图像的 帧处理方法 是指将一幅以上的图像以某种特定的形式合成在一起,形成新的图像。其中,特定的形式是指:经过“逻辑与”运算进行图像的合成、按照“逻辑或”运算关系合成、以“异或”逻辑运算关系进行合成、图像按照相加或者相减以及有条件的复合算法进行合成、图像覆盖或取平均值进行合成。图像处理软件通常具有图像的帧处理功能,并且以多种特定的形式合成图像。

文档图像篡改检测也可以简单理解成PS检测, 说简单一点就是一项可以检测照片有没有被PS修改过的一个功能。

在日常生活中某些信息可能会存在造假现象,尤其是对于一些证件类的图片等信息,有些人可能会使用PS等工具对图片中的一些关键信息进行一些PS修改,以此达到一些其他目的。

Adobe 在2018 CVPR上发表了一篇利用深度神经网络检测PS痕迹的论文Learning Rich Features for Image Manipulation Detection

PS痕迹检测,沿用物体检测套路,直接上faster rcnn,ground-truth就是p上去的区域。论文创新点就是,除了使用传统RGB图像作为网络输入外,还让RGB图像过一遍SRM filter,得到noise feature,让这个noise feature也作为网络的输入。注意,RGB和noise走的分别是两个faster rcnn网络,但只使用RGB网络训练RPN,用这个RPN,对两个网络的feature map做RoI pooling。在分别得到RGB和noise的RoI之后,对这两个RoI做Bilinear pooling,得到feature进分类器。而RGB的RoI则做bounding box回归。

随着AIGC的发展,视觉内容的安全问题与文档图像的安全问题十分值得关注。

关于文档图像处理的内容也可以参考下面的文章
黑科技解读 之 PS检测、弯曲拉平、切边增强、摩尔纹


现在AI技术的进步能力已经呈现指数型增长了,所以在这个时代,如何乘上AI这趟列车是个关键。

在AI时代下,通过合理利用人工智能和大数据技术,可以有效地解决文档图像的安全问题,并将其应用于实际场景中,提高文档管理的效率和安全性。

还是要时刻惊醒自己要与时俱进,多多学习新的技术与理念,不要做被时代丢下的弃子。

    以上就是本篇文章【【原】【CCIG技术论坛回顾】展望AI时代,把握文档图像智能分析与处理的未来】的全部内容了,欢迎阅览 ! 文章地址:https://sicmodule.kub2b.com/news/14814.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 https://sicmodule.kub2b.com/mobile/ , 查看更多   
最新文章
曲面屏有哪些手机曲面屏手机「曲面屏有哪些手机」
曲面屏手机以其独特的外观设计和出色的用户体验,近年来在手机市场上备受瞩目。这种屏幕表面带有一定弧度的设计,不仅赋予手机时
1小时手机快修(1小时手机快修可靠吗)
  《一小时手机快修:科技时代的高效解决方案》  随着科技的飞速发展,智能手机已经渗透到我们生活的方方面面。然而,当手机
手机单扬声器和双扬声器有什么区别?原来差别这么大手机扬声器「手机单扬声器和双扬声器有什么区别?原来差别这么大」
随着手机的普及和发展,音频体验成为消费者选择手机的重要因素之一。而在手机音频方面,单扬声器和双扬声器是常见的设计方案。那
手机维修知识大全维修手机「手机维修知识大全」
修理手机维修知识大全手机是高科技精密电子产品。工作原理、制造工艺、软件和硬件、测试、技术标准在所有的电器设备中是最复杂的
2k分辨率手机有哪些(2k分辨率的手机哪款性价比最高)
  关于《2K分辨率手机有哪些》的文章  随着科技的不断发展,手机已经成为了我们日常生活中不可或缺的一部分。而在手机的各种
红手指云手机苹果版(红雀浏览器) v1.0.23 iPhone版红手指云手机「红手指云手机苹果版(红雀浏览器) v1.0.23 iPhone版」
红手指手游专用虚拟手机是一款非常实用的手机挂机软件,在这里玩家随时随地离线挂机、自动帮助你闯关升级,非常强大的游戏挂机神
1手机2(一加11手机)
  《手机2》:探索科技与生活的无限可能  在当今数字化时代,智能手机无疑是我们生活中不可或缺的一部分。随着科技的飞速发
手机NFC是什么?怎么使用?手机nfc「手机NFC是什么?怎么使用?」
但很多人不知道的是,除了这三种无线通信技术外,很多智能手机里还有一种无线通信技术,那就是NFC。2004年,飞利浦半导体,诺基
360手机 官网(360手机官网入口)
  探索《360手机官网》:一站式手机技术与服务的平台  在当今数字化时代,手机已经成为我们日常生活中不可或缺的一部分。而
关于手机电池的冷知识:机身温度过高,会永久降低手机电池容量手机电量「关于手机电池的冷知识:机身温度过高,会永久降低手机电池容量」
相信大家在日常使用手机时,最关注的就是我们手机的电量还剩多少,尤其是现在我们一般出门都不带现金,直接通过手机进行支付,所