无限扫描、AI鉴伪 合合信息在WAIC展示核心技术

查股网  2025-07-26 21:32  合合信息(688615)个股分析

IT时报记者 林斐

随着多模态大模型成为人工智能发展的主流方向,高质量、多样化的训练语料对模型性能起到关键作用。

在2025年世界人工智能大会上,合合信息首次展示“无限扫描”“AI鉴伪”等多项创新技术,致力于解决多模态大模型在图像、视频语料处理中面临的清晰度及信息伪造问题,为大模型高效、安全发展提供了新的解决思路。

文保数字化:AI扫描技术构建“掌上”博物世界

气候变化、自然灾害等客观因素给文化遗产保护带来挑战,尤其是壁画、石刻等大尺寸文物,因数量多、体型大、难以移动,专业团队往往难以及时开展保护工作。

本次大会上,扫描全能王推出以“大尺寸扫描”功能为核心的“无限扫描”创新技术,展示了如何通过AI对巨型画作进行高清扫描和无痕拼接,让《坤舆万国全图》等古老文物的信息更易被“读取”。

据扫描全能王技术团队介绍,该技术基于智能高清及AIGC图像增强算法,结合创新性的AI图像拼接技术,提升了图像内容理解能力及场景化处理能力,突破了时序、空间距离、拍摄环境、设备的限制,解决了极端场景扫描中“内容清晰、图片完整、颜色还原”难以兼顾的问题。AI可对拍摄视频进行分析,挑选最佳“拼图碎片”,并智能优化碎片中的畸变、色差、模糊等问题,最终形成高清完整的图像。

在实际操作中,“无限扫描”既能实现4米宽极大尺寸图像的无痕高清拼接,也能完成4厘米长极小图像的细节还原,可帮助工程师、设计师、学术研究人员解决大型工程图纸高清扫描、地图测绘制作等专业文档处理问题,践行“无限扫描”的应用目标。

《坤舆万国全图》是南京博物院的重要藏品之一,现场展示的版本原件成图于1608年,长3.85米,宽1.71米,是国内现存最早、最完整、内容最丰富的中文世界地图。大会现场,扫描全能王展示的“无限扫描”技术为业内首创,观众通过上下、左右滑动拍摄视频,AI可消除大尺寸文档图像拼接中常见的错位、细节模糊、色彩失真等问题,对局部视频进行“智能拼图”,使地图中的山川湖海、游记、动物图案等内容清晰呈现在手机中。

基于对高清大图的理解,扫描全能王还能智能识别《坤舆万国全图》中的山河疆域等元素,观众点击指定区域即可了解400多年前人们对世界的认知,实现“让文物说话,让历史发声”的数字化体验。

扫描全能王“无限扫描”对《坤舆万国全图》进行图像拼接

大会上,扫描全能王还展示了对明代画家仇英作品《汉宫春晓图》的拼接效果。该画卷长度超5米,被誉为中国“重彩仕女第一长卷”。因现场平铺放置,拍摄者难以通过后退获得完整画面,而借助“无限扫描”技术,观众仅需移动手机,就能完整记录高清长卷,清晰观察古人浇花、观鸟、闲聊等细节。

扫描全能王“无限扫描”对《汉宫春晓图》进行图像拼接

扫描全能王技术团队表示,“无限扫描”技术主要通过AI扫描解决大型图片扫描或拍摄中“清晰与完整难以兼顾”的问题。大图拍摄常用的广角镜头易产生图像畸变,全景相机等应用仅支持单行、单向拍摄,中途无法回溯或调整;平移拍摄时,位置一旦偏移,前后扫描的两帧图像就难以精准对齐,误差逐帧累积,画面越长,错位越明显。

为兼顾图像全局和清晰度,扫描全能王在拍摄环节创新采用“多行、多列视频拍摄”形式,通过非时序智能拼接,解决了传统拼接技术中图像“越拼越歪”的问题。

具体实践中,基于AI算法,“无限扫描”技术可批量计算多张局部图像的特征和匹配点,在智能对齐基础上矫正局部图像的透视变换关系。即使拍摄中出现轻微手抖、角度倾斜等问题,该技术也能在全局理解所有“碎片”内容和联系后,实现每块“拼图”的精准复位。

为保证拼接后成像质量,扫描全能王应用AI智能高清算法,通过分区优化,动态将图像分割为多个子区域处理。针对子区域光影分布的差异化,该算法能精准分析并均衡化光影问题,消除直接拼接导致的色块不均,确保整张图像清晰度提升、光影过渡自然。

全景相机(左)和扫描全能王“无限扫描”(右)拼接效果局部清晰度对比图

大会现场,扫描全能王的智能高清滤镜功能受到关注,该功能可一键去除文档图像中的阴影、褶皱、水渍、脏污等十余种干扰因素,清晰再现文化与艺术中的细节。

在“智能高清滤镜”展区,4厘米宽、拇指大小的《星空》《向日葵》微缩油画静静陈列,借助AI扫描技术,原本肉眼难辨的图案变得清晰可辨。文明既存在于宏大历史画卷中,也沉淀在方寸之间,当AI扫描技术能在极大与极小尺度间灵活应用,人们既能在巨幅长卷中纵览文明气象,也能在细微之处细察历史痕迹。

被誉为“东方药物巨典”的《本草纲目》,至今仍是中医药现代化研究的重要宝库。现场展示中,泛黄的草药图谱经智能高清滤镜处理后,草药的叶脉纹理、根须走向清晰可见。AI扫描技术不仅实现了古籍的数字化保存,更让“辨药识性”的传统智慧以图像形式得以传承。

扫描全能王“智能高清滤镜”对《本草纲目》草药图谱进行图像优化处理

非遗文化是代代相传的技艺与记忆,甲马版画是云南省传统民俗文化。大会现场,用户可扫描基于现代理念创作的甲马版画艺术品,通过AI将“过关大神”“好人相逢”等承载美好祝愿的文化符号保存到手机中。

扫描全能王“智能高清滤镜”还原版画色彩

AI鉴伪技术:识别多模态信息中的伪造痕迹

从PS图像处理软件到大模型生成,人工智能让图像、视频等内容的生成手段愈发简便,也使篡改形式更隐蔽、载体更多样。2022年,合合信息率先推出PS篡改检测技术;面对持续升级的AI安全挑战,合合信息不断迭代AI鉴伪技术,实现了从静态图像到多模态信息鉴伪的技术跨越。

本次世界人工智能大会上,合合信息展示了AI鉴伪技术在人脸视频、AIGC生成图像、证件票据等AI伪造“高发领域”的应用,帮助公众了解AI如何通过视觉特征判断、图像合理性分析、多维度交叉验证,精准识别多模态语料数据中的伪造痕迹,为大模型安全、可信发展筑牢“净化防线”。

在合合信息AI安全展台互动区,观众体验“真假人脸”鉴别。站在屏幕前扫描面部,系统会实时生成“数字假面”;当真假人脸同屏对比时,不少观众发现AI伪造面容已能近乎完美地复刻真实人脸的表情纹路。展会互动装置中实时生成的“假脸”由当前主流伪造算法之一“ROOP算法”生成,而在合合信息AI人脸鉴伪模型的解析下,这些“假脸”能被精准识别。

据合合信息技术团队介绍,目前合成人脸的技术手段多样复杂,传统检测技术在应对新型人脸伪造算法时存在局限。针对不同人脸篡改形式,团队基于大规模数据训练,形成了多层次AI篡改检测方案。例如,应对人脸图像交换伪造,合合信息AI人脸鉴伪模型能捕捉人眼不可见的高级视觉差异,为每个像素标记真伪并计算伪造像素占比,对图像真伪概率进行“打分”;面对伪造算法直接生成的复杂图像等更多变的情况,团队采用多种神经网络模型,聚焦图像特征实现多维度交叉验证,提升判断精准度。

合合信息AI人脸鉴伪模型对“换脸”视频进行精准检测

检测速度是实际应用场景的重要需求。目前制作一张“假脸”仅需几秒,诈骗团伙利用工具批量换脸,通过“规模化攻击”寻找“AI安全防御漏洞”,导致大量“数字假面”出现在社交平台、金融系统甚至公共安全领域。合合信息人脸鉴伪模型可对人脸视频实现毫秒级实时鉴定,大幅提升篡改检测效率,具备泛化能力强、检测准确率高的优势,在银行身份核验、远程开户、大额交易验证等泛金融场景具有广泛应用前景。

在合合信息AIGC图像鉴别技术展区,“世界名画版大家来找茬”活动吸引了众多关注。经大模型处理后,这些经典名画或添加新元素、或微调色彩,难以直接辨别真伪。近年来,随着大模型持续优化,AIGC图像中可观察的“失真细节”越来越少,而合合信息推出的AIGC图像鉴别技术,能通过大模型分析“不易察觉”的图像信息,识别生成式假图。

据悉,该技术具备鉴别范围广、抗攻击性强等优势,可应对实际场景中复杂多样的图片信息。在鉴别范围上,其能通过不同角度和层级的提示词,分析AI生成图像的视觉特征及透视关系、光影角度等合理性因素,结合图像频谱信息辅助判断,实现毫秒级鉴伪,可有效识别MidJourney、Stable Diffusion、StyleGAN和GPT 4O等主流模型生成的图片,测试样本集鉴定准确率超90%,适用于社交媒体内容治理、商业欺诈鉴定、保险理赔等多个场景。

此外,实际应用中被检测图像往往需经历压缩、缩放、裁剪及社交媒体传输等环节,图像质量降低会增加检测难度。合合信息AIGC图像鉴别技术具备较强抗攻击能力,能在上述干扰下精准捕捉图像异常特征。

在数字化时代,文档图像是日常生活中广泛使用的信息载体,也是易被篡改的电子媒介——借助简单工具,任何人都能轻松伪造证件、合同、发票等文档图像,这不仅给个人带来财产损失、隐私泄露等风险,也对企业构成长期性、系统性安全威胁。

TextIn通用篡改检测平台对身份证篡改痕迹进行定位

TextIn通用篡改检测平台采用自研深度神经网络技术,基于百万级数据训练,支持财务凭证、商场机打小票等篡改检测,以及身份证、护照、行驶证、驾驶证、港澳台证件等数十种常用卡证的篡改检测。该平台可在毫秒级时间内完成一次鉴定,适配场景下误检率低至千分之一,目前已应用于银行、保险、证券、零售、互联网等多个行业,有效解决企业及机构面临的检测文档数量庞大、造假形式多样、版式复杂等问题。