
据中国后生网,近日,百度矜重发布PaddleOCR-VL-1.6。当作文心繁衍模子,PaddleOCR-VL-1.6在OmniDocBenchv1.6巨擘评测中准确率冲破96.33%,在Real5-OmniDocBench、OmniDocBenchv1.5上也获取了最当先的分数,概括性能公共第一,刷新业界SOTA,在复随笔档领路和真实场景瓦解才气方面进一步冲破。

在OmniDocBenchv1.6上,PaddleOCR-VL-1.6在多项才气中终了SOTA
在巨擘评测集OmniDocBenchv1.6上,PaddleOCR-VL-1.6总标的达到96.33%,卓绝Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR等,概括性能公共第一,领跑公共通用大模子和专用OCR模子;在面向真实复杂场景构建的Real5-OmniDocBench评测中,米兰体育(MilanSports)官网PaddleOCR-VL-1.6总标的达到93.19%,较Gemini-3-Pro进步近4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及歪斜文档等五大真实场景下均保执当先阐发。
测试成果显露,PaddleOCR-VL-1.6在文本、公式、表格等中枢识别才气上全面当先刻下主流开源及闭源有想象,在表格、古籍、陌生字识别等复杂场景才气显赫进步,在钤记、Spotting、图表识别等多项要津才气同步增强,可更好霸道文档数字化的需求。

据了解,2026世界杯即时比分PaddleOCR基于文心大模子考试而来,是文心大模子多模态才气的进犯部分,解救超100种话语识别,用户遮蔽170多个国度和地区。这次发布的PaddleOCR-VL-1.6在PaddleOCR-VL-1.5基础上进一步升级,通过模子运转的数据构建机制和渐进式考试优化,在保执0.9B轻量化架构的情况下,模子准确率和复杂场景适应才气进一步进步。由于两代模子结构一致,缔造者和企业用户无需进行特地适配,即可平滑迁徙。
频年来,PaddleOCR执续鼓励文档领路才气升级,先后推出PaddleOCR-VL、PaddleOCR-VL-1.5等多款模子。其中,PaddleOCR-VL-1.5更正解救异形框定位,在真实文档场景中展现出较强瓦解才气。此前,PaddleOCRGitHubStar数已冲破79.2K,越过谷歌开源OCR面貌TesseractOCR,成为公共最受缔造者迎接的开源OCR面貌之一。
现在,PaddleOCR-VL-1.6已上线PaddleOCR官网,解救网页端和API调用。同期,模子代码及权重已同步开源至GitHub和HuggingFace,面向公共缔造者盛开使用。
米兰体育2026世界杯指定中国官网审核:十月2026世界杯赔率