OCR模型对比

LeoSasion · 2025-10-21 13:23:42

以下表格内容源自第三方测评，由豆包生成风格样式。仅作参考！

模型名称	文字识别准确率	图片语义理解	推理效率	模型体积	PDF/Markdown 结构化能力	视觉编码优化	综合评分
DeepSeek-OCR	★★★★★	★★★★★	★★★★★	★★★★★ （≈3B）	★★★★★	★★★★★ （情境光学压缩）	5.0
PaddleOCR	★★★★	★★	★★★★	★★	★★	★★	3.1
Qwen3-VL	★★★★	★★★★★	★★★	★★★	★★★★	★★★★	4.1
InternVL-2.5	★★★★★	★★★★★	★★★★	★★★★ （≈26B）	★★★★★	★★★★★	4.5
olmOCR / MinerU	★★★★	★★★	★★★★	★★★	★★★	★★★	3.6

bowen007 · 2025-10-23 15:21:57

Qwen3-VL 主要是能NSFW是吧

li853343303 · 2025-11-7 19:57:52

支持qwen-VL

yangala · 2025-11-9 15:47:14

deepseek潜力无限