|
|
以下表格内容源自第三方测评,由豆包生成风格样式。仅作参考!
| 模型名称 | 文字识别准确率 | 图片语义理解 | 推理效率 | 模型体积 | PDF/Markdown 结构化能力 | 视觉编码优化 | 综合评分 |
|---|
| DeepSeek-OCR | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★★ (≈3B) | ★★★★★ | ★★★★★ (情境光学压缩) | 5.0 | | PaddleOCR | ★★★★ | ★★ | ★★★★ | ★★ | ★★ | ★★ | 3.1 | | Qwen3-VL | ★★★★ | ★★★★★ | ★★★ | ★★★ | ★★★★ | ★★★★ | 4.1 | | InternVL-2.5 | ★★★★★ | ★★★★★ | ★★★★ | ★★★★ (≈26B) | ★★★★★ | ★★★★★ | 4.5 | | olmOCR / MinerU | ★★★★ | ★★★ | ★★★★ | ★★★ | ★★★ | ★★★ | 3.6 |
-
|
|