本文介绍了智谱AI发布的开源OCR模型GLM-OCR。该模型以“小尺寸、高精度”为特点,在性能上达到SOTA水平,并支持多种复杂文档场景,如手写体、复杂表格、代码文档等。 重要亮点 1.性能SOTA:在OmniDocBench V1.5等基准测试中取得SOTA性能,参数量仅0.9B。 2.场景优化:在手写体、复杂表格、代码文档等高难场景中表现稳健。 3.推理高效:支持vLLM、SGLang和Ollama部署,降低推理延迟与算力开销。 4.开源易用:同步开源完整SDK与推理工具链,支持一行命令快速调用。 5.应用广泛:可应用于教育、科研、办公、金融、物流等多个领域。








