🧐GOT-OCR2.0 是一个开源项目,旨在通过统一的端到端模型实现OCR-2.0,提供了用于文本和格式化文本OCR的多种工具和脚本,并支持多页和多裁剪的OCR处理,适用于广泛的应用场景。

➡️链接:https://github.com/Ucas-HaoranWei/GOT-OCR2.0

重点 ●📚 通用OCR理论:GOT-OCR2.0基于最新的OCR-2.0模型,旨在通过一个统一的端到端模型来处理多种OCR任务,包括文本识别、格式化文本识别和细粒度OCR。

🛠 功能与演示:项目提供了详细的安装和使用指南,包括如何在多种环境下运行模型,如Huggingface和Google Drive上的模型权重,以及提供了各种OCR处理的示例代码。

📊 训练与评估:该项目支持后期训练和评估,包括使用不同的数据集和基准测试进行模型的性能评估,特别适合科研和开发人员使用。

🔗 社区贡献:项目鼓励社区参与开发,并已发布多个由社区贡献的工具和示例,包括Colab演示和CPU版本的GOT-OCR。 GitHub - Ucas-HaoranWei/GOT-OCR2.0: Official code implementation of General OCR Theory:  Towards OCR-2.0 via a Unified End-to-end…
 
 
Back to Top