OCR+LLM等于纸质文件自动扫描得到markdown!

GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。

重点
🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。

➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr GitHub - Dicklesworthstone/llm_aided_ocr: Enhance Tesseract OCR output for scanned PDFs by applying Large Language Model (LLM)…
 
 
Back to Top