OCR+LLM等于纸质文件自动扫描得到markdown!
GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。
✨重点
●🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。
➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr
GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。
✨重点
●🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。
➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr