OCR+LLM等于纸质文件自动扫描得到markdown！GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型（LLM）增强扫描PDF的Tesseract OCR输出🧐这个项目结合了光学字符识别（OCR）和大型语言模型（LLM），通过LLM的纠错功能，大大提升了OCR文本的准确性和可读性，适用于处理扫描的PDF文件

OCR+LLM等于纸质文件自动扫描得到markdown！

GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型（LLM）增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别（OCR）和大型语言模型（LLM），通过LLM的纠错功能，大大提升了OCR文本的准确性和可读性，适用于处理扫描的PDF文件。

✨重点
●🔍 项目使用Tesseract进行OCR处理，并通过LLM对输出的文本进行错误修正，确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM（如OpenAI和Anthropic），并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本，并提供详细的日志记录和质量评估功能，方便跟踪和调试。

➡️链接：https://github.com/Dicklesworthstone/llm_aided_ocr

GitHub

GitHub - Dicklesworthstone/llm_aided_ocr: Enhances Tesseract OCR output using LLMs (local or API) for error correction, smart chunking…

Enhances Tesseract OCR output using LLMs (local or API) for error correction, smart chunking, and markdown formatting of scanned PDFs - Dicklesworthstone/llm_aided_ocr