iLoveDXF

图片和 PDF 转文字 (OCR)

在浏览器中从扫描的图片和 PDF 提取可编辑文字。选择语言,识别文字,然后下载为 TXT、Word、Excel 或可搜索 PDF。

将图片或 PDF 拖放到这里

JPG、PNG、WEBP、BMP、TIFF 或 PDF — 在浏览器本地识别。

浏览器本地 OCR

识别的文字

它能做什么

在浏览器本地从图片和 PDF 提取文字
16+ 种识别语言,包括英语、土耳其语、阿拉伯语和中文
导出为文本、Word、Excel 或可搜索 PDF

最佳实践

  • - 使用清晰、高对比度的扫描件;更清晰的输入意味着更准确的文字。
  • - 选择与文档匹配的语言以获得最佳识别效果。
  • - 对于表格,Excel 导出会在大间隙处分列——请检查。

限制

  • - 准确度取决于扫描质量;手写体不能可靠识别。
  • - 由于 OCR 在浏览器中运行,超大或多页文件耗时更长。
  • - 版式会被简化;复杂的多栏页面可能需要整理。

实用流程

数字化扫描文档

问题
扫描页面或文档照片需要变成可编辑文字。
操作
上传图片,选择语言,识别文字,然后下载 Word 文件。
预期输出
你得到可在任意文字处理器中粘贴或编辑的文字。

让 PDF 可搜索

问题
扫描的 PDF 没有可选文字,无法搜索。
操作
上传 PDF,运行 OCR,下载可搜索 PDF。
预期输出
原始页面现在带有可搜索和复制的隐藏文字层。

常见问题

会上传我的图片或 PDF 吗?

不会。OCR 使用 Tesseract 在你的浏览器本地运行。只从 CDN 下载语言模型;你的文件保留在设备上。

支持哪些输出格式?

文本 (.txt)、Word (.docx)、Excel (.xlsx),以及保留原始图片并带隐藏文字层的可搜索 PDF。

能识别哪些语言?

16+ 种语言,包括英语、土耳其语、西班牙语、德语、法语、意大利语、葡萄牙语、俄语、阿拉伯语、中文、日语等。