面向效率办公的工具集合
适合会议、任务和运营整理的实用工具,帮助团队减少重复工作并保持推进节奏。
PDF 转 Markdown
基于 Docling 把标准 PDF 转成结构更清晰的 Markdown。
扫描 PDF 转 Markdown
对扫描版 PDF 运行 OCR,并输出更适合继续整理的 Markdown。
Word 转 Markdown
把 .docx 文档转换成适合博客、文档站和知识库使用的 Markdown。
PPT 转 Markdown
把 PowerPoint 里的主要内容提取成更易编辑的 Markdown。
Excel 转 Markdown
把表格内容转换成更适合 Markdown 场景使用的表格与文本。
HTML 转 Markdown
把 HTML 页面内容整理成更方便继续使用的 Markdown。
图片转 Markdown
使用 Docling OCR 把截图、海报或长图内容转换成 Markdown 文本。
LaTeX 转 Markdown
把 LaTeX 源文件转换成更轻量的 Markdown 发布格式。
论文 PDF 转 Markdown
把论文 PDF 转成 Markdown,并尽量保留公式相关信息。
双栏 PDF 转 Markdown
利用 Docling 的版面与阅读顺序分析处理双栏 PDF。
保留表格的 PDF 转 Markdown
把 PDF 转成 Markdown,并尽量保留表格结构。
保留公式的 PDF 转 Markdown
启用 Docling 公式增强后,把 PDF 转成更适合科研场景的 Markdown。
保留代码块的文档转 Markdown
把技术文档转换成 Markdown,并更清晰地保留代码内容。
PDF 转 HTML
把 Docling 理解后的 PDF 输出成更适合继续处理的 HTML。
PDF 转文本
利用 Docling 的文档理解能力提取 PDF 纯文本。
图片转文本
把截图、海报或照片中的内容 OCR 成可编辑纯文本。
PDF 转 JSON
把 Docling 的 PDF 结构化结果导出为 JSON。
文档转 DocTags
把支持的文档转换成 DocTags,便于后续结构化工作流使用。
PDF OCR
对扫描 PDF 运行 Docling OCR,并返回可编辑文本。
图片 OCR
使用 Docling OCR 识别截图、海报和图片中的文字。
文档结构分析
输出包含标题层级、版面、表格数量和文本结构的 JSON 分析结果。
提取标题层级
从支持的文档中提取主要标题和章节层级。
提取 PDF 表格
把识别到的 PDF 表格导出为结构化 JSON,并附带 Markdown 预览。
提取公式
从公式较多的 PDF 中提取数学表达式。
提取代码块
把技术文档中的代码片段提取出来,并输出为结构化结果。
文档转 AI JSON
把文档转换成更适合 AI/RAG 预处理使用的结构化 JSON。
Word 转 HTML
把 Word 文档转换成便于继续发布和处理的 HTML。
PPT 转 HTML
把 PowerPoint 幻灯片内容提取成 HTML。
Excel 转 HTML
把 Excel 表格内容转换成 HTML 结果。
图片转 HTML
对图片进行 OCR,并把识别结构输出成 HTML。
扫描 PDF 转 HTML
对扫描 PDF 进行 OCR,并输出 HTML。
OCR 转 HTML
把扫描 PDF 或图片 OCR 成可编辑 HTML。
Word 转文本
从 Word 文档中提取纯文本。
扫描 PDF 转文本
对扫描 PDF 运行 OCR,并输出可编辑文本。
WebVTT 转文本
把 WebVTT 字幕文件转换成纯文本。
截图转 Markdown
把截图 OCR 成可继续编辑和复用的 Markdown。
海报 OCR
从海报、长图和宣传图中识别并提取文字。
多页扫描文档 OCR
对多页扫描 PDF 执行 OCR,并返回可编辑文本。
图片转可编辑文本
使用 Docling OCR 把图片内容转换成可编辑文本。
文档 OCR 转结构化内容
对扫描 PDF 或图片 OCR,并返回结构化 JSON 摘要。
扫描 PDF 转 JSON
对扫描 PDF 进行 OCR,并导出 Docling 结构化 JSON。
扫描合同 OCR
把扫描合同 PDF OCR 成可编辑文本。
扫描试卷 OCR
从扫描试卷、练习题和作业图片中提取文字。
Word 转 JSON
把 Word 文档结构导出为 Docling JSON。
PPT 转 JSON
把 PowerPoint 幻灯片结构导出为 JSON。
Excel 转 JSON
把 Excel 表格结构导出为 JSON。
HTML 转 JSON
把 HTML 页面解析成 Docling 结构化 JSON。
图片转 JSON
对图片进行 OCR,并导出 Docling 结构化 JSON。
文档转机器可读 JSON
把支持的文档转换成更适合程序读取的紧凑 JSON。
PDF 转 DocTags
把 PDF 转换成 DocTags,便于结构化文档工作流使用。
提取目录结构
根据标题和章节标签提取文档目录结构。
提取阅读顺序
分析复杂文档的阅读顺序和结构信息。
提取页面布局
返回 PDF 或图片中的版面结构统计信息。
双栏 PDF 转文本
把双栏 PDF 转换成更符合阅读顺序的纯文本。
复杂版式 PDF 阅读顺序修复
通过 Docling 的阅读顺序理解重新输出复杂版式 PDF 内容。
文档章节识别
识别并提取文档中的章节和标题结构。
标题与正文分离
把主要标题层级和正文内容分离输出。
页眉页脚识别清理
识别页眉页脚相关结构,方便后续清理文档正文。
版面感知文档转换
在考虑版面、表格和阅读顺序的情况下转换文档。
提取 Word 表格
从 Word 文档中提取表格并输出结构化 JSON。
提取 Excel 表格结构
提取 Excel 或 CSV 表格结构并输出 JSON。
文档中的所有表格导出
导出文档中所有识别到的表格。
表格转 Markdown
把表格文件或文档中的表格转换成 Markdown。
表格转 HTML
把表格文件或文档中的表格转换成 HTML。
表格转 JSON
把识别到的表格转换成结构化 JSON。
从 PDF 提取结构化表格
把 PDF 中的表格结构提取为 JSON,并提供 Markdown 预览。
提取文档中的数学表达式
从公式密集型文档中提取数学表达式。
论文公式提取
从学术论文和研究 PDF 中提取公式。
提取技术文档代码片段
从技术 PDF、Word 或 HTML 文档中提取代码片段。
提取文档图片
返回文档中识别到的图片块和图片元信息。
提取图片说明
提取文档中图片相关块和图片说明。
提取图表标题
提取文档中的图表和插图相关元信息。
文档图片分类
使用 Docling 图片增强能力分类文档中的图片块。
提取图文块
对图文混排文档进行 OCR,并返回文本和结构元信息。
文档转 RAG 预处理格式
把文档整理成适合 RAG 入库的文本、标题和表格结构。
文档语义提取预处理器
把文档转换成适合语义处理的轻量结构化载荷。
多格式文档统一转换器
把多种支持的文档格式统一转换成清晰 Markdown。
