PDF 转文本 API
从 PDF 文档中提取文本:完整的文档文本、每页单独的文本、文档元数据(页数、标题、作者、主题、关键词、创建者、生产者、创建和修改日期、PDF 版本、加密和大纲标志),以及全文搜索功能,返回匹配的页面及其命中次数和上下文片段。通过公共 URL、base64 或原始二进制请求体提供 PDF;仅接受公共 http/https URL,私有或内部主机被阻止。纯服务器端计算(pdf.js,无第三方上游,无每页云成本)。适用于文档索引和搜索、数据提取和 ETL、发票和合同处理、归档和内容管道。
api.oanor.com/pdftext-api