Indietro

#document

3 APIs con questa etichetta

PDF 转文本 API

从 PDF 文档中提取文本:完整的文档文本、每页单独的文本、文档元数据(页数、标题、作者、主题、关键词、创建者、生产者、创建和修改日期、PDF 版本、加密和大纲标志),以及全文搜索功能,返回匹配的页面及其命中次数和上下文片段。通过公共 URL、base64 或原始二进制请求体提供 PDF;仅接受公共 http/https URL,私有或内部主机被阻止。纯服务器端计算(pdf.js,无第三方上游,无每页云成本)。适用于文档索引和搜索、数据提取和 ETL、发票和合同处理、归档和内容管道。

api.oanor.com/pdftext-api

OCR API

Extraiga texto de imágenes mediante reconocimiento óptico de caracteres en ocho idiomas (inglés, alemán, francés, español, italiano, portugués, neerlandés y turco). Obtenga el texto completo reconocido con una puntuación de confianza promedio y recuentos de palabras y líneas, o resultados a nivel de palabra donde cada palabra lleva su propia confianza y cuadro delimitador para un procesamiento consciente del diseño. Proporcione una imagen mediante URL pública, base64 o un cuerpo de solicitud binario sin procesar; las imágenes grandes se reducen automáticamente antes del reconocimiento para mantener las respuestas rápidas, y un motor cálido mantiene baja la latencia después del inicio. Cálculo puro del lado del servidor (Tesseract, sin terceros ascendentes, sin costo de nube por llamada). Ideal para digitalizar documentos y recibos, leer texto de fotos y capturas de pantalla, accesibilidad y automatización de entrada de datos.

api.oanor.com/ocr-api

PDF API

Genera documentos PDF a partir de texto sobre la marcha — con un título opcional en negrita, tamaño de página (A4, Carta o Legal) y tamaño de fuente. Devuelve un PDF en base64 o un archivo descargable sin procesar. Ideal para facturas, informes, recibos y boletos.

api.oanor.com/pdf-api