Authorizations
Body
application/json
支持的文件格式:png, jpg, jpeg, pdf, bmp, tiff, webp, doc, docx, html, mhtml, xls, xlsx, csv, ppt, pptx, txt, ofd;
支持schema模式的结构化信息抽取,通过定义字段结构进行精确抽取。
文件信息
抽取数据结构,参考JSON schema说明
Example:
{
  "type": "object",
  "properties": {
    "商品": { "type": "string", "description": "商品名称" }
  },
  "required": ["商品"]
}解析阶段参数
高级抽取控制
Response
200 - application/json
返回结果
状态码
- 200: Success (成功)
 - 40101: x-ti-app-id 或 x-ti-secret-code 为空
 - 40102: x-ti-app-id 或 x-ti-secret-code 无效,验证失败
 - 40103: 客户端IP不在白名单
 - 40003: 余额不足,请充值后再使用
 - 40004: Parameter error (参数错误,请检查入参)
 - 40007: 机器人不存在或未发布
 - 40008: 机器人未开通,请至市场开通后重试
 - 40302: 上传文件大小不符,文件大小不超过 50M
 - 40303: 文件类型不支持,接口会返回实际检测到的文件类型,如“当前文件类型为.gif”
 - 40304: 图片尺寸不符,长宽比小于2的图片宽高需在20~20000像素范围内,其他图片的宽高需在20~10000像素范围内
 - 40305: File not uploaded (识别文件未上传)
 - 40306: qps超过限制
 - 40400: 无效的请求链接,请检查链接是否正确
 - 40422: The file is corrupted (文件损坏)
 - 40423: Password required or incorrect password (PDF密码错误)
 - 40424: Page number out of range (页面设置超出文件范围)
 - 40425: The input file format is not supported (输入文件格式不支持)
 - 40428: Process office file failed (word和ppt转pdf失败或者超时)
 - 500: Engine failed (服务器内部错误)
 - 50011: LLM Connection Failed (访问大模型超时)
 - 50012: LLM Engine Failed (大模型引擎错误)
 - 50207: Partial failed (部分页面解析失败)
 
可用选项: 
200, 40101, 40102, 40103, 40003, 40004, 40007, 40008, 40302, 40303, 40304, 40305, 40306, 40400, 40422, 40423, 40424, 40425, 40428, 500, 50011, 50012, 50207 Example:
200
成功或错误信息
Example:
"Success"
版本号
Example:
"v3.0.29_20250819"
总耗时(ms)
Example:
8267
请求ID
Example:
"7596b8c9d2ddbc9924b66651e9efc174"
处理状态
Example:
"finished"
各阶段耗时统计

