快速启动 - Textin 智能文档解析

本教程基于python示例分步讲解如何使用文档解析API。我们另外提供了完整的多语言示例代码包，可在本地一键运行，助您10s跑通接口示例，请点击下载。如需在线快捷调试API，请参考Textin文档中心。

为什么使用文档解析API ？

大模型时代，文档(尤其是复杂文档)中蕴含着海量高价值的数据内容，借助文档解析API将其结构化为大模型更容易理解的格式(如markdown)，可以更大程度上增强大模型的能力、发挥更大价值，快速实现业务AI升级。 TextIn xParse 文档解析API 是专为大模型重新设计的文档理解引擎，可以满足AI开发者的核心需求：✅ 文档结构完整保持 ✅ 语义关系准确理解 ✅ 大模型原生友好使用文档解析API解析一个或多个文档，您可以选择将输出结果作为markdown或JSON文件保存在指定的目录中，也可以对输出结果做进一步的处理以满足您的业务需求。如果您正在进行知识库、RAG、大模型原生应用、Agent等业务方向的产品建设，文档解析API会为您提供帮助。

如何使用文档解析API ？

您可以参考以下示例文件和步骤，快速验证并将文档解析API接入到您的系统和应用流程中。

这里为您提供了一份Textin官方pdf示例文件，您可以点击下载或使用该链接：文档解析pdf示例.pdf

先决条件：获取API Key

使用文档解析API处理文档时，您需要先获取API Key。请先登录后前往 TextIn工作台 - 账号与开发者信息获取您的 x-ti-app-id 和 x-ti-secret-code 。

想要快速调试API？请参考Postman调试教程或Apifox调试教程。

前置准备

您可以参考以下示例代码完成文档解析API请求的前置准备工作，替换您自己的 x-ti-app-id 和 x-ti-secret-code ，后续步骤可根据实际使用场景在main函数中插入代码。

import json
import requests

class OCRClient:
    def __init__(self, app_id: str, secret_code: str):
        self.app_id = app_id
        self.secret_code = secret_code

    def recognize(self, file_content: bytes, options: dict) -> str:
        # 构建请求参数
        params = {}
        for key, value in options.items():
            params[key] = str(value)

        # 设置请求头
        headers = {
            "x-ti-app-id": self.app_id,
            "x-ti-secret-code": self.secret_code,
            # 方式一：读取本地文件
            "Content-Type": "application/octet-stream"
            # 方式二：使用URL方式
            # "Content-Type": "text/plain"
        }

        # 发送请求
        response = requests.post(
            f"https://api.textin.com/ai/service/v1/pdf_to_markdown",
            params=params,
            headers=headers,
            data=file_content
        )

        # 检查响应状态
        response.raise_for_status()
        return response.text

def main():
    # 创建客户端实例，需替换你的API Key
    client = OCRClient("你的x-ti-app-id", "你的x-ti-secret-code")

	# 插入下面的示例代码

if __name__ == "__main__":
    main()

解析单个本地文件并保存结果

复制以下示例代码，粘贴至前置准备代码的main函数中；替换要解析的文件；运行脚本来解析本地目录中的文件并将结果作为markdown和JSON文件保存。

请注意：请求体的数据格式为本地文件的二进制流，非 FormData 或其他格式。文件大小不超过 500M，长宽比小于2的图片宽高需在20～20000像素范围内，其他图片的宽高需在20～10000像素范围内。

支持的文件格式：png, jpg, jpeg, pdf, bmp, tiff, webp, doc, docx, html, mhtml, xls, xlsx, csv, ppt, pptx, txt, ofd, rtf
如果是xls/xlsx/csv文件，每个sheet行数不能超过2000，列数不能超过100。
如果是txt文件，文件大小不超过100k。

    # 在main函数中插入
    # 读取本地文件
    with open("你的文件.pdf", "rb") as f:
        file_content = f.read()

    # 设置URL参数，可按需设置，这里已为你默认设置了一些参数
    options = dict(
        dpi=144,
        get_image="objects",
        markdown_details=1,
        page_count=10,
        parse_mode="auto",
        table_flavor="html"
    )

    try:
        response = client.recognize(file_content, options)

        # 保存完整的JSON响应到result.json文件
        with open("result.json", "w", encoding="utf-8") as f:
            f.write(response)

        # 解析JSON响应以提取markdown内容
        json_response = json.loads(response)
        if "result" in json_response and "markdown" in json_response["result"]:
            markdown_content = json_response["result"]["markdown"]
            with open("result.md", "w", encoding="utf-8") as f:
                f.write(markdown_content)

        print(response)
    except Exception as e:
        print(f"Error: {e}")

解析多个本地文件并保存结果至指定目录

复制以下示例代码，粘贴至前置准备代码的main函数中；替换要解析的文件夹和输出结果文件夹；运行脚本来解析本地目录中的多个文件并将结果作为markdown和JSON文件保存至指定目录中。

 	# 在main函数中插入
    # 读取本地文件夹
    input_dir = "./tmp"  # 你可以修改为自己的文件夹
    output_dir = "./output"  # 输出结果的文件夹
	import os
    os.makedirs(output_dir, exist_ok=True)

    # 支持的文件类型
    exts = (".pdf",".png",".jpg",".jpeg",".bmp",".tiff",".webp",".doc",".docx",".html",".mhtml",".xls",".xlsx",".csv",".ppt",".pptx",".txt",".ofd",".rtf")
    files = [f for f in os.listdir(input_dir) if f.lower().endswith(exts)]

    # 设置URL参数，可按需设置，这里已为你默认设置了一些参数
    options = dict(
        dpi=144,
        get_image="objects",
        markdown_details=1,
        page_count=10,
        parse_mode="auto",
        table_flavor="html"
    )

    #循环处理
    for filename in files:
        file_path = os.path.join(input_dir, filename)
        with open(file_path, "rb") as f:
            file_content = f.read()
        try:
            response = client.recognize(file_content, options)
            base_name = os.path.splitext(filename)[0]
            # 保存JSON
            with open(os.path.join(output_dir, f"{base_name}.json"), "w", encoding="utf-8") as fw:
                fw.write(response)
            # 保存Markdown
            json_response = json.loads(response)
            if "result" in json_response and "markdown" in json_response["result"]:
                markdown_content = json_response["result"]["markdown"]
                with open(os.path.join(output_dir, f"{base_name}.md"), "w", encoding="utf-8") as fw:
                    fw.write(markdown_content)
            print(f"{filename} 处理完成")
        except Exception as e:
            print(f"{filename} 处理出错: {e}")

解析位于URL的文件并保存结果

您可以参考以下步骤，解析位于URL的文件。

请注意：请求体的数据格式为文本，内容为在线文件的URL链接（支持http以及https协议）。在线文件大小不超过 500M，长宽比小于2的图片宽高需在20～20000像素范围内，其他图片的宽高需在20～10000像素范围内。为了快速验证接入，这里为您提供了示例文件URL。

步骤一：在前置准备代码中修改请求头设置。

        # 在前置准备中修改请求头设置
        headers = {
            "x-ti-app-id": self.app_id,
            "x-ti-secret-code": self.secret_code,
            # 方式：使用URL方式
            "Content-Type": "text/plain"
        }

步骤二：复制以下示例代码，粘贴至前置准备代码的main函数中；替换要解析的文件URL或直接使用示例URL；运行脚本来解析位于URL的文件并将结果作为markdown和JSON文件保存。

    # 在main函数中插入
    # 文件URL，这里为你提供了一份真实可用的示例URL
    file_content = "https://dllf.intsig.net/download/2025/Solution/textin/sample/pdf_to_markdown/sample_02.pdf"

    # 设置URL参数，可按需设置，这里已为你默认设置了一些参数
    options = dict(
        dpi=144,
        get_image="objects",
        markdown_details=1,
        page_count=10,
        parse_mode="auto",
        table_flavor="html"
    )

    try:
        response = client.recognize(file_content, options)

        # 保存完整的JSON响应到result.json文件
        with open("result.json", "w", encoding="utf-8") as f:
            f.write(response)

        # 解析JSON响应以提取markdown内容
        json_response = json.loads(response)
        if "result" in json_response and "markdown" in json_response["result"]:
            markdown_content = json_response["result"]["markdown"]
            with open("result.md", "w", encoding="utf-8") as f:
                f.write(markdown_content)

        print(response)
    except Exception as e:
        print(f"Error: {e}")

URL参数说明

以下是文档解析API的URL参数，URL参数指以参数名=参数值形式拼接到 URL 上的键值对。它以 ? 开头，不同参数之间使用 & 连接，形如 ?p1=v1&p2=v2。URL参数会影响文档的解析结果和JSON输出内容，您可按需进行设置。

parse_mode：文档的解析模式，默认为scan模式。
- auto 由引擎自动选择，适用范围最广
- scan 文档统一当成图片解析（如pdf每一页都当成图片解析）
- lite 轻量版，只输出表格和文字结果
- parse 仅电子档文字解析，速度最快
pdf_pwd：当pdf为加密文档时，需要提供密码。
- 备注：对前端封装该接口参数时，需要自行对密码进行安全防护。
page_start：当上传的是pdf时，表示从第几页开始解析，取值范围从1开始，不传该参数时默认从首页开始。
page_count：当上传的是pdf时，表示要进行解析的pdf页数。总页数不得超过1000页，默认为1000页。
dpi：pdf文档的坐标基准，默认144 dpi。与parse_mode参数联动
- 当parse_mode=auto时，默认动态，支持72，144，216；
- 当parse_mode=scan时，默认144，支持72，144，216。
apply_document_tree：markdown中是否生成标题层级，默认为1，生成标题。
- 0 不生成标题：同时也不会返回catalog字段
- 1 生成标题
table_flavor：markdown里的表格格式，默认为html，按html语法输出表格。
- md 按md语法输出表格
- html 按html语法输出表格
- none 不进行表格识别，把表格图像当成普通文字段落来识别。
get_image：获取markdown里的图片，默认为none，不返回任何图像。
- none 不返回任何图像
- page 返回每一页的整页图像：即pdf页的完整页图片
- objects 返回页面内的子图像：即pdf页内的各个子图片
- both 返回整页图像和图像对象
image_output_type：指定返回的图片对象输出类型，默认返回子图片url和页图片id。
- base64str 指定所有图片对象为base64字符串，适用于没有云存储的用户，但是引擎返回结果体积会很大。
- default 指定子图片对象为图片url，页图片对象为图片id
apply_image_analysis：图像分析参数。利用大模型对文档中的子图片进行分析，分析结果以markdown格式输出，并替换掉子图片的文本识别内容。默认为0，不进行图像分析。
- 0 不进行图像分析
- 1 进行图像分析
paratext_mode：markdown中非正文文本内容展示模式。默认为annotation。非正文内容包括页眉页脚、子图中的文本。
- none 不展示
- annotation 以注释格式插入到markdown中。页眉页脚中的图片只保留文本，图片base64或url不保留
- body 以正文格式插入到markdown中
formula_level：公式识别等级，默认为0，全识别。开启公式识别后，会使用latex表达式。
- 0 行间公式和行内公式都识别
- 1 仅识别行间公式，行内公式不识别
- 2 不识别公式
underline_level：控制下划线识别范围，默认为0，不识别。
- 0: 不识别
- 1: 仅识别无文字的下划线，仅scan模式可用
- 2: 识别全部的下划线，仅scan模式可用
apply_merge：是否进行段落合并和表格合并。默认为1，合并段落和表格。
- 0 不合并
- 1 合并
markdown_details：是否返回结果中的detail字段。默认为1，返回detail字段，保存markdown各类型元素的详细信息。
- 0 不返回
- 1 返回
page_details：是否返回结果中的pages字段。默认为1，返回pages字段，保存每一页更加详细的解析结果。
- 0 不返回
- 1 返回
raw_ocr：是否返回全部文字识别结果(包含字符坐标信息)，结果字段为raw_ocr。默认为0，不返回。与page_details参数联动，当page_details为0或false时不返回。
- 0 不返回
- 1 返回
char_details：是否返回结果中的char_pos字段（保存每个字符的位置信息）和raw_ocr中的char_相关字段。默认为0，不返回。
- 0 不返回
- 1 返回
catalog_details：是否返回结果中的catalog字段，保存目录相关信息。与apply_document_tree参数联动，当apply_document_tree为0时不返回。
- 0 不返回
- 1 返回
get_excel：是否返回excel的base64结果，结果字段为excel_base64，可以根据该字段进行后处理保存excel文件。默认为0，不返回。
- 0 不返回
- 1 返回
crop_dewarp（切边矫正）：是否进行切边矫正预处理，默认为0，不进行切边矫正。
- 0 不进行切边矫正
- 1 进行切边矫正
remove_watermark（去水印）：是否进行去水印预处理，默认为0，不去水印。
- 0 不去水印
- 1 去水印
apply_chart（图表识别）：是否开启图表识别，开启图表识别会将识别到的图表以表格形式输出。默认为0，不进行图表识别。
- 0 不开启图表识别
- 1 开启图表识别

返回结果示例

解析后的结果数据将按照以下JSON格式返回。根据 parse_mode 的不同，返回结构会有所不同：

当 parse_mode 为 auto、scan、parse 时，返回 markdown、detail、pages 等字段
当 parse_mode 为 lite 时，返回新的 elements 结构（包含 success_count、elements 数组等字段）

下面为您提供了两种格式的返回示例。如果您想了解最全面的返回结果说明，可以在返回JSON结构说明中查看，也可以在API中查看和调试。

parse_mode 为 auto/scan/parse 时的返回结构

{
  "code": 200, // 响应状态码，200表示成功
  "result": {
    "markdown": "# 劳动人事争议仲裁申请书\n\n致:广东省劳动人事争议调解仲裁院\n\n[完整表格内容...]", // 生成的markdown格式文档内容正文字符串
    "success_count": 5, // 成功处理的页面数量
    "pages": [
      {
        "angle": 0, // 页面旋转角度，0表示无旋转
        "page_id": 1, // 页面ID
        "content": [
          {
            "pos": [276, 243, 970, 243, 970, 291, 276, 291], // 文本行四个角点坐标
            "id": 0, // 内容块ID
            "score": 1, // 识别置信度分数
            "type": "line", // 内容类型，line表示文本行
            "text": "劳动人事争议仲裁申请书" // 识别的文本内容
          },
          {
            "pos": [181, 400, 560, 400, 560, 424, 181, 424], // 文本行四个角点坐标
            "id": 1, // 内容块ID
            "score": 1, // 识别置信度分数
            "type": "line", // 内容类型，line表示文本行
            "text": "致:广东省劳动人事争议调解仲裁院" // 识别的文本内容
          }
          // [更多content条目...]
        ],
        "status": "success", // 页面处理状态，success表示成功
        "height": 1684, // 页面高度
        "structured": [
          {
            "pos": [278, 244, 967, 242, 967, 293, 278, 295], // 结构化内容的位置坐标
            "type": "textblock", // 结构化内容类型，textblock表示文本块
            "id": 0, // 结构化内容ID
            "content": [0], // 关联的content数组索引
            "text": "劳动人事争议仲裁申请书", // 结构化文本内容
            "outline_level": 0, // 大纲级别，0表示顶级标题
            "sub_type": "text_title" // 子类型，text_title表示文本标题
          }
          // [更多structured条目...]
        ],
        "durations": 459.98861694336, // 页面处理耗时（毫秒）
        "image_id": "", // 页面图像ID
        "width": 1191 // 页面宽度
      }
      // [更多pages条目...]
    ],
    "valid_page_number": 5, // 有效页面数量
    "total_page_number": 5, // 总页面数量
    "total_count": 5, // 总处理数量
    "detail": [
      {
        "paragraph_id": 0, // 段落ID
        "page_id": 1, // 所属页面ID
        "tags": [], // 标签数组
        "outline_level": 0, // 大纲级别
        "text": "劳动人事争议仲裁申请书", // 段落文本内容
        "type": "paragraph", // 内容类型，paragraph表示段落
        "position": [278, 244, 967, 242, 967, 293, 278, 295], // 段落位置坐标
        "content": 0, // 关联的content索引
        "sub_type": "text_title" // 子类型，text_title表示文本标题
      }
      // [更多detail条目...]
    ]
  },
  "x_request_id": "f36effda6a0141ed0583bea0d596f597", // 请求唯一标识符
  "metrics": [
    {
      "angle": 0, // 页面旋转角度
      "status": "success", // 处理状态
      "dpi": 144, // 图像DPI值
      "image_id": "", // 图像ID
      "page_id": 1, // 页面ID
      "duration": 464.10571289062, // 处理耗时（毫秒）
      "page_image_width": 1191, // 页面图像宽度
      "page_image_height": 1684 // 页面图像高度
    }
    // [更多metrics条目...]
  ],
  "duration": 1459, // 引擎耗时（毫秒）
  "message": "success", // 响应消息
  "version": "3.17.12" // 引擎版本号
}

parse_mode 为 lite 时的返回结构

{
    "code": 200,
    "message": "success",
    "x_request_id": "81017abf0fdd3f63ca5c42872cd09a0b",
    "result": {
        "success_count": 1,
        "elements": [
            {
                "element_id": "",
                "type": "NarrativeText",
                "text": "xParse 是一个端到端文档处理 AI 基础设施",
                "metadata": {
                    "page_image_url": "https://web-api.textin.com/ocr_image/external/01a91572ca81092c.jpg",
                    "original_image_url": "",
                    "angle": 0,
                    "page_number": 1,
                    "page_width": 600,
                    "page_height": 800,
                    "coordinates": [0.182222, 0.231623, 0.671734, 0.231643, 0.671744, 0.273255, 0.182266, 0.273211],
                    "is_continue": false,
                    "category_depth": -1,
                    "parent_id": ""
                }
            },
            {
                "element_id": "",
                "type": "Image",
                "text": "椭圆章 ENABLINGTECHNOLOGIES\tGROUP\tOF\t威特立创能科技\t(苏州)有限公司",
                "metadata": {
                    "page_image_url": "https://web-api.textin.com/ocr_image/external/01a91572ca81092c.jpg",
                    "original_image_url": "",
                    "angle": 0,
                    "page_number": 1,
                    "page_width": 600,
                    "page_height": 800,
                    "coordinates": [0.182200, 0.231600, 0.671700, 0.231600, 0.671700, 0.273200, 0.182200, 0.273200],
                    "is_continue": false,
                    "category_depth": -1,
                    "sub_type": "stamp",
                    "image_url": "https://web-api.textin.com/ocr_image/external/e47f8aed69ccabce.jpg",
                    "image_base64": ""
                }
            },
            {
                "element_id": "",
                "type": "Table",
                "text": "<table border=\"1\"><tr><td>这是一个表格</td></tr></table>",
                "metadata": {
                    "page_image_url": "https://web-api.textin.com/ocr_image/external/01a91572ca81092c.jpg",
                    "original_image_url": "",
                    "angle": 0,
                    "page_number": 1,
                    "page_width": 600,
                    "page_height": 800,
                    "coordinates": [0.182200, 0.231600, 0.671700, 0.231600, 0.671700, 0.273200, 0.182200, 0.273200],
                    "is_continue": false,
                    "category_depth": -1,
                    "parent_id": ""
                }
            }
        ]
    }
}

Element type 类型说明

当 parse_mode 为 lite 时，返回的 elements 数组中每个 element 的 type 字段可能的值如下：

Element type	说明
NarrativeText	除了标题、页眉页脚、图片说明文字列表外的普通段落文字
Title	章节标题
Table	表格
TableCaption	表格标题
Image	图片
FigureCaption	图片标题
Formula	公式
Header	页眉
Footer	页脚
CodeSnippet	代码片段
PageNumber	页码
UncategorizedText	其他文本

elements格式转换脚本

如果您需要将 elements 格式转换为统一的 detail/pages 格式，可以使用以下 Python 转换脚本：

def convert_elements_to_legacy_format(elements_result):
    """
    将 elements 格式转换为原有的 detail/pages 格式
    
    Args:
        elements_result: parse_mode 为 lite 时返回的 result 对象，包含 success_count 和 elements
    
    Returns:
        转换后的结果，包含 detail 和 pages 结构
    """
    if not elements_result or 'elements' not in elements_result:
        raise ValueError("输入结果不包含 elements 字段")
    
    elements = elements_result.get('elements', [])
    success_count = elements_result.get('success_count', 0)
    
    # 按页码分组 elements
    pages_dict = {}
    detail_list = []
    paragraph_id_counter = 0
    
    # 用于生成 markdown：收集所有 text 和 is_continue 信息
    markdown_parts = []
    
    for idx, element in enumerate(elements):
        if not element or 'metadata' not in element:
            continue
            
        metadata = element.get('metadata', {})
        page_number = metadata.get('page_number', 1)
        element_type = element.get('type', '')
        text = element.get('text', '')
        is_continue = metadata.get('is_continue', False)
        coordinates = metadata.get('coordinates', [])
        category_depth = metadata.get('category_depth', -1)
        parent_id = metadata.get('parent_id', '')
        sub_type = metadata.get('sub_type', '')
        page_width = metadata.get('page_width', 0)
        page_height = metadata.get('page_height', 0)
        angle = metadata.get('angle', 0)
        page_image_url = metadata.get('page_image_url', '')
        original_image_url = metadata.get('original_image_url', '')
        image_url = metadata.get('image_url', '')
        image_base64 = metadata.get('image_base64', '')
        
        # 初始化页面数据
        if page_number not in pages_dict:
            pages_dict[page_number] = {
                'page_id': page_number,
                'status': 'success',
                'width': page_width,
                'height': page_height,
                'angle': angle,
                'image_id': '',
                'content': [],
                'structured': [],
                'durations': 0.0
            }
        
        page_data = pages_dict[page_number]
        
        # 转换坐标：从归一化坐标转换为像素坐标
        # coordinates 是归一化的 [x1, y1, x2, y2, x3, y3, x4, y4]
        position = []
        if len(coordinates) >= 8 and page_width > 0 and page_height > 0:
            for i in range(0, 8, 2):
                x = int(coordinates[i] * page_width)
                y = int(coordinates[i + 1] * page_height)
                position.extend([x, y])
        else:
            position = [0, 0, 0, 0, 0, 0, 0, 0]
        
        # 创建 detail 条目
        detail_item = {
            'paragraph_id': paragraph_id_counter,
            'page_id': page_number,
            'outline_level': category_depth,
            'text': text,
            'position': position,
            'type': '',
            'sub_type': '',
            'content': 0
        }
        
        # 根据 element type 映射到 detail 的 type 和 sub_type
        type_mapping = {
            'NarrativeText': ('paragraph', 'text'),
            'Title': ('paragraph', 'text_title'),
            'Table': ('table', 'bordered'),
            'TableCaption': ('paragraph', 'table_title'),
            'Image': ('image', sub_type if sub_type else ''),
            'FigureCaption': ('paragraph', 'image_title'),
            'Formula': ('paragraph', 'text'),
            'Header': ('paragraph', 'header'),
            'Footer': ('paragraph', 'footer'),
            'CodeSnippet': ('paragraph', 'text'),
            'PageNumber': ('paragraph', 'text'),
            'UncategorizedText': ('paragraph', 'text')
        }
        
        detail_type, detail_sub_type = type_mapping.get(element_type, ('paragraph', 'text'))
        detail_item['type'] = detail_type
        detail_item['sub_type'] = detail_sub_type
        
        # 处理图片相关字段
        if element_type == 'Image' and image_url:
            detail_item['image_url'] = image_url
        if element_type == 'Image' and image_base64:
            detail_item['image_base64'] = image_base64
        
        detail_list.append(detail_item)
        
        # 创建 content 条目（文本行）
        content_id = len(page_data['content'])
        content_item = {
            'id': content_id,
            'type': 'line',
            'text': text,
            'pos': position,
            'angle': angle,
            'score': 1.0
        }
        page_data['content'].append(content_item)
        
        # 创建 structured 条目
        structured_item = {
            'type': 'textblock' if detail_type == 'paragraph' else detail_type,
            'pos': position,
            'content': [content_id],
            'text': text,
            'outline_level': category_depth
        }
        
        if detail_sub_type:
            structured_item['sub_type'] = detail_sub_type
        
        if detail_type == 'table':
            structured_item['rows'] = 1
            structured_item['cols'] = 1
            structured_item['columns_width'] = [position[2] - position[0]] if len(position) >= 4 else [100]
            structured_item['rows_height'] = [position[5] - position[1]] if len(position) >= 6 else [50]
            structured_item['cells'] = []
        
        if detail_type == 'image':
            structured_item['lines'] = [content_id]
            structured_item['content'] = [content_id]
        
        page_data['structured'].append(structured_item)
        
        # 收集 markdown 内容
        markdown_parts.append({
            'text': text,
            'is_continue': is_continue
        })
        
        paragraph_id_counter += 1
    
    # 生成 markdown：根据 is_continue 决定拼接方式
    markdown_lines = []
    for idx, part in enumerate(markdown_parts):
        if idx == 0:
            # 第一个元素直接添加
            markdown_lines.append(part['text'])
        else:
            # 如果前一个元素 is_continue=True，直接拼接；否则用换行符拼接
            prev_is_continue = markdown_parts[idx - 1]['is_continue']
            if prev_is_continue:
                # 直接拼接（追加到最后一个元素）
                markdown_lines[-1] += part['text']
            else:
                # 用换行符拼接
                markdown_lines.append(part['text'])
    
    markdown = '\n'.join(markdown_lines)
    
    # 构建最终结果
    pages_list = [pages_dict[page_num] for page_num in sorted(pages_dict.keys())]
    
    result = {
        'markdown': markdown,  # 由 elements 中的 text 拼接而成
        'detail': detail_list,
        'pages': pages_list,
        'valid_page_number': success_count,
        'total_page_number': len(pages_dict),
        'success_count': success_count
    }
    
    return result


# 使用示例
if __name__ == "__main__":
    # 示例：从 API 响应中提取 result
    api_response = {
        "code": 200,
        "message": "success",
        "result": {
            "success_count": 1,
            "elements": [
                {
                    "element_id": "",
                    "type": "NarrativeText",
                    "text": "xParse 是一个端到端文档处理 AI 基础设施",
                    "metadata": {
                        "page_image_url": "https://web-api.textin.com/ocr_image/external/01a91572ca81092c.jpg",
                        "original_image_url": "",
                        "angle": 0,
                        "page_number": 1,
                        "page_width": 600,
                        "page_height": 800,
                        "coordinates": [0.182200, 0.231600, 0.671700, 0.231600, 0.671700, 0.273200, 0.182200, 0.273200],
                        "is_continue": False,
                        "category_depth": -1,
                        "parent_id": ""
                    }
                }
            ]
        }
    }
    
    # 转换格式
    try:
        converted_result = convert_elements_to_legacy_format(api_response['result'])
        print("转换成功！")
        print(f"Detail 条目数: {len(converted_result['detail'])}")
        print(f"Pages 条目数: {len(converted_result['pages'])}")
    except Exception as e:
        print(f"转换失败: {e}")

错误码说明

错误码	描述
40101	x-ti-app-id 或 x-ti-secret-code 为空
40102	x-ti-app-id 或 x-ti-secret-code 无效，验证失败
40103	客户端IP不在白名单
40003	余额不足，请充值后再使用
40004	参数错误，请查看技术文档，检查传参
40007	机器人不存在或未发布
40008	机器人未开通，请至市场开通后重试
40301	图片类型不支持
40302	上传文件大小不符，文件大小不超过 500M
40303	文件类型不支持，接口会返回实际检测到的文件类型，如“当前文件类型为.gif”
40304	图片尺寸不符，长宽比小于2的图片宽高需在20～20000像素范围内，其他图片的宽高需在20～10000像素范围内
40305	识别文件未上传
40422	文件损坏（The file is corrupted.）
40423	PDF密码错误（Password required or incorrect password.）
40424	页数设置超出文件范围（Page number out of range.）
40425	文件格式不支持（The input file format is not supported.）
40427	DPI参数不在支持列表中（Input DPI is not in the allowed DPIs list(72,144,216).）
40428	word和ppt转pdf失败或者超时（Process office file failed.）
50207	部分页面解析失败（Partial failed）
40400	无效的请求链接，请检查链接是否正确
30203	基础服务故障，请稍后重试
500	服务器内部错误

示例代码下载

我们提供了完整的多语言示例代码包，助您10s跑通接口示例，点击下载。

​为什么使用文档解析API ？

​如何使用文档解析API ？

​先决条件：获取API Key

​前置准备

​解析单个本地文件并保存结果

​解析多个本地文件并保存结果至指定目录

​解析位于URL的文件并保存结果

​URL参数说明

​返回结果示例

​parse_mode 为 auto/scan/parse 时的返回结构

​parse_mode 为 lite 时的返回结构

​Element type 类型说明

​elements格式转换脚本

​错误码说明

​示例代码下载

为什么使用文档解析API ？

如何使用文档解析API ？

先决条件：获取API Key

前置准备

解析单个本地文件并保存结果

解析多个本地文件并保存结果至指定目录

解析位于URL的文件并保存结果

URL参数说明

返回结果示例

parse_mode 为 auto/scan/parse 时的返回结构

parse_mode 为 lite 时的返回结构

Element type 类型说明

elements格式转换脚本

错误码说明

示例代码下载