> ## Documentation Index
> Fetch the complete documentation index at: https://docs.textin.com/llms.txt
> Use this file to discover all available pages before exploring further.

# 产品简介

> TextIn xParse for ETL  

TextIn xParse智能文档解析，致力于将复杂文档转变为结构化数据，让任意文档的信息都能高效准确流入您的数据库，将非结构化内容转化为可查询、可分析的宝贵数据资产，同时兼容关系型数据库与向量数据库。

TextIn xParse智能文档解析可以从 pdf、word、excel、ppt、图片等十余种格式的非结构化文档中提取结构化数据。[文档解析](/xparse/v1/quickstart)可以识别文本、图像、表格、公式、手写体、表单字段、页眉页脚等各种元素，并支持印章、二维码、条形码等子类型，转换成 markdown 和 JSON 格式返回，同时包含精确的页面元素和坐标信息。[文档抽取](/xparse/extract-quickstart-v3)可以根据定义的规则提取特定的数据信息，支持根据prompt（自然语言）和自定义字段模式（JSON Schema）抽取。

解析或抽取后的数据是LLM友好的格式，非常适用于下游应用程序，如知识库、RAG、Agent或其他自定义工作流程。

### TextIn xParse 助力从文档到可操作的数据资产

提供全链路的文档结构化工具，最大化挖掘数据资产价值，您只需关心业务，剩下的交给TextIn

<img src="https://mintcdn.com/textin/fw3w19DA3JyRQB2o/images/index-1.png?fit=max&auto=format&n=fw3w19DA3JyRQB2o&q=85&s=86268c63007ff2e6f0310bd3eeb31ab0" alt="Index 1 Pn" width="1145" height="424" data-path="images/index-1.png" />

### 立即试用

<CardGroup cols={2}>
  <Card title="在线 Web 平台" icon="sparkles" href="https://www.textin.com/console/recognition/robot_markdown?service=pdf_to_markdown">
    免费试用，一站式极速体验解析抽取效果
  </Card>

  <Card title="API" icon="sparkles" href="/api-reference">
    灵活使用不同编程语言，支持接口高度自定义
  </Card>

  <Card title="CLI & SDK" icon="sparkles" href="/xparse/v1/cli">
    提供可直接复制运行的命令行工具与 SDK，快速将 xParse 文档解析能力集成到开发环境中
  </Card>

  <Card title="第三方 Agent/RAG 平台" icon="sparkles" href="/xparse/v1/ecosystem/skills-mcp">
    适配 Langchain, Dify, RAGFlow 等框架
  </Card>
</CardGroup>

### 核心优势

* **支持任意复杂布局**：将任意版式的文档拆解为语义完整的段落，并按阅读顺序还原，更加适配大模型。
* **多元素高精度解析**：准确提取标题、公式、图表、手写体、印章、跨页段落、页眉页脚、表单字段等各种元素，同时具备行业领先的表格识别能力，轻松解决合并单元格、跨页表格、无线表格等识别难题。
* **强大的语义理解和上下文感知**：捕捉更多版面元素间的语义关系，让大模型更加读懂一份文档。
* **强大的预处理工具**：无缝集成TextIn平台中的图像处理能力，文档带水印、图片有弯曲、模糊，都能搞定。
* **高精度坐标还原**：JSON结果包含高精度的页面、元素、字符级坐标数据，方便人工复核。
* **极简、智能、灵活的语义抽取**：xParse提供prompt模式和Schema模式两种抽取规则定制，帮助您根据业务需要实现更灵活的文档信息精准提取。
* **开发者友好**：提供清晰的API文档和灵活的集成方式，支持FastGPT、Coze、CherryStudio等主流平台。

更多详情见： [TextIn xParse for ETL 产品介绍](https://www.textin.com/market/detail/xparse)
