文档解析
您可以点击预存的示例文档,也可以自行上传文档(如发票、表格或报告等)在右侧快速查看解析结果并与原文档进行对照;可以切换查看JSON格式输出以及特定元素解析结果,同时也支持您对解析结果进行编辑、复制、导出等操作。请注意:预存示例文档的解析是免费的,而您自行上传文档进行解析需要消耗页数额度。


文档抽取
除了文档解析外,我们还提供了文档智能抽取功能,可以从文档中提取您指定的数据。如果您需要从多个文档中提取结构化信息,例如:您想要提取发票中的信息,以便于完成财务报销流程自动化和提效;这个功能会非常有用! 在Web平台中,您可以在右侧面板中切换至「智能抽取」对文档进行结构化信息提取。 智能抽取支持2种配置模式,可以切换使用。- prompt模式:您可以输入想提取的内容,系统会根据您的prompt要求提取相应信息,并以JSON格式输出。
让结构更稳定的要点:
- 有明确的字段信息,如“交易金额、签约日期”等
- 对字段增加简单的描述,如“交易金额(小写数字)、签约日期(以yy-mm-dd表示)”
- 指定输出格式,如“[ 日期: [明细1: ]“
- 提供明确的结构化示例

- 字段模式:您可以自定义添加要抽取的文本字段或表格表头,系统会根据字段进行抽取;您可以直接查看字段和表头的抽取结果,也可以切换至JSON格式查看输出。文本字段和表格表头的抽取字段数量总计不超过100个。
定义要提取的数据时,您需要为每个字段提供一个名称,您还可以添加可选的描述以提供更多上下文。名称和描述均会作为抽取的指导因素,帮助系统更准确的了解需要从文档中查找和提取哪些信息。字段名称和描述越具体、越清晰,系统就越能够准确地识别和抽取文档中的正确数据。

请注意:文档智能抽取在API中支持最大不超过100页的文档,超出部分的文档信息将被忽略;而在Web平台使用时,为了能够让您更快感受效果,支持最大不超过20页的文档。