跳到主要内容
版本: DEV

启用 Excel 转 HTML

将复杂的 Excel 电子表格转换为 HTML 表格。


使用通用分块方法时,您可以启用 Excel 转 HTML 开关,将电子表格文件转换为 HTML 表格。如果禁用此功能,电子表格表格将表示为键值对。对于无法以这种方式简单表示的复杂表格,您必须启用此功能。

警告

此功能默认禁用。如果您的知识库包含带有复杂表格的电子表格,并且您未启用此功能,RAGFlow 不会抛出错误,但您的表格内容可能会出现乱码。

场景

适用于无法表示为键值对的复杂表格。例如,具有多列的电子表格表格、包含合并单元格的表格,或者单个工作表中的多个表格。在这种情况下,请考虑将这些电子表格表格转换为 HTML 表格。

注意事项

  • Excel 转 HTML 功能仅适用于电子表格文件(XLSX 或 XLS(Excel 97-2003))。
  • 此功能与通用分块方法关联。换句话说,只有在您选择通用分块方法时,此功能才可用。
  • 启用此功能后,行数超过 12 行的电子表格表格将被拆分为每个 12 行的块。

步骤

  1. 在知识库的配置页面上,选择通用作为分块方法。

    Excel 转 HTML 开关将会出现。

  2. 如果您的知识库包含无法表示为键值对的复杂电子表格表格,请启用 Excel 转 HTML

  3. 如果您的知识库没有电子表格表格,或者其电子表格表格可以表示为键值对,请保持 Excel 转 HTML 禁用状态。

  4. 如果对复杂表格的问题回答不令人满意,请检查是否启用了 Excel 转 HTML

常见问题解答

对于包含复杂表格的 PDF 文件,我应该启用此功能吗?

不会。此功能仅适用于电子表格文件。启用 Excel 转 HTML 不会影响您的 PDF 文件。