启用 Excel 转 HTML
将复杂的 Excel 电子表格转换为 HTML 表格。
使用通用分块方法时,您可以启用 Excel 转 HTML 开关,将电子表格文件转换为 HTML 表格。如果禁用此功能,电子表格表格将表示为键值对。对于无法以这种方式简单表示的复杂表格,您必须启用此功能。
警告
此功能默认禁用。如果您的知识库包含带有复杂表格的电子表格,并且您未启用此功能,RAGFlow 不会抛出错误,但您的表格内容可能会出现乱码。
场景
适用于无法表示为键值对的复杂表格。例如,具有多列的电子表格表格、包含合并单元格的表格,或者单个工作表中的多个表格。在这种情况下,请考虑将这些电子表格表格转换为 HTML 表格。
注意事项
- Excel 转 HTML 功能仅适用于电子表格文件(XLSX 或 XLS(Excel 97-2003))。
- 此功能与通用分块方法关联。换句话说,只有在您选择通用分块方法时,此功能才可用。
- 启用此功能后,行数超过 12 行的电子表格表格将被拆分为每个 12 行的块。
步骤
-
在知识库的配置页面上,选择通用作为分块方法。
Excel 转 HTML 开关将会出现。
-
如果您的知识库包含无法表示为键值对的复杂电子表格表格,请启用 Excel 转 HTML。
-
如果您的知识库没有电子表格表格,或者其电子表格表格可以表示为键值对,请保持 Excel 转 HTML 禁用状态。
-
如果对复杂表格的问题回答不令人满意,请检查是否启用了 Excel 转 HTML。
常见问题解答
对于包含复杂表格的 PDF 文件,我应该启用此功能吗?
不会。此功能仅适用于电子表格文件。启用 Excel 转 HTML 不会影响您的 PDF 文件。