启用 Excel2HTML
将复杂的 Excel 电子表格转换为 HTML 表格。
使用 通用 分块方法时,您可以启用 Excel 转 HTML 开关,将电子表格文件转换为 HTML 表格。如果禁用此开关,电子表格将被表示为键值对。对于无法以这种方式简单表示的复杂表格,您必须启用此功能。
警告
该功能默认禁用。如果您的知识库包含带有复杂表格的电子表格,而您未启用此功能,RAGFlow 不会抛出错误,但您的表格内容很可能会出现乱码。
使用场景
此功能适用于无法表示为键值对的复杂表格。例如,包含多列、合并单元格或一个工作表内有多个表格的电子表格。在这种情况下,请考虑将这些电子表格转换为 HTML 表格。
注意事项
- Excel 转 HTML 功能仅适用于电子表格文件(XLSX 或 XLS (Excel 97-2003))。
- 此功能与 通用 分块方法相关联。换句话说,它*仅在*您选择 通用 分块方法时可用。
- 启用此功能后,超过 12 行的电子表格将被拆分为每 12 行为一个分块。
操作步骤
-
在您知识库的 配置 页面,选择 通用作为分块方法。
此时会出现 Excel 转 HTML 开关。
-
如果您的知识库包含无法表示为键值对的复杂电子表格,请启用 Excel 转 HTML。
-
如果您的知识库没有电子表格,或者其电子表格可以表示为键值对,请禁用 Excel 转 HTML。
-
如果关于复杂表格的问答效果不理想,请检查是否已启用 Excel 转 HTML。
常见问题
对于包含复杂表格的 PDF,我应该启用此功能吗?
不需要。此功能仅适用于电子表格文件。启用 Excel 转 HTML 不会影响您的 PDF 文件。