会话

建材RAG超复杂文档

概论

经验 人间
类型 深海底
TRACK 生成AI
技术类 GenAI/LLMs
SKILL级 中间

大语言模型正在革命用户搜索、交互生成新内容最近出现了一些回收推介生成工具栈和工具箱,使用户能够用私人数据搭建聊天机等应用程序建立天真RAG简单易行,而建材RAG则极具挑战性,特别是用户向大复杂数据源扩展时更是如此。经典实例是多PDF嵌入表

RAG只像数据那样好,开发者必须认真考虑如何剖析、摄取并检索数据以成功构建RAG复杂文档本届会议深入探索整个过程环建RAG管道过程概述 处理乱复杂PDF文档包括执行解析策略解析嵌入对象复杂文档由索引化策略组成 处理文档超出简单块技术研究各种高级检索算法 处理表格数据和非结构化数据 并讨论使用案例和取舍

会话讲员

杰瑞刘

/LlamaIndex