湖北省住建厅网站官网湛江网站建设服务

张小明 2025/12/27 18:40:25
湖北省住建厅网站官网,湛江网站建设服务,宣传旅游网站建设,如何做品牌营销策划本文深入剖析企业级RAG知识库问答系统的全链路优化策略#xff0c;从知识提取、分块、嵌入、存储与索引、检索、回答生成到效果评估七大环节#xff0c;详细阐述各环节的核心选型与优化思路。文章指出低代码平台仅能达到基础水平#xff0c;真正的精准度提升需通过系统化优化…本文深入剖析企业级RAG知识库问答系统的全链路优化策略从知识提取、分块、嵌入、存储与索引、检索、回答生成到效果评估七大环节详细阐述各环节的核心选型与优化思路。文章指出低代码平台仅能达到基础水平真正的精准度提升需通过系统化优化实现包括PDF/图片处理、分块逻辑设计、嵌入模型选择、向量数据库选型及检索优化等为企业构建高精准度知识库助手提供实用指导。在企业级场景中一个精准的知识库问答工具至关重要。本文深入剖析 RAG检索增强生成技术从知识提取、分块、嵌入、存储与索引、检索到回答生成及效果评估等各个环节详细阐述其核心选型与优化思路助力读者掌握打造高精准度知识库助手的完整策略。———— / BEGIN / ————像Dify、Coze这样的低代码Agent搭建工具通过将RAG内的各类能力进行封装供用户在GUI界面上点击几下即可进行配置。这却给很多用户造成了一种假象——好像拖拉拽一下就能配置好一个知识库问答工具打造一个企业级的知识库助手。图源ChatGPT帮忙生成从实际落地上来看上层封装好的能力有其局限性低代码平台能够达到的问答精准度上限明显可能50、60分都算很不错的了但这个分数对于企业级场景是完全不可用的。你会允许AI在回答一些公司财务问题、行政问题上有一丝一毫的偏差吗因此从50分到90分的过程才是RAG真正大显神威之处。但这个过程并不是一蹴而就的即搞定1处就全盘皆赢从知识的提取、向量化、分块、索引、检索到最终生成每一步都有各种各样的优化策略可供选择不同的策略适应不同的场景、数据的质量和生成的要求等。可以说真正的RAG工作是由一系列复杂、细致的优化策略叠加而来这不仅要求你随时更新自己的知识体系、掌握最新的优化方向进程更需要你了解数据形态和业务场景能够结合最终生成诉求来倒推如何去选择这一系列策略的配合。本文将分享下各个环节上的核心选型和优化思路作为一张RAG策略地图供大家交流学习。知识提取Extracting知识的形态可以分为结构化表格、半结构化网页、非结构化PDF、Word等。和数据库这样结构化数据不同的是知识库往往存在大量非结构化数据如视频、音频、PDF、网页等这虽然极大地扩展了知识面但也为准确的识别带来了技术难题。像Dify、Langchain、LlamaIndex这些框架都自带了一些提取器但同时也支持丰富的其他loader器的能力集成。以Dify为例它不仅支持自研的文件抽取方案同时也支持了Unstructured的抽取方案。目前市面上较为常见的一些外部抽取工具有其中Unstructured是目前较火的一种通用抽取工具支持常见各种丰富的文档格式适合作为一种基础通用的抽取工具选型。抽取阶段的难点其实在于——PDF和图片文字提取上。PDF的难点在于其灵活、丰富的布局本质上蕴含和嵌套了大量的关系例如图片插在一堆文字中间它可能是上一段话的一个示意图同时PDF这种格式又把标题、小标题、第一点/第二点等这样的布局拍平了难以通过像读取网页里的title、body那样能够很轻易的读取到内容结构。而企业的大多数正式流通的文件都是PDF格式不能随意被篡改和编辑因此这里就需要应用PDF类抽取工具Pymupdf、MinerU、PyPDF等对PDF文件做专门的处理这些工具的特点是会对PDF格式文件做单独的适配和处理类似于一个元素解析器能够清晰的读取不同元素是什么——如标题、正文、页眉、页脚、插图等。另外企业内大量还存在的一类文档为图片图片的精准识别尤其在金融行业应用极多。以某基金公司为例其需要对新设管理人提交的资料进行审核资料中包含大量的管理人学历、简历等照片另外针对中期监管诉求需要定期收集基金的银行电子回单去进行监管审核等。这些都对从图片中提取和识别文字的精准度有极高要求例如上图中纳税人识别号这种比较小的字母直接使用大模型效果较差通常我们会借助OCR光学字符识别Optical Character Recognition来进行实现。目前我们自己应用过的产品中闭源工具Textin和开源工具百度飞浆整体效果和性价比还算可控大家也可以结合自己的业务去试试平衡下准确度和费用的关系。知识分块Chunking将知识抽取完成后我们就拥有了大量的知识信息这些信息可能是文字、图片等这些知识以文档集合整理在一起。但在交给大模型进行向量化处理之前需要进行分块处理。为什么需要分块而不是一整个文档扔给大模型呢这是因为大模型一次吞吐的上下文有限。例如Qwen3的上下文长度为32768tokens约5万字左右这些上下文不只是查询知识库召回的内容块长度还有用户问题query、提示词prompt等。另外即使有段时间各家的大模型都在努力加长上下文长度但足够的上下文并不代表着精确性也有可能会召回干扰性的内容块从而更容易造成模型的幻觉。因此在有限上下文长度背景下分块技术相对能更精准检索从而降低模型幻觉和算力成本。那么该按照什么逻辑进行分块呢常见的分块方式有如下几种当然实际按照什么逻辑分块是需要渐进式调整后得出的。例如最开始可以先按照最常规的固定字符数分块通过查看分块和召回测试看看效果如果效果不佳再调整字符数大小或是增加分隔符递归分块甚至手动调整分块内容等。另外分块本身是为了服务于检索这就避不开要面向索引去进行分块逻辑的处理了。常见的几种在分块阶段就要为后续索引进行逻辑呼应的分块技巧有这几种混合生成父子文本块先生成粒度较大的文本块再切分成更小的子文本块父子文本块用ID进行映射关联。在检索阶段先检索到子文本块再通过ID找出其父文本块从而将2者一并传递给大模型提升更加丰富和准确的回答。生成文本块元数据分块后同步为该文本块生成对应的元数据如标题、页码、创建时间、文件名等从而在检索时能够结合元数据作为过滤器来更高效进行检索该功能目前Dify v1.1.0版本已经开始支持做配置了生成摘要细节文本块类似于父子关系摘要则是由粗及浅为文档生成概要性摘要信息再将摘要和细节文本块关联起来生成递归型多层级索引类似于父子、摘要细节递归型则是划分了更多层级的索引树自上而下是逐渐由粗到细的信息量后续还会专门展开索引相关内容这里先抛砖引玉带一下分块、索引、检索这3块技术应当整合在一起进行整体考虑。知识嵌入Embedding分块好后下一步则需要对这些不同块的知识进行语义理解和编码了这也是整个RAG过程中第一次需要使用到大模型的场景。常见的嵌入方式有2种——稀疏嵌入和稠密嵌入而我们通常讨论较多的都是稠密嵌入。简而言之稠密嵌入能够更好的捕捉语义关系而稀疏嵌入在计算存储上更高效。稠密嵌入是一种将离散符号如词、句子、用户、物品等映射到低维连续向量空间 中的表示方法。在这个向量中大部分元素都是非零的实数 每个维度都隐式地表达某种语义或特征。稀疏嵌入是一种将数据映射到高维向量空间 中的表示方法其中大多数维度的值为0只有少数维度有非零值 。目前应用较多的方式是2者进行结合实现混合检索稠密嵌入负责捕捉语义关系稀疏嵌入则更多应用如BM25基于词的重要性对文档和查询进行匹配这样的方法既做到了语义上的相关性也做到了关键词匹配的精准性。常见的稠密嵌入大模型有OpenAI、Jina、Cohere、Voyage、阿里Qwen这几家公司的可以在https://huggingface.co/spaces/mteb/leaderboard去查看全球目前较新的Embedding模型排名。截至当日多语言embedding模型中排名第一的为gemini-embedding-001第二三四名竟然都是阿里的Qwen-Embedding系列这还挺让人惊喜的。不过排名仅供参考还是要根据自己实际任务类型去做测量。另外不止生成模型可以做微调我们往往说的大模型微调都是指偏生成响应侧侧大模型其实嵌入模型也是支持做微调的但很少有公司涉及。如果有一些高度专业化的知识如医学、律师、有特定的格式要求或者文化本地化需求则最后一步再可以考虑嵌入模型的微调。通过微调可以生成更优质的文本嵌入使语义相似的文本在嵌入空间中的距离更加接近。知识存储索引经过embedding后我们会生成大量的嵌入数据这些数据当然不能以我们常见的关系型/非关系型数据库进行存储了而是需要特定的向量数据库来以嵌入形式存储向量。存储的目标是为了更好更快的检索因此这一部分我们会将存储和索引一起来展开。先来看有哪些向量数据库目前比较火的有Milvus、Faiss、Chroma、Weaviate、Qdrant、Pinecone、ElasticSearch当然国内各家大厂如腾讯也都建立了向量数据库的生态。如果你想轻量级测试和小项目应用可以首选FaissFacebook开源的向量数据库如果你是企业商用则可以考虑Milvus如果你之前在用ElasticSearch的搜索/数据库功能也可以继续考虑使用他们的向量数据库功能。另外Dify官方默认的向量数据库则是Weaviate说明该组件在企业商用上也是ok的。图源黄佳《RAG实战课》当我们将向量存入数据库后则需要对应建立索引。索引是有效组织数据的过程就像我们去一家医院后的指南图一样它通过显著降低对大型数据集的耗时查询在相似度检索上起到重要作用。常见的索引方式有如下几类图源黄佳《RAG实战课》这里核心讲解3种索引思想FLAT精确搜索对所有数据进行暴力性遍历当然只适合小批量数据啦IVF_FLAT倒排文件索引精确搜索将向量数据划分为若干个簇计算查询向量与每个簇中心的距离找出相似度最高的n个簇再在这些簇里面检索目标向量。就像你要找到「猫」在哪里先快速找到「动物类」的簇在哪里。HNSW基于图结构的近似最近邻搜索目前性能最好的ANN近似最近邻搜索算法之一它通过构建一个多层导航图如顶层、中层、底层不同层级的密度逐步变大让查询时能像坐地铁一样“跳跃式”地快速接近目标点。目前Dify中Weaviate的默认索引方式就是HNSW。知识检索Retrieval前面准备了这么多之后才来到最后的检索部分而这也是RAGRetrieval-Augmented Generation 中RRetrieval真正起作用的开始。检索前常见的处理方式有如下几种其中查询结构转化和查询翻译是常用的一些检索前优化方式查询路由应用相对没那么多1. 查询结构转化2. 查询翻译3. 查询路由检索前处理处理说明逻辑路由根据用户问题选择合适的数据源或检索方式语义路由根据用户问题选择合适的提示词模板通过上述处理完成检索后对应也有一些可以优化的策略上述提供了一些检索前后的优化思路其中像查询结构转化、查询翻译、重排基本都是相对必须的一些优化点查询路由、压缩、校正等是否需要可以根据问答效果再考虑是否选用。还有一些新兴方向如Self-RAG让大模型自我决策是否要搜索、搜什么、搜到的够不够、是否要需要搜索让大模型自己对检索效果进行优化目前成本和响应时间上还不甚理想但这未来注定会是一个长期会进化的方向可能会通过微调多个特定的小模型来进行实现可以持续关注。回答生成Generation当我们检索到了相关知识分块后最后一步就是将用户查询、检索到的知识库文本块一并喂给大模型让大模型利用自身的能力来回答用户的问题了。到这一步其实知识库RAG的工作就结束了。那么为了更好的生成结果我们还能做的有什么呢这里就不过多展开了。效果评估Evaluation评估某种程度上对整个系统的价值起着决定性的作用假设我们要给客户去交付一款知识库问答产品到底用什么指标去衡量效果就成为了验收的关键卡点。但事实上不同的客户和场景对应进行效果评估的评测集、评测模型都是不一样的。这里先推荐几种市面上常见的通用评估指标或框架检索评估评估框架关注指标RAG TRIADRAG三角上下文相关性忠实度答案相关性RAGAS上下文精确率上下文召回率上下文实体召回率噪声敏感度DeepEval上下文精确率召回率相关性等生成评估评估框架关注指标RAGAS答案相关性忠实度多模态忠实度多模态相关性DeepEval答案相关性忠实度等AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2025最新大模型全套学习资源》包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

什么叫高端网站定制郑州自助建站软件

😎 网络资讯 OpenAI发布GPT-5.2。OpenAI推出了GPT-5.2,这是一款面向专业工作的前沿模型,在知识工作、代码编写、长上下文推理、视觉处理以及工具使用方面的表现均优于GPT-5.1。GPT-5.2 Thinking在70.9%的GDPval任务中表现优于或与行业专家相当,在SWE-Bench Pro上达到了55…

张小明 2025/12/27 17:15:49 网站建设

做网站推广的难点、网站视频怎么做

自动化框架的选择直接决定了自动化工作的**落地效率、维护成本和扩展性**。很多团队在自动化初期容易陷入“跟风选择热门框架”的误区,比如盲目使用Selenium做所有UI自动化,或用JMeter做接口自动化却忽略团队技术栈不匹配的问题,最终导致自动…

张小明 2025/12/27 17:15:49 网站建设

4399小游戏网站入口wordpress 打赏不能用

英雄联盟智能助手League Akari:告别繁琐操作的全新游戏体验 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit League Ak…

张小明 2025/12/27 17:15:50 网站建设

wordpress相关网站网页设计公司哪个济南兴田德润实惠吗

热门标题:深度剖析ThreadPoolExecutor七大核心参数:从源码看线程池的智慧设计引言:线程池参数的重要性与复杂性在多线程编程的世界里,线程池无疑是Java并发编程中最重要、最核心的组件之一。ThreadPoolExecutor作为Java标准库中线…

张小明 2025/12/27 17:15:53 网站建设

电商网站建设实验心得1500做图书馆网站模板

【强化学习】第二章:老虎机问题、ε-greedy算法、指数移动平均一、从老虎机问题->强化学习算法1、老虎机问题上图是一组多台老虎机,每台老虎机的特点都各不相同,就是有的机器赢得多,有的机器输得多。但是每台老虎机的特点是固定…

张小明 2025/12/27 17:15:53 网站建设

做网站的公司重庆js网站访问计数

GPT-SoVITS项目GitHub星标破万背后的成功逻辑 在AI语音技术飞速演进的今天,一个开源项目悄然走红:仅用一分钟语音就能克隆出高度逼真的个性化声音——这不再是科幻电影的情节,而是GPT-SoVITS正在实现的现实。它的GitHub仓库星标数迅速突破一万…

张小明 2025/12/27 17:15:52 网站建设