重庆做企业年报在哪个网站做大连网红打卡地

张小明 2025/12/27 21:26:12
重庆做企业年报在哪个网站做,大连网红打卡地,国内比较好用的建筑案例网站,wordpress免费企业网站随着能够处理复杂任务的大型语言模型#xff08;LLM#xff09;的崛起#xff0c;上下文工程受到了广泛关注。最初#xff0c;关于这一话题的讨论大多围绕提示工程展开#xff1a;为单一任务调整单个提示以获得最佳性能。然而#xff0c;随着LLM能力的增强#xff0c;提…随着能够处理复杂任务的大型语言模型LLM的崛起上下文工程受到了广泛关注。最初关于这一话题的讨论大多围绕提示工程展开为单一任务调整单个提示以获得最佳性能。然而随着LLM能力的增强提示工程已经演变为上下文工程优化输入LLM的所有数据以在复杂任务上实现最大性能。本文将深入探讨智能体上下文工程即专门为智能体优化上下文。这与传统的上下文工程不同因为智能体通常需要执行更长时间的任务序列。鉴于智能体上下文工程是一个广泛的话题本文将深入探讨以下列出的主题并撰写后续文章涵盖更多内容。具体的上下文工程技巧缩短/总结上下文工具使用在深入探讨上下文工程的具体细节之前首先说明为什么智能体上下文工程很重要。我将从两个方面进行阐述为什么使用智能体为什么智能体需要上下文工程为什么使用智能体首先我们使用智能体是因为它们比静态的LLM调用更能胜任某些任务。智能体可以接收用户的查询例如修复这个用户报告的Bug {bug报告}。这在单次LLM调用中是不可行的因为你可能需要更好地理解Bug也许需要询问报告Bug的人需要理解Bug出现在代码的哪个位置并且可能需要获取一些错误信息。这就是智能体的用武之地。智能体可以查看Bug调用工具向用户提出后续问题例如这个Bug发生在应用程序的哪个位置然后智能体可以在代码库中找到该位置运行代码以读取错误日志并实施修复。所有这些都需要在解决问题之前进行一系列的LLM调用和工具调用。为什么智能体需要上下文工程现在我们知道了为什么需要智能体但为什么智能体需要上下文工程呢主要原因是当LLM的上下文包含更多相关信息且噪音不相关信息更少时其性能总是更好。此外当智能体执行一系列工具调用时例如在发生Bug时获取错误日志其上下文会迅速累积。这会导致上下文膨胀即LLM的上下文包含大量不相关信息。我们需要从LLM的上下文中移除这些噪音信息并确保所有相关信息都存在于LLM的上下文中。具体的上下文工程技巧智能体上下文工程建立在传统上下文工程的基础之上。因此我提出几个改进上下文的重要点少样本学习结构化提示逐步推理这些是上下文工程中常用的三种技术通常能提高LLM的性能。少样本学习少样本学习是一种常用方法即在你将任务交给智能体执行之前提供类似任务的示例。这有助于模型更好地理解任务通常能提高性能。下面你可以看到两个提示示例。第一个示例展示了一个零样本提示我们直接向LLM提问。考虑到这是一个简单的任务LLM很可能得出正确答案然而对于更困难的任务少样本学习会有更大的效果。在第二个提示中你可以看到我提供了几个如何计算数学的例子这些例子也用XML标签包裹。这不仅帮助模型理解它正在执行什么任务还有助于确保答案格式的一致性因为模型通常会以与少样本示例中提供的相同格式进行响应。# zero-shotprompt123150等于多少# few-shotprompt example1020等于多少 - 30 /example example12070等于多少 - 190 /example 123150等于多少 结构化提示拥有结构化提示也是上下文工程中极其重要的一部分。在上面的代码示例中你可以看到我使用了example … /example这样的XML标签。你也可以使用Markdown格式化来增强提示的结构。我经常发现先写一个提示的总体大纲然后将其输入LLM进行优化和适当的组织是设计良好提示的好方法。你可以使用指定的工具进行提示优化也可以简单地将非结构化的提示输入ChatGPT并要求它改进你的提示。此外如果你描述当前提示在哪些情况下遇到困难你会得到更好的提示。例如如果你有一个数学智能体在加法、减法和除法方面表现很好但在乘法方面有困难你应该将这些信息添加到你的提示优化器中。逐步推理逐步推理是另一种强大的上下文工程方法。你提示LLM在尝试解决问题之前先一步一步地思考如何解决问题。为了获得更好的上下文工程效果你可以将本节涵盖的所有三种方法结合起来如下例所示# few-shot structured step-by-step reasoningprompt example1020等于多少 - 为了回答用户的请求我必须把这两个数字加起来。我可以这样做先加每个数字的最后两位000。然后我再把最后两位加起来得到123。答案是30 /example example12070等于多少 - 为了回答用户的请求我必须从后往前把数字加起来。我从000开始。然后做279最后做101。答案是190 /example 123150等于多少 这将有助于模型更好地理解示例通常能进一步提高模型性能。缩短上下文当你的智能体已经运行了几个步骤例如请求用户输入、获取一些信息等你可能会遇到LLM上下文填满的情况。在达到上下文限制并丢失所有超过此限制的令牌之前你应该缩短上下文。总结是缩短上下文的好方法然而总结有时会切掉上下文的重要部分。你的上下文的前半部分可能不包含任何有用信息而后半部分则包含几个必需的段落。这也是智能体上下文工程困难的部分原因。为了执行上下文缩短你通常会使用另一个LLM我将其称为缩短LLM。这个LLM接收上下文并返回其缩短版本。缩短LLM最简单的版本只是总结上下文并返回。但是你可以采用以下技术来改进缩短效果确定是否可以将上下文的某些完整部分切除特定文档、先前的工具调用等一个为分析当前任务而优化的提示调优缩短LLM它能考虑所有可用相关信息并仅返回与解决任务相关的信息确定是否可以切除完整部分在尝试缩短上下文时你应该做的第一件事是找到可以完全切除的上下文区域。例如LLM之前可能获取了一个用于解决先前任务的文档并且你已经有了任务结果。这意味着该文档不再相关应该从上下文中移除。如果LLM获取了其他信息例如通过关键词搜索并且LLM自己总结了搜索的输出也可能发生这种情况。在这种情况下你应该从上下文中移除旧的搜索输出。简单地移除这些完整的上下文部分可以大大缩短上下文。然而你需要记住移除可能在以后任务中相关的上下文可能不利于智能体的性能。因此正如某机构在他们的上下文工程文章中所指出的那样你应该首先优化召回率确保LLM缩短器永远不会移除未来相关的上下文。当你达到近乎完美的召回率时可以开始关注精确率即逐步移除与解决当前任务不再相关的上下文。提示调优的缩短LLM我还建议创建一个提示调优的缩短LLM。为此你首先需要创建一个上下文测试集以及给定当前任务所需的缩短上下文。这些示例最好是从与你的智能体的真实用户交互中获取。接下来你可以针对总结LLM上下文的任务进行提示优化甚至微调缩短LLM以保留上下文的重要部分同时移除不再相关的其他部分。工具区分智能体与一次性LLM调用的主要点之一在于它们对工具的使用。我们通常为智能体提供一系列工具以增强其解决任务的能力。这类工具的示例包括对文档语料库执行关键词搜索根据电子邮件获取用户信息将数字相加的计算器这些工具简化了智能体必须解决的问题。智能体可以执行关键词搜索以获取额外的通常是必需的信息或者可以使用计算器将数字相加这比使用下一个令牌预测来相加数字要一致得多。在将工具置于智能体的上下文中时请记住一些技术以确保正确的工具使用描述清晰的工具人类能理解吗创建特定的工具避免膨胀仅显示相关工具信息丰富的错误处理描述清晰的智能体工具第一个也可能是最重要的注意事项是让系统中的工具描述清晰。你定义的工具应该为所有输入参数和返回类型提供类型注释。它还应该有一个好的函数名和文档字符串中的描述。下面你可以看到一个糟糕的工具定义与一个好的工具定义的示例# 糟糕的工具定义defcalculator(a,b):returnab# 良好的工具定义defadd_numbers(a:float,b:float)-float:将两个数字相加的函数。在你需要将两个数字相加的任何时候使用。 参数 a: float b: float 返回值 float returnab上面代码中的第二个函数更容易让智能体理解。正确描述工具将使智能体更擅长理解何时使用该工具以及何时其他方法更好。描述清晰的工具的衡量标准是一个以前从未见过这些工具的人类仅通过查看函数及其定义就能理解这些工具吗特定工具你还应尝试使你的工具尽可能具体。当你定义模糊的工具时LLM很难理解何时使用该工具并确保LLM正确使用它。例如与其为智能体定义一个从数据库获取信息的通用工具不如提供提取特定信息的具体工具。糟糕的工具从数据库获取信息输入要检索的列用于查找信息的数据库索引更好的工具从数据库获取所有用户的信息无输入参数获取属于给定客户ID的按日期排序的文档列表获取所有用户及其过去24小时内所采取操作的聚合列表然后当你看到需要时可以定义更具体的工具。这使得智能体更容易获取相关信息到其上下文中。避免膨胀你还应不惜一切代价避免膨胀。对于函数有两种主要方法可以实现这一点函数应返回结构化输出并可选择性地仅返回结果的子集避免不相关的工具对于第一点我将再次使用关键词搜索的例子。在执行关键词搜索时例如针对某中心的Elastic Search你会收到大量信息有时结构不那么清晰。# 糟糕的函数返回defkeyword_search(search_term:str)-str:# 执行关键词搜索# 结果 [{id: ..., content: ..., createdAt: ..., ...}, {...}, {...}]returnstr(results)# 良好的函数返回def_organize_keyword_output(results:list[dict],max_results:int)-str:output_stringnum_resultslen(results)fori,resinenumerate(results[:max_results]):# 最多返回 max_results 个结果output_stringf文档编号{i}/{num_results}. ID: {res[id]}, 内容: {res[content]}, 创建于: {res[createdAt]}returnoutput_stringdefkeyword_search(search_term:str,max_results:int)-str:# 执行关键词搜索# 结果 [{id: ..., content: ..., createdAt: ..., ...}, {...}, {...}]organized_results_organize_keyword_output(results,max_results)returnorganized_results在糟糕的示例中我们只是将关键词搜索返回的原始字典列表字符串化。更好的方法是使用一个单独的辅助函数将结果组织成结构化的字符串。你还应确保模型可以仅返回结果的子集如max_results参数所示。这对模型有很大帮助特别是对于像关键词搜索这样的函数它可能潜在地返回数百个结果并立即填满LLM的上下文。我的第二点是关于避免不相关的工具。你可能会遇到很多工具的情况其中许多工具只会在特定步骤中对智能体相关。如果你知道某个工具在给定时间对智能体不相关你应该将该工具排除在上下文之外。信息丰富的错误处理在为智能体提供工具时信息丰富的错误处理至关重要。你需要帮助智能体理解它做错了什么。通常Python提供的原始错误消息冗长且不易理解。以下是工具中错误处理的一个好例子其中智能体会被告知错误是什么以及如何处理。例如当遇到速率限制错误时我们告诉智能体在重试之前要休眠。这极大地简化了智能体的问题因为它不需要自己推理必须休眠。defkeyword_search(search_term:str)-str:try:# 关键词搜索results...returnresultsexceptrequests.exceptions.RateLimitErrorase:returnf速率限制错误:{e}。你应该在重试前运行 time.sleep(10)。exceptrequests.exceptions.ConnectionErrorase:returnf发生连接错误:{e}。网络可能已断开请使用 inform_user 函数通知用户此问题。exceptrequests.exceptions.HTTPErrorase:returnf发生HTTP错误:{e}。函数因HTTP错误而失败。这通常是由于访问问题引起的。请在使用此函数之前确保已进行验证exceptExceptionase:returnf发生意外错误:{e}你应该为所有函数设置这样的错误处理并记住以下几点错误消息应能说明发生了什么如果你知道特定错误的解决方法或潜在的解决方法请告知LLM在发生错误时如何行动例如如果是速率限制错误告诉模型运行 time.sleep()智能体上下文工程的未来发展在本文中我涵盖了三个主要主题具体的上下文工程技巧、缩短智能体的上下文以及如何为智能体提供工具。这些都是构建优秀AI智能体需要理解的基础主题。还有一些进一步的课题你应该了解更多例如预计算信息或推理时信息检索的考虑。我将在未来的文章中讨论这个话题。智能体上下文工程将继续成为一个极其相关的主题理解如何处理智能体的上下文对于未来AI智能体的发展至关重要。更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

国外优秀flash网站网站建设与网页设计大作业

Gitee崛起:中国开发者为何正在集体转向本土代码托管平台? 在全球开源生态中,GitHub长期占据主导地位,但近年来一个显著变化正在中国开发者社区发生。随着国产代码托管平台Gitee的快速成长,越来越多的国内开发者开始将目…

张小明 2025/12/27 21:25:41 网站建设

网站开发报价清单lens wordpress

从 NIS 过渡到 LDAP:全面指南 在当今的网络环境中,从网络信息服务(NIS)过渡到轻量级目录访问协议(LDAP)是一个常见的需求。这种过渡可以提高系统的安全性、可扩展性和管理效率。本文将详细介绍从 NIS 到 LDAP 过渡的任务、先决条件、设置步骤以及最佳实践。 任务概述 …

张小明 2025/12/27 21:25:09 网站建设

城口网站建设wordpress分类目录网站主题

Unity作为全球最流行的游戏开发引擎之一,其许可证验证机制常常给开发者带来困扰。UniHacker作为一款专业的跨平台Unity许可证验证处理工具,能够帮助开发者轻松解决这一问题。本文将为您提供从基础操作到高级技巧的完整指导。 【免费下载链接】UniHacker …

张小明 2025/12/27 21:24:37 网站建设

在百度搜不到网站wordpress数据库内容

第一章:Open-AutoGLM部署概述Open-AutoGLM 是一个开源的自动化通用语言模型部署框架,专为简化大语言模型在生产环境中的集成与运维而设计。它支持多种后端推理引擎、灵活的调度策略以及可扩展的插件体系,适用于从实验验证到企业级服务的全链路…

张小明 2025/12/27 21:24:05 网站建设

没有内容的网站应该怎么做网站建设需要什么条件

终极免费方案!SeedVR视频修复工具让模糊老片秒变4K高清 【免费下载链接】SeedVR-7B 项目地址: https://ai.gitcode.com/hf_mirrors/ByteDance-Seed/SeedVR-7B 还在为那些模糊不清的老视频而烦恼吗?婚礼录像、毕业典礼、家庭聚会……这些珍贵的记…

张小明 2025/12/27 21:23:33 网站建设

网站重新搭建程序要多少钱工业互联网平台评价方法

关于数学公理浅谈公理是数学推理的起点——它们不被证明,但被当作构建整个理论体系的基础规则。只要这些规则自洽(不自相矛盾),就能发展出丰富而严谨的数学世界。什么是公理?简单说,数学体系中公理就是&…

张小明 2025/12/27 21:23:02 网站建设