业界动态
如何生成Function Calling微调数据?
2024-12-30 00:52

在function calling微调过程中,模型需要掌握以下关键能力

  1. 准确的***API***选择:识别并选择最合适的API执行用户的查询。这要求模型具备强大的理解能力,能够分析用户的自然语言意图,并从多个可选的API中匹配到最相关的一个或多个。
  2. 精确的参数映射:将用户的自然语言输入映射到所选API的参数中。这一过程要求模型能够处理复杂的嵌套结构、依赖关系等复杂的API调用场景。
  3. 遵循***API***格式:生成的函数调用必须严格遵循API的预定义格式和语法要求,确保函数调用可以被正确执行。
  4. 推理和一致性:在复杂的决策过程中,模型需要能够推理,评估用户的意图和工具的要求,并确保参数选择的准确性和一致性。

接下来,我们将分步骤讲解如何通过数据生成和微调来提升模型在这些方面的表现。

如何提升API选择的准确度

分析用户意图

模型必须具备准确解析用户自然语言的能力,并从中提炼出操作意图。例如,用户可能会说:“帮我查找附近的餐馆。”模型需要知道这与某个地理位置查询API相关,并可能需要调用一个提供附近餐馆的API。

示例 用户输入

 

模型解析意图,确定需要调用一个“餐厅搜索API”,其中包含餐厅类型、位置等参数。

提供合适的API选项

一旦意图被解析出来,模型需要从多样的API列表中选择最合适的。比如,如果有多个API可以执行相似的任务(如Google Maps API、Yelp API等,模型需要能够根据用户的特定要求选择合适的API。

 

此时模型需要判断用户是否需要餐厅的推荐(评价)还是仅需位置信息,进而选择合适的API。

使用合成数据提升API选择

为了提升模型对API选择的敏感度,可以通过生成合成数据集。合成数据集通过创建不同的用户场景来训练模型选择合适的API。比如,生成一些不同问题场景的模拟数据,并让模型通过微调来学会正确的API选择。

例子

  • 场景1:用户询问天气 → 调用天气API
  • 场景2:用户询问路线 → 调用地图API

通过这些合成场景,模型逐渐学习并优化API选择的策略。

如何实现精确的参数映射

简单参数映射

在简单场景下,用户的输入会直接映射到API的参数。例如,用户想搜索一家餐厅,输入中包含餐厅类型和位置信息。模型需要将这些信息直接映射到API的参数中。

示例

 
复杂嵌套结构的处理

有时,API调用需要处理嵌套参数或复杂的数据结构。例如,用户可能会在查询中包含多个条件,如餐厅类型、价格范围、评价等。模型需要能够将这些复杂条件映射到API的嵌套参数中。

示例

 
使用合成API提升参数映射能力

通过创建一些复杂的合成API,并使用合成数据进行训练,可以帮助模型更好地处理嵌套结构和复杂参数。

示例

  • 合成API:search(location, type, rating, price_range) 合成数据:场景1:用户查询餐厅并提供价格范围和评价 场景2:用户查询电影,并提供导演和上映年份

通过多种合成场景,模型能够学习如何处理不同类型的参数映射。

如何保证生成数据与Schema的一致性

定义严格的Schema

为了确保生成的函数调用符合API的预定义格式,需要定义一个严格的Schema。Schema规定了每个API的参数类型、结构以及可能的取值范围。微调过程中,模型需要学会在调用API时严格遵循这些Schema。

示例 Schema

 

生成的数据必须符合这个Schema,例如

 
使用Schema验证生成数据

在训练过程中,所有生成的API调用都需要经过Schema验证,以确保格式的一致性。如果生成的数据不符合Schema要求,则进行修正并反馈给模型。这种反馈机制可以帮助模型逐渐学习如何生成符合格式的数据。

如何确保用户对话与函数调用的一致性

用户意图和API调用的匹配

模型在生成函数调用时,必须确保API调用准确反映用户的意图。为此,可以在训练过程中引入对话数据,并要求模型不仅生成API调用,还要确保API调用能够正确响应用户的需求。

示例

 
使用对话数据进行微调

对话数据是训练function calling模型的重要资源。通过真实的用户对话场景进行训练,可以帮助模型更好地理解用户意图,并生成与之匹配的API调用。

合成API生成与场景设计的几点启发

  1. 合成API的优势

Function calling微调的目标是提升模型的function calling能力,而不是去拟合现有的API。因此,使用合成API进行训练是一种有效的方法。合成API允许开发者根据特定的应用场景设计各种API接口,并在这些接口上进行模型训练。

  1. 如何设计合成API

合成API的设计可以基于特定领域的文本文档,提取不同类型的问题场景。然后,基于这些场景,模型可以思考应对这些场景的API调用形式。

  1. 提升API复杂度

通过调整API的属性字段类型、嵌套关系等,可以进一步提升合成API的复杂度。这能够帮助模型更好地处理复杂的API调用场景。

  1. 生成对话数据

在function calling微调过程中,生成多样化的对话数据至关重要。一个有效的方法是让模型在给定场景下扮演提出问题的用户,然后通过交互生成多样化的对话数据。这可以最大程度保证对话数据的多样性,并帮助模型在更多的场景下进行function calling的训练。

通过以上思路,开发者可以通过合成API和复杂场景的设计,逐步提升大型语言模型的API选择、参数映射、格式一致性和对话匹配能力。这些微调方法能够帮助模型在实际应用场景中表现得更加智能和高效。

今天的内容就到这里,如果老铁觉得还行,可以来一波三连,感谢

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以点击下方链接免费领取🆓

点击领取 《AI大模型&人工智能&入门进阶学习资源包》

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

  • 阶段1:1-2个月,建立AI大模型的基础知识体系。
  • 阶段2:2-3个月,专注于API应用开发能力的提升。
  • 阶段3:3-4个月,深入实践AI大模型的应用架构和私有化部署。
  • 阶段4:4-5个月,专注于高级模型的应用和部署。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码或者点击下方链接免费领取【保证100%免费】

    以上就是本篇文章【如何生成Function Calling微调数据?】的全部内容了,欢迎阅览 ! 文章地址:https://sicmodule.kub2b.com/news/12797.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 https://sicmodule.kub2b.com/mobile/ , 查看更多   
最新文章
盘点2024西安荣耀时刻!“西”引力爆表!
从传统文化的深厚积淀到旅游行业的蓬勃发展从非遗艺术的薪火相传到现代潮流的创新融合……今天,和文旅君一起回顾2024年古都西安
惠山街道2024年工作总结和2025年工作思路
2024年工作回顾2024年惠山街道始终坚持以习近平新时代中国特色社会主义思想为指导,认真落实区委、区政府决策部署,坚持稳中求进
天气|明日“小寒”!最冷“三九”就要来!
今日天气实况今日迎来2025年的首个双休日天气状况还不错天空晴朗,阳光温暖,风力微弱15时全市各区气温在7℃左右明天迎来小寒节
枝江市2025年“十大民生项目”公布!
枝江市第七届人民代表大会第五次会议于2025年1月10日票决产生了枝江市2025年度重大民生实事项目一起来看看↓↓↓一、枝江市枫杨
原来是这样 | 又上热搜!最近很火的“煮苹果水”,到底怎么喝更有用?
鄠邑区是中国科协命名的“全国科普示范区”,为进一步弘扬科学精神、普及科学知识、传播科学思想,鄠邑区科学技术协会联合鄠邑区
惊掉下巴!他俩在一起了???
新发色迎新年 2025鸿运当头拉满仪式感从头开始换个气场NOUGAT ,欧美名媛凯特王妃最爱的纯有机老牌洗护自然原生植萃护不伤头皮、
第一批鸡娃英语的妈妈,都后悔了……
虽然科大大同事们都说不卷,但又悄咪咪卷(啪啪打脸中…)的家长,2年级用上倾听者不算晚!说真的,有了它,吼孩子都少了!产品
发改委:推进户用光伏发展,助力农民拓宽增收新路径
中国产品流通经纪人协会供销合作行业标准《农产品食品供应商信用评价规范》参编单位征集函中国农产品流通经纪人协会供销合作行业
泉州百度爱采购运营介绍
百度爱采购入驻条件有哪些:商家需持有工商行政管理局颁发的营业执照,并且执照在6个月有效期内;厂家商品真实在营且符合国家相
抖音feed是什么 feed广告投放流程
feed是什么?feed流(又称信息流)它是穿插在App内容中的广告,具有原生沉浸式体验,支持多种展现形式。feed可以进行线索收集,