AI智能体产品案例深度思考和分享全球顶级公司实践细节做AI智能体必读 图2:我们执行的评估步骤。 工程师进行快速、粗略的评估以获得方向性度量和判断。标注者提供更详细的反馈但大约需要1天的时间。测试成员是最终的评判者并为我们提供规模性的反馈但单个更改的某些度量可能需要3天以上的时间。
还在死磕的事:端到端自动评估流程以实现更快的迭代。 4. 调用内部API 领英 苏丹电话号码列表 拥有大量关于人、公司、技能、课程等的独特数据这些数据对于构建具有独特和差异化价值的产品至关重要。然而大语言模型LLMs并未经过这些信息的训练因此无法直接用于推理和生成响应。
为了解决这个问题一个标准的做法是设置检索增强生成RAG流程通过该流程调用内部API并将它们的响应注入到后续的大语言模型提示词中以提供额外的上下文来支持生成响应。 这些独特的数据中有很多是通过各种微服务中的远程过程调用RPCAPI在内部公开的。
这些API虽然这对于人类通过编程方式调用非常方便但对于大语言模型来说并不友好。我们通过把这些API“包装”成技能来解决这个问题。每个技能(Skill都包含以下组件: 人类和大语言模型友好的描述:说明API的功能以及何时使用它。