MetaGPT Agent 动态 Action 机制详解
概述 本文档详细记录了如何在 MetaGPT 框架中实现一个具有动态 Action 创建能力的 Agent。通过本教程,你将深入理解 MetaGPT 的 React 机制(run → react → think → act)以及如何在运行时动态切换 Action 序列。
我的羊听我的声音,我也认识他们,他们也跟着我。—— John 10:27
概述 本文档详细记录了如何在 MetaGPT 框架中实现一个具有动态 Action 创建能力的 Agent。通过本教程,你将深入理解 MetaGPT 的 React 机制(run → react → think → act)以及如何在运行时动态切换 Action 序列。
坐在工位前加班的时候突然想起去年的一些旅行旧事。 去年的十二月底,搭乘全日空从东京经由札幌飞往北海道最北端的小城稚内。天气很不好,在新千岁航站楼的广播里一直在放送欠航预警。 延迟了半小时后最终还是冒着风险起飞了,落地稚内的时候已经是下午五点,外面飘着暴雪。 我从来没有见过这么厚的雪。即使是在北极,斯 …
概述 本文记录了在部署和使用 SWE-smith(一个用于生成软件工程任务的工具)过程中遇到的各种技术问题及其解决方案。SWE-smith 是一个复杂的系统,涉及多个组件:bug生成、验证、收集、issue生成等。
本文详细记录了针对 DeepSeek-Coder-7B-base-v1.5 模型,结合 HuatuoGPT 医疗对话数据进行 SFT(Supervised Fine-Tuning) 的全过程。记录从最初设计到逐步调试的每一步,包括所做的改动、背后的原因、遇到的问题、解决方案以及最终结果。
📋 项目概述 本文记录了一次完整的医疗AI模型评估系统搭建过程,涉及将自训练的Medical GPT模型接入HealthBench评估框架,并使用DeepSeek Chat作为评分器的完整技术实现。
项目概述 本项目基于 DeepSeek-Coder-7B-Base-v1.5 模型,使用华佗医疗问答数据集进行增量预训练,旨在提升模型在医疗领域的问答能力。采用 LoRA (Low-Rank Adaptation) 技术进行参数高效微调。 技术栈 基础模型: …
项目概述 本文档记录了在 RTX 5090 GPU 环境下搭建 MedicalGPT 预训练环境并成功完成训练的完整过程。项目基于 Qwen2.5-0.5B 模型,使用 LoRA (PEFT) 方法进行预训练。 环境信息 操作系统: Linux 5.15.0-94-generic GPU: …
在 LLM Agent 训练中,有时存在需要通过代码行号进行补全的方法。 这个脚本给任意给定的代码行统一添加代码行号。 import json import re import argparse def add_line_numbers_to_input(input_jsonl_path, …
和狗子出来玩 偶遇一群跑出来吃草的小动物 不知道是🪿还是🦆 但非常塔诺西🥹 ps. 长沙夏天就是太热了。我俩跑到烈士公园的麦当劳坐到下午六点才敢出去… 说好如果有时间的话冬天再来一次
在修复代码 bug 的 Agent check_list 策略中,一个基本的三步方法如下: LLM 阅读给定代码块,根据给定的参考错误列表找到于 bug 描述相对应的有问题的**“代码行号”**。 根据有问题的**“代码片段”**,判断代码片段是否确实违反代码规范,以 0(正确)和 1(错误)表示。 …