Shiranai

MetaGPT Agent 动态 Action 机制详解

09/11/2025 · 开发随想

概述本文档详细记录了如何在 MetaGPT 框架中实现一个具有动态 Action 创建能力的 Agent。通过本教程，你将深入理解 MetaGPT 的 React 机制（run → react → think → act）以及如何在运行时动态切换 Action 序列。

坐在工位前加班的时候突然想起去年的一些旅行旧事。

24/08/2025 · 胡言

坐在工位前加班的时候突然想起去年的一些旅行旧事。去年的十二月底，搭乘全日空从东京经由札幌飞往北海道最北端的小城稚内。天气很不好，在新千岁航站楼的广播里一直在放送欠航预警。延迟了半小时后最终还是冒着风险起飞了，落地稚内的时候已经是下午五点，外面飘着暴雪。我从来没有见过这么厚的雪。即使是在北极，斯 …

SWE-smith 部署与问题解决技术报告

21/08/2025 · 开发随想

概述本文记录了在部署和使用 SWE-smith（一个用于生成软件工程任务的工具）过程中遇到的各种技术问题及其解决方案。SWE-smith 是一个复杂的系统，涉及多个组件：bug生成、验证、收集、issue生成等。

DeepSeek + HuatuoGPT SFT 调试全记录

10/08/2025 · 开发随想

本文详细记录了针对 DeepSeek-Coder-7B-base-v1.5 模型，结合 HuatuoGPT 医疗对话数据进行 SFT（Supervised Fine-Tuning）的全过程。记录从最初设计到逐步调试的每一步，包括所做的改动、背后的原因、遇到的问题、解决方案以及最终结果。

HealthBench评估系统配置实战：从零到完整部署

10/08/2025 · 开发随想

📋 项目概述本文记录了一次完整的医疗AI模型评估系统搭建过程，涉及将自训练的Medical GPT模型接入HealthBench评估框架，并使用DeepSeek Chat作为评分器的完整技术实现。

DeepSeek 7B + 华佗医疗数据集增量预训练技术笔记

06/08/2025 · 开发随想

项目概述本项目基于 DeepSeek-Coder-7B-Base-v1.5 模型，使用华佗医疗问答数据集进行增量预训练，旨在提升模型在医疗领域的问答能力。采用 LoRA (Low-Rank Adaptation) 技术进行参数高效微调。技术栈基础模型: …

MedicalGPT 预训练环境搭建与训练完整工作日志

06/08/2025 · 开发随想

项目概述本文档记录了在 RTX 5090 GPU 环境下搭建 MedicalGPT 预训练环境并成功完成训练的完整过程。项目基于 Qwen2.5-0.5B 模型，使用 LoRA (PEFT) 方法进行预训练。环境信息操作系统: Linux 5.15.0-94-generic GPU: …

一个将代码块统一添加代码行号的脚本

03/08/2025 · 开发随想

在 LLM Agent 训练中，有时存在需要通过代码行号进行补全的方法。这个脚本给任意给定的代码行统一添加代码行号。 import json import re import argparse def add_line_numbers_to_input(input_jsonl_path, …

楽しい！

03/08/2025 · 胡言

和狗子出来玩偶遇一群跑出来吃草的小动物不知道是🪿还是🦆 但非常塔诺西🥹 ps. 长沙夏天就是太热了。我俩跑到烈士公园的麦当劳坐到下午六点才敢出去… 说好如果有时间的话冬天再来一次

数据处理之从代码行号反向爬取代码片段

02/08/2025 · 开发随想

在修复代码 bug 的 Agent check_list 策略中，一个基本的三步方法如下： LLM 阅读给定代码块，根据给定的参考错误列表找到于 bug 描述相对应的有问题的**“代码行号”**。根据有问题的**“代码片段”**，判断代码片段是否确实违反代码规范，以 0（正确）和 1（错误）表示。 …