Post-LN Transformer 训练不稳定性的数学分析
MetaGPT Agent 动态 Action 机制详解
概述本文档详细记录了如何在 MetaGPT 框架中实现一个具有动态 Action 创建能力的 Agent。通过本教程,你将深入理解 MetaGPT 的 React 机制(run → react → think → act)以及如何在运行时动态切换 Action 序列。作业目标:创建一个 Agent,初始化时拥有三个动作:Print1, Print2, Print3顺序执行这三个动作执行完毕后,动态生成新的动作:Print4, Print5, Print6继续顺序执行新动作学习重点:MetaGPT 的 React 循环机制状态管理(st...
坐在工位前加班的时候突然想起去年的一些旅行旧事。
坐在工位前加班的时候突然想起去年的一些旅行旧事。去年的十二月底,搭乘全日空从东京经由札幌飞往北海道最北端的小城稚内。天气很不好,在新千岁航站楼的广播里一直在放送欠航预警。延迟了半小时后最终还是冒着风险起飞了,落地稚内的时候已经是下午五点,外面飘着暴雪。我从来没有见过这么厚的雪。即使是在北极,斯瓦尔巴群岛上的极夜里,让人意识到这是在北国之冬的更多也是来自于无言的冰川而非呼啸着的暴风雪。我拖着行李箱在几十厘米深的积雪中艰难地行走,总算到了前几日提前预定的青旅,里面亮着温暖的灯。“チェックインをお願いします”,我推开青旅厚重的铁门,希望能办...
SWE-smith 部署与问题解决技术报告
概述本文记录了在部署和使用 SWE-smith(一个用于生成软件工程任务的工具)过程中遇到的各种技术问题及其解决方案。SWE-smith 是一个复杂的系统,涉及多个组件:bug生成、验证、收集、issue生成等。遇到的问题与解决方案1. Git推送权限问题问题描述:在执行 python -m swesmith.harness.gather 命令时,遇到以下错误:subprocess.CalledProcessError: Command 'git push origin catchorg__Catch2.9b3f508a.func_p...