文艺b抑郁的理由

晚上在SNS上听到这首《文艺b抑郁的理由》,突然意识到自己一个多月里除了要grok帮我生成了几篇18+短文之外,竟再没写过多少东西。 想起还是打开了Notepad++,顺手写点碎碎念,某种程度上也是拯救一下自己愚笨的灵魂。

写于鸭绿江旁

从大连一路夜行到中朝边界,4个小时的高速路上几乎没有看到几辆车。 出发的时候车库的姐姐和我说外头刚下了雪,路可能很滑,开长途务必多小心。 我感激于她的关心,低头和她说我会多加注意的。

关于爱、死亡和机器人

不知是不是因为人生来到第23个年头,亦或许是因为工作的缘故思考了关于太多AI和智能体的内容,我逐渐越来越意识到关于爱、死亡和机器人,他们也许在某种程度上是一件事。 从生成式大语言模型第一次出现在公众视野并开始井喷式发展以来,我始终抱着带着些许荒谬感的期待:也许在“伴侣”这个位置上,AI会比人整体而言 …

夜祷词

Would that I be faithful in faith, diligent in diligence, and charitable in charity. Wherefore be Thou my help, O Lord.

Dynamic Construction of Causal Knowledge Graphs for Scientific Reasoning in Search Agents

rp.pdf

Tongyi DeepResearch 技术报告深度分析

一、论文基本信息 标题: Tongyi DeepResearch Technical Report 作者: Tongyi DeepResearch Team(通义深度研究团队),来自阿里巴巴集团的通义实验室 发表平台: arXiv预印本 发表日期: 2025年11月5日(最新版本)

直接偏好优化(DPO)

proof_dpo.pdf

谈 Keir Starmer

我对英格兰没什么意见,甚至某种程度上很喜欢这个国家,虽然也许苏威爱三国更适合人居住。 但 Starmer 就是 de facto 自 Theresa May 以后最烂的 PM,这人太痴迷于自己的cakeism了,路线场面左右摇摆,弄得整个社会也一起跟着他的总路线动摇。

从强化学习到近端策略优化(PPO)

proof.pdf

Post-LN Transformer 训练不稳定性的数学分析

pre-post-LN-proof.pdf