Blade 全家桶 1.0 — Bug 清单

来源:飞书聊天记录(2026-06-15 ~ 2026-06-29)· 产品研发群 / 西安创新特区群

已修 进行中 待修 无法复现

平台稳定性 / 基础设施

FD (文件描述符) 泄露导致服务卡死

已修

Docker sock 访问没释放把 FD 占满;修好 Docker 后又转为 SQLite 访问占 FD。FD 默认值 1024 太小,建议调到 20 万+。监控 3 小时后 FD 数量不再增长。

报告人:朱里、作者 · 6/23

线上服务靠周期性重启维持生命

已修

线上 BA 卡死,需定期重启。根因为 FD 泄露 + SQLite 并发问题。

报告人:作者 · 6/23

SQLite + CPython 线程模型在高并发下不稳定

待修

SQLite 单连接在 CPython GIL 下本质是单线程的,BA 服务有一定并发强度时容易炸雷。朱里建议评估是否需要替换数据库方案。

报告人:朱里 · 6/23

Milvus 日志写了 93G,撑满磁盘

已修

/data 目录满了导致 SQLite 落盘失败。临时截断日志释放 88G 空间。需要给 Docker compose 加 log driver 滚动切片配置。

报告人:汪从武 · 6/23

Docker 容器缺少 log driver 切片配置

待修

docker compose 的容器没有 log driver 切片配置,日志无法滚动删除,会持续膨胀直到磁盘占满。

报告人:朱里 · 6/23

服务器磁盘空间不足(100G / 20G)

已修

100G 数据盘太小,几个镜像就满了。系统盘从 20G 扩到 59G 解决。docker var lib 目录需软链到其他盘。

报告人:朱里、作者 · 6/23 ~ 6/28

桌面背景图片 9.4MB 导致加载慢

已修

服务器带宽有限,9.4MB 的背景图打开要好几秒。已压缩至 400K。

报告人:戴振衡 · 6/23

box-deploy 部署产物里所有服务都是 host 网络

待修

突然发现 box-deploy 部署产物里所有服务都用了 host 网络模式,存在安全与端口冲突隐患。

报告人:作者 · 6/28

多组件版本不兼容导致全崩

待修

blade-agent, skill-registry, blade-oauth 必须一起更新,因为 blade-oauth 换了 PAT 生成方式,单独更新会导致全部服务崩溃。缺少版本兼容性检查机制。

报告人:作者 · 6/28

blade-agent 安装和 checklist 之间缺少延时

已修

blade-agent 部署时安装和 checklist 检查之间没有加延时,导致启动失败。已加延时。

报告人:张通 · 6/23

Blade Agent (BA)

线上 blade-agent 不响应

已修

线上 BA 服务完全无响应,FD 泄露和 SQLite 连接问题为根因。

报告人:颜丙政 · 6/17 | PR #967

用户消息在流式阶段有时显示两次

待修

用户发送的消息在流式输出时偶尔会渲染两遍。

报告人:作者 · bug 清单文档

前端调用工具时页面反复上下跳动

已修

智能体调用工具的时候前端页面会反复上下跳动。已修复。

报告人:作者 · 6/18

前端渲染竞态,报错一闪即逝

待修

前端存在渲染竞态条件,报错信息闪一下就消失了,用户难以捕捉。

报告人:作者 · 6/25

复制粘贴后换行格式丢失

待修

从对话框复制内容进出后,换行等格式没有保留,全变成隔行空行。

报告人:朱里 · 6/18

BA 生成的文件带额外换行符和空格

待修

由 BA 写出的很多文件经常会带额外的换行符和空格。可能与 122B 模型写中英文连接时加空格有关。

报告人:朱里 · 6/18

Git Bash Win11 下启动 BA 目录树 tab 权限拒绝

待修

小问题,git bash Win11 下启动 BA,目录树 tab 显示权限拒绝,不影响总体使用。

报告人:朱里 · 6/18

Markdown 渲染中 tag 可读性差

已修

旧布局中 markdown 渲染的各种 tag 可读性差。已换新 markdown 渲染库修复。

报告人:成员 A · 6/22

思考过程不再逐步显示,一次性全部出来

待修

思考过程不一点点显示了,直接最后一下全部出来。

报告人:朱昭 · 6/28

Auth 相关

Mock User 模式下 BA 和 SR 的 API Key 不互认

待修

Mock User 模式下,Blade Agent 和 Skill Registry 的 API Key 不互认,导致鉴权失败。

报告人:李博文 · bug 清单文档

应该自动创建 token、gitea host、gitea token

待修

初始化时需要手动配置 token 和 gitea 相关信息,应自动创建。

来源:bug 清单文档

软件工厂 v3

项目初始化上传 md 需求文档后文件找不到

待修

项目初始化上传 md 需求文档,有时(似乎非必现)会发现文件并不在。且之后在会话里主动上传 md,还是报找不到。

报告人:朱里、成员 A · 6/29

智能体无法找到 skill、下载

待修

软件工厂里面的智能体无法找到 skill、下载。在 hub 侧通过 zip 包安装技能并在 BA 已验证可用,但软件工厂侧未走通。技能下载是样板间工程的刚需。

报告人:朱里 · 6/29

需求文件 404(沙盒回收导致文件丢失)

已修

prd.md 加载失败 HTTP 404。原因是读的沙盒里面的文件,沙盒被回收了。已改到 fallback 路径,不会被回收,但长期方案待定。

报告人:戴振衡、作者 · 6/23 | Issue #976

去掉 HOME/项目名称的认知,避免写错文件目录

待修

软件工厂 v3 需要去掉 HOME/项目名称 的认知,避免智能体写错文件目录。

来源:bug 清单文档

删除项目后无法再创建同名项目

待修

软件工厂删除了项目后不能再创建同名项目,系统内的同名工作空间文件夹没有被清理。

报告人:成员 B · 6/28

软件工厂展开后工作空间不完整

待修

软件工厂展开进来后看到的工作空间不完整,点开"我的文件"能查看到更多信息。

报告人:成员 B · 6/25

点击任务进度列表后返回会跳到 projects 列表

待修

点击任务进度列表然后再返回,就回到了 projects 列表而非之前的页面。

报告人:肖小智 · 6/28

打开 html 不能预览,服务疑似挂掉

待修

打开 html 不能预览,像是服务挂了一样,不仅不能预览,啥也干不了。

报告人:成员 B · 6/25

生成代码默认联网导致缺库

已修

生成代码里默认联网导致两个 block bug:leaflet js 缺库(需本地 npm install)、瓦片服务默认用了 OSM(需改用本地服务)。已引导 AI 解决。

报告人:朱里 · 6/28

首页不显示项目

已修

想换个镜像 fix 首页不显示项目的问题。

报告人:汪从武 · 6/26

Skill Hub / 编辑器

点击"参考历史经验"不跳转至记忆管理

已修

点击参考历史经验后不会直接跳转至记忆管理,需再点"查看全部经验"才会跳转。

报告人:成员 A · 6/25

Skill 编辑器缺少文件级 checkpoint 机制

进行中

模仿 Claude Code 搞文件级别的 checkpoint,仅在 Skill 编辑器中先开启。每次智能体编辑后自动存副本,可随时回退。注意磁盘写入量不能太大。

报告人:成员 A、戴振衡 · 6/25

页面抛调用栈但对话能继续

无法复现

页面抛出调用栈异常但继续对话还能聊,可能是网络抖动/流式断流/LLM 空响应之类的。需更多信息 debug。

报告人:成员 A · 6/25

预览模式看不到修改后的文件

已修

现在 write/edit 方法执行完右侧预览立即刷新,不用人工操作就能看到最新代码。

报告人:成员 A · 6/25

改名后检索不到 / 补全不到

已修

现在改名后可以检索到,补全也能补全到。

报告人:成员 A · 6/25

Skill 编辑只有发布才提交版本

待修

目前 skill 编辑就是只有发布才会提交一个版本,这个操作需要用户手动触发。应增加自动 checkpoint。

报告人:成员 A · 6/25

Skill Hub 中 skill 搜索不到

已修

用 CLI 来检索使用 skill,重试次数已经减少,稳定性改善。

报告人:成员 A · 6/25

部署 / 配置

npm / pypi 源配置需验证

待修

再次确认 npm、pypi 源配置是否正确,离线能否下载到包。

来源:bug 清单文档

.agent、.blade 等目录位置需检查

待修

再次检查 .agent、.blade 等目录的位置是否合理。

来源:bug 清单文档

升级时配置(模型 API base/key)未同步

已修

配置里模型的 API base 和 key 用了旧值没改,导致更新后服务异常。

报告人:朱里 · 6/28

目录下载功能有问题

待修

文件夹整体下载有问题,需要逐个文件下载作为临时方案。

报告人:戴振衡 · 6/29

模型 / 推理相关

122B 模型中英文连接处加空格

待修

盒子里面的 122B 模型在写中英文连接的时候会加空格,导致生成文件格式异常。

报告人:作者 · 6/18

vllm-ascend 思考模式相关的参数空格问题

已修

vllm-ascend v0.18.0 支持关闭思考模式后,qwen3.5-122B-A10B 传参加空格的问题消失。但思考模式下模型能力弱、速度只有 20tps,且有时候会跳过工具调用。

报告人:牛泽瀚 · 6/26

场内模型慢,软件工厂吃力

待修

厂内模型慢,跑软件工厂比较吃力,一个任务可能跑几十分钟。模型写文件时会卡很久。

报告人:朱里、戴振衡 · 6/28

对话过程中总有小 bug,无法全程无伤

待修

使用 ds4p 模型七八次实验(每次 8-12 分钟),没有一次全程无伤。总会有一点点小 bug,再说一两句话就能修好。平台稳定性需更多信息来 debug。

报告人:朱里 · 6/23