标签

LLM

从零搭 RAG 太折腾?pgEdge RAG Server 把检索、融合、流式全打包了

来源:postgr.es 33
如果你最近访问过 docs.pgedge.com,大概率已经碰到了 Ellie——一个只从文档里找答案、不瞎编的 AI 助手。问她"多主复制怎么配"或"MCP Server 监听哪个端口",她会把相关文档片段拉出来拼成上下文,再交给 LLM 生成带来源引用的回答。Ellie 不是魔法,它背后跑的就是 pgEdge 刚开放出来的 RAG Server:一...

从 AdventHealth 的实践看:医疗场景如何用 LLM 减负增效

来源:openai.com 30
AdventHealth 是美国大型医疗系统,覆盖佛罗里达等多州数十家医院。他们最近把 OpenAI 的 ChatGPT for Healthcare 引入临床和行政流程,目标很明确——把医护人员从文书、排班、信息检索这类重复劳动里拽出来,让更多时间回到患者身上。这不是一个"未来愿景"式的发布,而是已经在跑的生产级部署。 医护人员的行政负担不是抽象概念...

Google 搜索框的"信息 Agent"时代:从链接列表到意图追踪

来源:oschina.net 36
25 年来,Google 搜索框的交互范式几乎没变——输入关键词,拿到十条蓝色链接,自己挑。但在 Google I/O 2026 上,Google 搜索主管 Liz Reid 宣布了一场内部称为"25 年来最大变化"的全面升级:搜索框不再只返回链接,而是理解意图、构建个性化体验,并在后台持续追踪信息变化。核心词是"AI 驱动的交互体验",底层形态是"信...

当 AI 能"氛围编程"时,我为什么还坚持写代码

来源:oschina.net 27
"Vibe Code"——氛围编程——最近在开发者圈子里火得不像话。每次新模型发布,社交媒体上就涌出一波宣言:LLM 将消除软件开发的一切摩擦,人类只需"思考",代码自然流出。听起来很美。但我没法认同,因为我本身就不进行氛围编程。 这不是对 AI 的否定。我在日常开发中大量使用 LLM,但用法和"氛围编程"截然不同。区别在哪?让我拆开来说。 氛围编程的...

在 Kubernetes 上把 LLM 冷启动压到 30 秒——网易游戏的实战路径

来源:cncf.io 32
弹性扩容听起来很美:流量来了就加 Pod,流量走了就缩容。但把这套逻辑搬到 LLM 推理服务上,现实会给你一记闷棍——模型权重动辄几十 GB,Pod 从零到可用,数据搬运的时间远比计算调度慢。网易游戏在生产环境中把这个冷启动过程压到了 30 秒,核心认知只有一句:弹性计算只有在数据能同等速度移动时才有意义。 一个典型 LLM 推理 Pod 的冷启动链路...

Android CLI 重装上阵:Google 把构建工具链改成了 AI Agent 的原生接口

来源:infoq.com 18
Android 开发者对 Gradle 构建慢、命令行输出难解析、工具链碎片化这些痛点并不陌生。对人类工程师来说,忍一忍还能手动排查;但对 AI Agent 而言,一条输出格式不稳定的命令就可能让整个自动化流程卡死。Google 最近推出的全新 Android CLI 和配套的"结构化技能"体系,本质上是在做一件事——把 Android 工具链从"人勉...

Tails 7.8:Tor 浏览器升级,Thunderbird 正式移除

来源:oschina.net 20
Tails 7.8 带来了一个值得注意的变化——Thunderbird 邮件客户端不再预装。对于依赖 Tails 处理加密邮件的用户,这改变了日常工作流。好消息是迁移路径已经铺好,配合持久化存储的附加软件功能,Thunderbird 可以无缝回归。 Tor 浏览器从旧版本升级到 15.0.14,这是常规的安全与稳定性更新。每次 Tails 版本迭代中,...

当 IDE 变成聊天窗口:Antigravity 2.0 为何激怒开发者

来源:oschina.net 26
Google 的 Antigravity 2.0 更新上线后,Reddit 的 r/google_antigravity 板块炸了锅。一位匿名开发者直呼这次更新是"灾难"——更新完成后,他熟悉的终端、源代码管理面板、文件树全部消失,整个工作区被替换成一个聊天界面风格的"智能体管理器"(Agent Manager)。写代码不再是打开编辑器敲键盘,而是对着...

Agent 前端的流式困境与 VAPD AgentKit 的解法

来源:my.oschina.net 28
做 Agent 产品的人大概都踩过同一个坑:后端换了协议,前端就要重写渲染逻辑。OpenAI 用 SSE,Anthropic 用自己的 event stream,自研模型可能直接推 WebSocket frame——每种后端的事件格式、分帧规则、工具调用信令都不一样。前端如果逐个适配,代码很快就会变成一坨协议耦合的意大利面条。 VAPD AgentKi...

VS Code 1.121:Mermaid 内置预览、远程 Agent 与模型路由

来源:oschina.net 24
VS Code 1.121 把几件开发者高频要做的事直接做进了编辑器里——画架构图不用再装第三方插件,AI Agent 可以跑到远程机器上干活,轻量级任务也能指定用哪个模型处理。这些改动不是花架子,而是把日常流程里的摩擦点逐个磨平。 以前在 VS Code 里写 Mermaid 图表,要么装社区插件,要么把 拖到在线渲染器。1.121 直接内置了 Me...