标签

开源

CopyQ 16.0.0:给你的剪贴板加上大小限制与更多控制

来源: oschina.net 29
日常开发中,剪贴板是最频繁使用的"隐形工具"——复制一段日志、截一张图、拷贝一个 API 响应,全靠它。但剪贴板也有让人头疼的时刻:不小心复制了一个几十 MB 的图片或 JSON,内存占用飙升;历史记录里堆满了无用内容,找不到之前那条关键命令。CopyQ 就是来解决这些问题的,而 16.0.0 版本新增的 MIME 大小限制,让它在"记录一切"和"守住...

AgentDesk v1.5.0:把 AI 客服从"聊天框加个大模型"拉回真实业务链路

来源: oschina.net 25
市面上不少"AI客服"产品的做法很直接:拿一个 LLM,套个对话界面,上线。用户问一句,模型答一句,看起来很酷,但客服团队很快发现问题——知识库检索不准时没人兜底,复杂问题转人工的路径断了,工单闭环更是没影。AgentDesk 的思路不同:它把 AI 优先接待、知识库 RAG 检索、人工协同接管、工单流转闭环统一放在同一套系统里,不是给聊天框加个大脑,...

一颗先进芯片里,80% 的面积不是"自己设计的"——硅知识产权如何撑起整座芯片产业

来源: oschina.net 23
如果你拆开一颗最先进的 SoC,用显微镜逐层审视,会发现一个反直觉的事实:多达 80% 的物理面积被一类模块占据——它们既不是为这颗芯片量身定制的,也不是由芯片终端公司亲手画的。这些模块叫硅知识产权(Silicon IP),也叫 IP 核。它们是预先设计好、经过验证、可授权复用的功能单元:CPU 核心、内存控制器、PCIe 接口、SerDes、PLL…...

openKylin FlagOS SIG 成立:给多元 AI 芯片搭一套统一软件栈

来源: oschina.net 21
智算基础设施正在快速膨胀,但一个被反复忽略的事实是——每换一颗 AI 芯片,运维和开发团队就要重新适配一整套驱动、编译器、运行时和调度工具。这不是小麻烦,是结构性成本。2026 年 5 月,openKylin 社区技术委员会审议通过,由上海苦芽科技有限公司发起的 FlagOS SIG 正式成立,目标很明确:基于 openKylin 操作系统,构建面向多...

光船通用代码生成器插件源码全开放:动手拆解动词算子式定制

来源: oschina.net 29
动词算子式通用代码生成器"光船"(Lightboat)近日将全部插件源码公开到 Gitee,包括蛋糕商城插件 CookieShopPlugin 和扩展工具插件 ExtendedUtilPlugin。对于一直在用光船做项目生成、却对"客户化动词"只停留在配置层面的开发者来说,这次开放等于拿到了完整的内部图纸——从动词定义、模板渲染到最终产物拼装,每一环都...

Cosmos 3:英伟达把物理世界塞进一个 Transformer

来源: oschina.net 27
物理 AI 长期卡在一个尴尬的位置——自动驾驶仿真、机器人操作规划、工业数字孪生,每一项都需要模型"懂物理",但现有大模型要么只处理文本,要么生成视频却无视重力与碰撞。英伟达刚开源的 Cosmos 3 试图一次性解决这个问题:一个模型原生理解并生成文本、图像、视频、环境声音和动作,且以物理精度为硬指标,而非审美优先。 Cosmos 3 的核心变化不在"...

ChatGPT for Google Sheets 扩展的间接 Prompt 注入:一条从数据泄露到凭证窃取的攻击链

来源: oschina.net 31
Google Sheets 里的 AI 助手看起来只是帮你写公式、整理数据,但 PromptArmor 最新披露的漏洞表明:这个助手可能被远程攻击者"劫持",在用户毫无察觉的情况下读取跨账户工作簿数据,甚至弹出伪造的登录窗口骗取凭证。整条攻击链不需要用户授权,也不需要恶意软件——只需要一段藏在表格单元格里的文字。 直接 prompt 注入是用户主动输入...

AI 路由层正在成为基础设施——OpenRouter 1.13 亿美元融资背后的信号

来源: oschina.net 36
企业用 AI 的方式变了。一年前还在纠结"选 GPT-4 还是 Claude",现在真正的问题是:几十个模型怎么调度、怎么按场景切换、怎么在成本和效果之间动态权衡。OpenRouter 刚完成的 1.13 亿美元 B 轮融资,把这个问题推到了台前——CapitalG 领投,NVIDIA、Snowflake、Databricks、MongoDB、Serv...

Kog 推理引擎:不砍精度,单请求冲到 3000 tokens/s

来源: oschina.net 18
推理引擎的 benchmark 长期被一个数字统治——聚合吞吐量。每秒多少 token,多少并发请求,成本摊到每个 token 多少美元。这些指标对批量处理场景确实重要,但它们掩盖了一个越来越尖锐的问题:当用户坐在聊天窗口前等回复,聚合吞吐量救不了体验延迟。 Kog AI 刚发布的 KIE(Kog Inference Engine)技术预览版,把矛头直...