不再是浮在表面的聊天框:腾讯 Marvis 把操作系统变成 AI 中间层

2026-05-21 16 预计阅读时间:1 分钟
来源:oschina.net AI 摘要 原文链接

免责声明:本文为 AI 摘要整理,建议结合原文阅读。摘要可能省略上下文、版本差异或边界条件,不作为官方说明。

预计阅读时间:12 分钟

过去两年,AI 助手的主流形态是"悬浮窗 + 聊天框"——你手动把问题粘贴进去,它把答案吐出来,然后你再手动把答案搬回工作环境。腾讯应用宝团队刚上线的 Marvis(马维斯)换了一个思路:它不浮在操作系统之上,而是沉到操作系统之内,把终端、文件、应用、算力和跨端连接统一收进一个 AI 中间层。整台电脑——甚至跨设备的电脑和手机——变成了你可以直接对话的对象。

Windows、Mac、Android 三端同步上线,无需邀请码,开箱即用。每位用户每天 1000 万免费 Token。这些参数背后,藏着一种和传统 AI 助手完全不同的交互范式。

"操作系统层级"到底意味着什么

普通 AI 助手是应用层工具:你打开一个 App,在它内部完成问答,App 之外的操作系统它看不见、摸不到。Marvis 的定位是 OS 层中间件——它直接读取系统状态、操控文件和应用、调度本地算力,再叠加大模型的推理能力。

具体来说,Marvis 把五类系统资源纳入同一层:

资源类别 传统助手能做什么 Marvis 能做什么
终端系统 无感知 读取环境信息、执行命令
文件 需手动上传 直接索引本地文件并操作
应用 无法启动或切换 打开、切换、甚至跨应用串联
算力 仅用云端 调度本地 CPU/GPU 做推理或计算
跨端连接 各端独立 电脑和手机在同一对话中协作

这不是"更聪明的聊天机器人",而是"能动手的操作系统代理"。你不再需要先想好要做什么、再去找对应工具——直接告诉 Marvis 你的意图,它从系统层选择执行路径。

跨端对话:同一句话,多设备协同

Marvis 同时覆盖 Windows、Mac 和 Android,跨端不是简单的"手机也能打开同一个 App",而是同一会话可以跨设备流转。你在电脑上让 Marvis 整理一份报告,它可以在手机端继续推送结果;你在手机上圈选了一张图片,电脑端的 Marvis 已经把它放进编辑流程。

这种跨端能力依赖的是统一的 AI 中间层——每台设备上的 Marvis 共享同一个会话上下文和权限模型,而不是各自独立运行后再做数据同步。

实际上手:用 Marvis 操控本地系统

Marvis 目前以桌面客户端和移动端 App 形式提供,但它的系统层能力意味着你可以用自然语言直接驱动本地操作。下面给出几个可以直接尝试的交互示例,以及一个用 Python 调用 Marvis 概念 API 的脚本模板(注意:以下 API 路径为基于发布信息推断的合理假设,实际接口以官方文档为准)。

场景一:自然语言驱动文件整理

在 Marvis 客户端中直接输入:

把桌面上的所有 PDF 文件按日期重命名,移动到 Documents/2024_reports/ 目录下

Marvis 会:扫描桌面文件 → 筛选 PDF → 读取创建日期 → 执行重命名和移动。整个过程你不需要写脚本、不需要打开终端。

场景二:跨应用串联工作流

打开 Excel 里的销售数据表,把第三列的数值做成柱状图,保存为 PNG 放到桌面,然后通过微信发给张三

传统做法:打开 Excel → 手动做图 → 导出 → 打开微信 → 找人 → 发送。Marvis 从系统层串联这些应用动作。

场景三:用 Python 脚本批量调用 Marvis 能力

如果你想在自动化流程中接入 Marvis,可以参考下面的脚本。假设 Marvis 提供了本地 HTTP 服务(监听端口和路径为假设值,运行前需确认实际配置):

"""
Marvis OS-Level AI Assistant — 批量任务调用示例
假设 Marvis 在本地提供 HTTP API,端口 9527
实际端口和接口路径请查阅官方文档或客户端设置页
"""

import requests
import json

MARVIS_API = "http://127.0.0.1:9527/v1/task"

def send_marvis_task(prompt: str, device: str = "desktop") -> dict:
    """向 Marvis 发送一条自然语言任务指令"""
    payload = {
        "prompt": prompt,
        "device": device,          # desktop / mobile
        "execute": True,           # 允许实际执行系统操作
        "dry_run": False,          # 设为 True 则只返回计划不执行
    }
    headers = {"Content-Type": "application/json"}

    resp = requests.post(MARVIS_API, json=payload, headers=headers, timeout=30)
    resp.raise_for_status()
    return resp.json()


# —— 示例:批量整理本周项目文件 ——
tasks = [
    "把 ~/Projects 下所有 .log 文件压缩成 logs_week.zip",
    "统计 ~/Projects 下各子目录的文件数量,生成一份 Markdown 报告保存到桌面",
    "把桌面上名为 draft.docx 的文件通过蓝牙推送到手机",
]

for i, task in enumerate(tasks, 1):
    print(f"\n▶ 任务 {i}: {task}")
    result = send_marvis_task(task)
    print(f"  状态: {result.get('status')}")
    print(f"  执行摘要: {result.get('summary')}")
    if result.get("files_affected"):
        print(f"  涉及文件: {json.dumps(result['files_affected'], indent=2)}")

运行前你需要确认的事:

  1. Marvis 客户端是否开启了本地 API 服务,以及实际监听端口——在客户端设置中查找"开发者接口"或"本地服务"选项。
  2. execute: True 意味着 Marvis 会真实操作你的文件和应用,首次测试建议先设 dry_run: True,只看执行计划不实际执行。
  3. 跨端任务(如蓝牙推送到手机)需要两端设备都已登录同一账号且 Marvis 正在运行。

1000 万 Token:够用,但有边界

每天 1000 万免费 Token,对个人用户的日常对话和系统操作来说相当充裕。粗略估算:一次中等复杂度的文件整理任务大约消耗 2000–5000 Token,一天做 50–100 次这类操作也不会触及上限。

但需要注意几个隐性边界:

  • 长上下文任务消耗更快:如果 Marvis 需要读取大量文件内容再做推理,Token 消耗会随文件体积线性增长。处理一个 50 页 PDF 的摘要任务,可能一次就吃掉几十万 Token。
  • 跨端协同有延迟成本:多设备之间的上下文同步和状态传输本身也计入 Token。
  • 免费额度是日度重置:没有累计机制,今天没用完的 Token 明天不会叠加。

如果你计划用 Marvis 做批量自动化(比如每晚跑一轮日志归档),建议先测算单次任务的 Token 消耗,再决定调度频率。

落地建议与风险提醒

什么时候值得用

  • 重复性系统操作多的人:每天都要整理文件、转换格式、跨应用搬运数据——这些正是 OS 层 AI 最擅长的。
  • 多设备切换频繁的人:电脑和手机之间的信息流转,Marvis 的跨端能力比手动同步高效得多。
  • 想用自然语言驱动本地算力的人:让 Marvis 调度本地 GPU跑一个轻量推理,比手动配环境快。

什么时候要谨慎

  • 敏感文件操作:Marvis 能直接读写你的文件系统。首次使用时,建议在"只读模式"或 dry_run 下观察它的操作计划,确认无误再放开执行权限。
  • 生产环境服务器:Marvis 目前面向个人桌面和移动端,不要在承载业务的服务器上安装——它的系统层权限太宽,误操作代价太高。
  • 企业合规场景:Marvis 会把本地文件内容送入大模型推理,涉及客户数据或受监管信息时,需要评估数据是否可以离开本地环境。

快速上手检查清单

  1. Marvis 官方渠道 下载对应平台客户端(Windows / Mac / Android)。
  2. 登录同一腾讯账号,确认多端设备出现在"已连接设备"列表中。
  3. 在设置中检查"执行权限"——建议初始设为"需确认后执行",避免误操作。
  4. 先用简单任务测试(如"列出桌面上的文件"),观察 Marvis 的系统感知范围是否正确。
  5. 逐步升级到文件操作、应用串联、跨端协同,每一步都先看执行计划再确认。

操作系统层级的 AI 助手,本质上是在重新定义"人机接口"——从"人操作机器"变成"人描述意图,机器自行编排操作"。Marvis 是这个方向上第一个开箱即用、三端同步的产品。它还不完美,权限模型需要用户自己把控边界,API 接口还在逐步开放,但方向已经足够清晰:AI 不该只是你屏幕上的一个浮窗,它应该能真正动手。


相关推荐