不再是浮在表面的聊天框：腾讯 Marvis 把操作系统变成 AI 中间层

预计阅读时间：12 分钟

过去两年，AI 助手的主流形态是"悬浮窗 + 聊天框"——你手动把问题粘贴进去，它把答案吐出来，然后你再手动把答案搬回工作环境。腾讯应用宝团队刚上线的 Marvis（马维斯）换了一个思路：它不浮在操作系统之上，而是沉到操作系统之内，把终端、文件、应用、算力和跨端连接统一收进一个 AI 中间层。整台电脑——甚至跨设备的电脑和手机——变成了你可以直接对话的对象。

Windows、Mac、Android 三端同步上线，无需邀请码，开箱即用。每位用户每天 1000 万免费 Token。这些参数背后，藏着一种和传统 AI 助手完全不同的交互范式。

"操作系统层级"到底意味着什么

普通 AI 助手是应用层工具：你打开一个 App，在它内部完成问答，App 之外的操作系统它看不见、摸不到。Marvis 的定位是 OS 层中间件——它直接读取系统状态、操控文件和应用、调度本地算力，再叠加大模型的推理能力。

具体来说，Marvis 把五类系统资源纳入同一层：

资源类别	传统助手能做什么	Marvis 能做什么
终端系统	无感知	读取环境信息、执行命令
文件	需手动上传	直接索引本地文件并操作
应用	无法启动或切换	打开、切换、甚至跨应用串联
算力	仅用云端	调度本地 CPU/GPU 做推理或计算
跨端连接	各端独立	电脑和手机在同一对话中协作

这不是"更聪明的聊天机器人"，而是"能动手的操作系统代理"。你不再需要先想好要做什么、再去找对应工具——直接告诉 Marvis 你的意图，它从系统层选择执行路径。

跨端对话：同一句话，多设备协同

Marvis 同时覆盖 Windows、Mac 和 Android，跨端不是简单的"手机也能打开同一个 App"，而是同一会话可以跨设备流转。你在电脑上让 Marvis 整理一份报告，它可以在手机端继续推送结果；你在手机上圈选了一张图片，电脑端的 Marvis 已经把它放进编辑流程。

这种跨端能力依赖的是统一的 AI 中间层——每台设备上的 Marvis 共享同一个会话上下文和权限模型，而不是各自独立运行后再做数据同步。

实际上手：用 Marvis 操控本地系统

Marvis 目前以桌面客户端和移动端 App 形式提供，但它的系统层能力意味着你可以用自然语言直接驱动本地操作。下面给出几个可以直接尝试的交互示例，以及一个用 Python 调用 Marvis 概念 API 的脚本模板（注意：以下 API 路径为基于发布信息推断的合理假设，实际接口以官方文档为准）。

场景一：自然语言驱动文件整理

在 Marvis 客户端中直接输入：

把桌面上的所有 PDF 文件按日期重命名，移动到 Documents/2024_reports/ 目录下

Marvis 会：扫描桌面文件 → 筛选 PDF → 读取创建日期 → 执行重命名和移动。整个过程你不需要写脚本、不需要打开终端。

场景二：跨应用串联工作流

打开 Excel 里的销售数据表，把第三列的数值做成柱状图，保存为 PNG 放到桌面，然后通过微信发给张三

传统做法：打开 Excel → 手动做图 → 导出 → 打开微信 → 找人 → 发送。Marvis 从系统层串联这些应用动作。

场景三：用 Python 脚本批量调用 Marvis 能力

如果你想在自动化流程中接入 Marvis，可以参考下面的脚本。假设 Marvis 提供了本地 HTTP 服务（监听端口和路径为假设值，运行前需确认实际配置）：

"""
Marvis OS-Level AI Assistant — 批量任务调用示例
假设 Marvis 在本地提供 HTTP API，端口 9527
实际端口和接口路径请查阅官方文档或客户端设置页
"""

import requests
import json

MARVIS_API = "http://127.0.0.1:9527/v1/task"

def send_marvis_task(prompt: str, device: str = "desktop") -> dict:
    """向 Marvis 发送一条自然语言任务指令"""
    payload = {
        "prompt": prompt,
        "device": device,          # desktop / mobile
        "execute": True,           # 允许实际执行系统操作
        "dry_run": False,          # 设为 True 则只返回计划不执行
    }
    headers = {"Content-Type": "application/json"}

    resp = requests.post(MARVIS_API, json=payload, headers=headers, timeout=30)
    resp.raise_for_status()
    return resp.json()


# —— 示例：批量整理本周项目文件 ——
tasks = [
    "把 ~/Projects 下所有 .log 文件压缩成 logs_week.zip",
    "统计 ~/Projects 下各子目录的文件数量，生成一份 Markdown 报告保存到桌面",
    "把桌面上名为 draft.docx 的文件通过蓝牙推送到手机",
]

for i, task in enumerate(tasks, 1):
    print(f"\n▶ 任务 {i}: {task}")
    result = send_marvis_task(task)
    print(f"  状态: {result.get('status')}")
    print(f"  执行摘要: {result.get('summary')}")
    if result.get("files_affected"):
        print(f"  涉及文件: {json.dumps(result['files_affected'], indent=2)}")

运行前你需要确认的事：

Marvis 客户端是否开启了本地 API 服务，以及实际监听端口——在客户端设置中查找"开发者接口"或"本地服务"选项。
execute: True 意味着 Marvis 会真实操作你的文件和应用，首次测试建议先设 dry_run: True，只看执行计划不实际执行。
跨端任务（如蓝牙推送到手机）需要两端设备都已登录同一账号且 Marvis 正在运行。

1000 万 Token：够用，但有边界

每天 1000 万免费 Token，对个人用户的日常对话和系统操作来说相当充裕。粗略估算：一次中等复杂度的文件整理任务大约消耗 2000–5000 Token，一天做 50–100 次这类操作也不会触及上限。

但需要注意几个隐性边界：

长上下文任务消耗更快：如果 Marvis 需要读取大量文件内容再做推理，Token 消耗会随文件体积线性增长。处理一个 50 页 PDF 的摘要任务，可能一次就吃掉几十万 Token。
跨端协同有延迟成本：多设备之间的上下文同步和状态传输本身也计入 Token。
免费额度是日度重置：没有累计机制，今天没用完的 Token 明天不会叠加。

如果你计划用 Marvis 做批量自动化（比如每晚跑一轮日志归档），建议先测算单次任务的 Token 消耗，再决定调度频率。

落地建议与风险提醒

什么时候值得用

重复性系统操作多的人：每天都要整理文件、转换格式、跨应用搬运数据——这些正是 OS 层 AI 最擅长的。
多设备切换频繁的人：电脑和手机之间的信息流转，Marvis 的跨端能力比手动同步高效得多。
想用自然语言驱动本地算力的人：让 Marvis 调度本地 GPU跑一个轻量推理，比手动配环境快。

什么时候要谨慎

敏感文件操作：Marvis 能直接读写你的文件系统。首次使用时，建议在"只读模式"或 dry_run 下观察它的操作计划，确认无误再放开执行权限。
生产环境服务器：Marvis 目前面向个人桌面和移动端，不要在承载业务的服务器上安装——它的系统层权限太宽，误操作代价太高。
企业合规场景：Marvis 会把本地文件内容送入大模型推理，涉及客户数据或受监管信息时，需要评估数据是否可以离开本地环境。

快速上手检查清单

在 Marvis 官方渠道下载对应平台客户端（Windows / Mac / Android）。
登录同一腾讯账号，确认多端设备出现在"已连接设备"列表中。
在设置中检查"执行权限"——建议初始设为"需确认后执行"，避免误操作。
先用简单任务测试（如"列出桌面上的文件"），观察 Marvis 的系统感知范围是否正确。
逐步升级到文件操作、应用串联、跨端协同，每一步都先看执行计划再确认。

操作系统层级的 AI 助手，本质上是在重新定义"人机接口"——从"人操作机器"变成"人描述意图，机器自行编排操作"。Marvis 是这个方向上第一个开箱即用、三端同步的产品。它还不完美，权限模型需要用户自己把控边界，API 接口还在逐步开放，但方向已经足够清晰：AI 不该只是你屏幕上的一个浮窗，它应该能真正动手。