用 AI 编程工具 8 小时搭一套睡眠噪音追踪器——从凌晨惊醒到精准定位干扰源

预计阅读时间：10 分钟

住在嘈杂城市的开发者 Martin 有个烦人的问题：凌晨 3 点反复被不明噪音惊醒，第二天看智能手表数据才知道睡眠被打断，却始终搞不清到底是什么声音在作怪。与其继续猜，他决定自己动手——借助 AI 编程工具，大约 8 小时就搭出了一套完整的睡眠噪音追踪系统，最终锁定了干扰源。

这个项目本身不大，但它折射出一个更值得关注的趋势：过去觉得"想都不敢想"的硬件+软件小项目，现在周末就能搞定。

问题拆解：追踪夜间噪音需要什么

Martin 的需求很具体——不是"录一晚上音频然后手动听"，而是：

持续采集：整夜录音，不漏掉任何片段。
自动标注：识别出音量超过阈值的时刻，标记时间戳。
可视化回溯：第二天早上能快速看到"几点几分出现了异常噪音"，最好还能直接播放那段音频。
低成本运行：用身边现成的设备，不买昂贵仪器。

核心难点不在录音本身，而在从 8 小时音频里快速定位那几秒异常。纯手动听一遍录音，时间成本远超问题本身。

系统架构：极简但够用

Martin 的方案大致是这样：

采集端：放在卧室的设备持续录音，按固定时长切片保存（比如每分钟一个片段）。
分析端：对每个切片计算音量（RMS 或分贝值），超过阈值时标记为"噪音事件"。
展示端：生成时间线报告，包含噪音事件的时间戳、峰值音量，以及对应音频片段的路径，方便直接回放。

整个流程没有复杂模型，靠的是阈值检测 + 时间切片——简单但有效。AI 编程工具在这里的价值不是帮你设计架构，而是让你把"我知道大概要怎么做"迅速落地成可运行代码，省掉查 API、拼配置、调格式的琐碎时间。

实践：用 Python 搭一个最小噪音追踪器

下面给一个可以直接跑的示例——用笔记本电脑或 Raspberry Pi 的麦克风整夜录音，第二天自动生成噪音事件报告。你需要改的地方只有麦克风设备索引和噪音阈值。

#!/usr/bin/env python3
"""
sleep_noise_tracker.py — 最小睡眠噪音追踪器
依赖: pip install sounddevice numpy
运行: python sleep_noise_tracker.py
按 Ctrl+C 停止录音，结束后自动生成报告。
"""

import sounddevice as sd
import numpy as np
import datetime
import json
import os
import wave

# ========== 配置区（根据你的环境修改） ==========
RECORD_DURATION_HOURS = 8          # 录音时长（小时）
SAMPLE_RATE = 16000                 # 采样率，16kHz 足够捕捉环境噪音
CHANNELS = 1                        # 单声道
SLICE_SECONDS = 60                  # 每 60 秒切一个片段
NOISE_THRESHOLD_DB = 35             # 超过此分贝值视为噪音事件（需根据实际校准）
OUTPUT_DIR = "sleep_noise_data"     # 数据输出目录
# ================================================

os.makedirs(OUTPUT_DIR, exist_ok=True)

def rms_to_db(rms, ref=1.0):
    """将 RMS 值转为分贝（相对参考值）"""
    if rms <= 0:
        return -100
    return 20 * np.log10(rms / ref)

def save_wav(filename, data, sr, channels):
    """将 numpy 数组保存为 WAV 文件"""
    with wave.open(filename, "wb") as wf:
        wf.setnchannels(channels)
        wf.setsampwidth(2)  # 16-bit
        wf.setframerate(sr)
        wf.writeframes((data * 32767).astype(np.int16).tobytes())

def main():
    total_slices = int(RECORD_DURATION_HOURS * 3600 / SLICE_SECONDS)
    slice_samples = SLICE_SECONDS * SAMPLE_RATE
    events = []

    print(f"开始录音: {RECORD_DURATION_HOURS}h, 切片 {SLICE_SECONDS}s, 阈值 {NOISE_THRESHOLD_DB}dB")
    print(f"预计切片数: {total_slices}, 按 Ctrl+C 可提前结束")

    start_time = datetime.datetime.now()

    for slice_idx in range(total_slices):
        try:
            # 录一个切片
            recording = sd.rec(slice_samples, samplerate=SAMPLE_RATE,
                               channels=CHANNELS, dtype="float32")
            sd.wait()
        except KeyboardInterrupt:
            print("\n录音提前结束")
            break

        # 计算音量
        rms_val = np.sqrt(np.mean(recording ** 2))
        db_val = rms_to_db(rms_val)

        timestamp = start_time + datetime.timedelta(seconds=slice_idx * SLICE_SECONDS)
        ts_str = timestamp.strftime("%Y-%m-%d_%H-%M-%S")
        wav_path = os.path.join(OUTPUT_DIR, f"slice_{ts_str}.wav")

        # 保存音频切片
        save_wav(wav_path, recording.flatten(), SAMPLE_RATE, CHANNELS)

        # 判断是否为噪音事件
        if db_val > NOISE_THRESHOLD_DB:
            events.append({
                "timestamp": timestamp.isoformat(),
                "db": round(db_val, 1),
                "wav_file": wav_path,
            })
            print(f"  ⚡ 噪音事件 @ {ts_str} | {db_val:.1f} dB")
        else:
            print(f"  ✓ 安静 @ {ts_str} | {db_val:.1f} dB")

    # 生成报告
    report = {
        "start_time": start_time.isoformat(),
        "end_time": datetime.datetime.now().isoformat(),
        "threshold_db": NOISE_THRESHOLD_DB,
        "total_events": len(events),
        "events": events,
    }

    report_path = os.path.join(OUTPUT_DIR, "report.json")
    with open(report_path, "w") as f:
        json.dump(report, f, indent=2, ensure_ascii=False)

    print(f"\n报告已保存: {report_path}")
    print(f"共检测到 {len(events)} 个噪音事件")
    if events:
        print("噪音事件时间线:")
        for ev in events:
            print(f"  {ev['timestamp']}  {ev['db']} dB  → {ev['wav_file']}")

if __name__ == "__main__":
    main()

运行前注意：

pip install sounddevice numpy 安装依赖。Linux 上可能还需要 sudo apt install libportaudio2。
阈值 NOISE_THRESHOLD_DB = 35 是个起点，建议先白天录 5 分钟看正常环境音量，再据此调整。Martin 的做法是先跑一晚看分布，再微调阈值。
如果用外接麦克风（比如放在床头），用 sd.query_devices() 查设备索引，通过 sd.default.device 设置。
8 小时 × 16kHz × 单声道，大约 900MB WAV 文件，磁盘空间要留够。想省空间可以只保存超过阈值的切片，安静切片只记日志不存文件——改一行 save_wav 的调用位置即可。

从数据到行动：报告怎么用

跑完一晚，report.json 里会列出所有噪音事件的时间戳和对应音频文件。打开 WAV 直接听，就能判断是空调嗡鸣、邻居关门、还是街头垃圾车。

Martin 在拿到数据后发现，凌晨 3 点左右的噪音峰值来自街边垃圾清运车——规律性极强，一周三次。解决方案不是改代码，而是关窗 + 白噪音掩蔽，之后睡眠质量明显改善。

这提醒我们：追踪系统的终点不是更精确的数据，而是可执行的决策。

AI 编程工具在这里到底省了什么

8 小时完成这个项目，AI 编程工具的贡献集中在几处：

快速原型：从"我想录音并分析音量"到可运行脚本，跳过了翻文档和拼 API 的阶段。
跨领域缝合：音频采集、数值计算、文件存储、JSON 报告——每个环节都不难，但拼起来要查四五个库的用法，AI 工具把这些缝合时间压到最低。
调试加速：遇到采样率不匹配、WAV 头写错这类问题，直接贴报错让 AI 解释，比搜索引擎翻 Stack Overflow 快得多。

但它没有替代判断——阈值多少合适、切片多长合理、数据怎么解读，这些仍需要开发者根据自身场景决定。

如果你想做类似项目：一份清单

步骤	建议
选硬件	笔记本麦克风能跑通原型；长期部署用 Raspberry Pi + USB 麦克风更省电安静
校准阈值	先录一晚看音量分布，再设阈值；不要凭感觉猜
存储策略	只保存噪音切片，安静时段记日志即可，8 小时数据量能从 900MB 降到几十 MB
扩展分析	想区分噪音类型，可以加频谱分析（FFT），甚至跑轻量分类模型——但先从阈值检测开始
隐私	录音可能包含语音，数据不要上传云端，本地处理本地删除

Martin 的项目证明了一点：个人痛点 + AI 编程工具 + 几小时时间 = 一个能解决真实问题的系统。 不需要是专业嵌入式工程师，不需要精通音频信号处理，只需要知道"我想要什么"，剩下的落地工作，工具帮你压缩到周末可完成的尺度。