基于 MiMo V2.5 全栈模型的多模态会议智能体 — 利用 100 万 token 上下文窗口,一次性处理完整会议记录
一场 2 小时的会议,转写文本约 3-5 万字(~4-7 万 token)。传统方案需要切片处理,丢失跨时段上下文关联。
OmniMemo 利用 MiMo 的 100 万 token 上下文窗口,一次性载入完整会议记录,保留所有跨时段关联。
支持会议录音、视频、截图、白板照片。MiMo-Omni 原生统一处理,无需拼接多个 API pipeline。
"张总指着第三季度报表说这个数据有问题" — Omni 同时理解语音和图表含义,建立跨模态关联。
自动提取决策点、行动项、争议焦点。分层输出:摘要→议题→行动项,支持 Markdown 和 JSON 格式。
MiMo-TTS 生成 3 分钟语音回顾 1 小时会议,通勤时轻松回顾核心内容。
自动识别会议类型(站会/周会/技术评审/客户沟通),匹配最佳分析模板和输出格式。
100 万 token 窗口可处理 4-6 小时完整会议,跨时段追踪议题、关联发言人、溯源决策。