Ubuntu 26.10 引入 Myna AI 听写功能
Canonical 正式公布了代号为 Project Myna 的新项目,旨在为 Ubuntu 桌面操作系统带来本地化的语音转文字(听写)功能。该项目首个版本计划集成到 Ubuntu 26.10(Stonking Stingray)中,并有望成为 Ubuntu 桌面体验的重要组成部分。
Project Myna 被定位为一款纯粹的桌面听写工具,核心功能在于将用户的语音实时转换为文本,并直接插入到用户当前激活的应用程序中。启用听写功能后,屏幕上会提供清晰的视觉反馈。Canonical 明确表示,首个版本将专注于打磨基础的听写体验,暂不包含语音助手、语音命令、桌面控制、翻译或自动语言检测等功能,以确保核心功能的稳定和准确。

在技术层面,Myna 采用了 AI 语音识别模型,所有处理均在用户本地计算机上完成,确保了数据隐私和离线可用性(在下载必要模型后)。其初期目标平台是运行 Wayland 的 Ubuntu 桌面,并以 GNOME 为主要验证环境,同时保留了对未来支持更多桌面环境的开放性。此外,麦克风的访问受到严格控制,仅在用户主动激活听写时才启动,音频数据在内存中处理后即被销毁,不会上传至任何外部服务器。整体架构采用模块化设计,便于独立优化语音识别、用户交互、听写管理和文本注入等组件。
Canonical 桌面团队期望在项目早期阶段收集社区反馈,尤其是来自依赖听写或辅助技术的用户、Linux 上的语音识别用户、开发者、测试人员以及文档编写者。项目源码及架构文档已根据 GPLv3 协议在 GitHub 上发布。未来,Canonical 计划持续优化 Myna 与桌面的集成度,并根据早期用户的反馈和社区意见,探索更自然、更准确的听写方式,并决定后续功能的开发优先级。