
2025年即将收官,盘点这一年国内人工智能产业的重要突破,智能音频技术在工业领域的深度应用成为不可忽视的亮点。今年7月,科大讯飞联合团队在国际声学场景和事件检测及分类挑战赛(DCASE 2025)中获三项冠军,包揽所有参赛任务及赛道第一。这一成绩的背后,是人工智能国家队从技术攻关到产业落地的完整闭环。
“让机器学会听,听懂另一台机器的声音”——这个看似科幻的命题,正在成为现实。在DCASE赛事的机器声纹无监督异常检测任务中,参赛团队需要仅凭机器运行的声音,判断设备是否处于正常状态。今年该任务吸引了35支队伍参赛,创历年之最。科大讯飞研究院联合中科大语音及语言信息处理国家工程研究中心、国家智能语音创新中心等单位组成的联合团队,凭借全国产自研技术方案脱颖而出。
技术突破的关键在于自主创新。联合团队构建了基于9万小时海量数据训练的声纹预训练模型底座,创新设计师生双分支自蒸馏网络和时频域均衡特征提取方案。这套全栈自主可控的技术体系,从底层算法到模型架构均实现国产化自主研发,为打破国外技术垄断提供了有力支撑。
作为承建认知智能全国重点实验室的大模型国家队核心成员,科大讯飞在智能语音领域深耕二十余年。依托语音及语言信息处理国家工程研究中心的科研积累,以及国家新一代人工智能开放创新平台的资源优势,科大讯飞持续推动前沿技术向产业应用转化。
国际赛场的冠军技术如何服务实体经济?答案写在一线生产现场。目前,科大讯飞已将相关技术转化为AI工业听诊器、AI声学成像仪等系列产品,覆盖电力能源、矿山开采、钢铁冶金等多个工业领域。
在电力行业,AI工业听诊器已进驻芜湖特高压、淮南特高压等国家级重点工程,实现对变电站设备的全天候声纹监测,可精准识别局部放电、设备异响等早期故障隐患。在南水北调洪泽站,该技术同样守护着国家水利命脉的安全运行。截至目前,产品已部署至安徽、浙江、内蒙古、广东等近20个省份的数百个场站。
效率提升更为直观。在首钢集团的应用案例中,AI声学成像仪将管道泄漏检测时间从传统的5小时压缩至30分钟,效率提升10倍,并成功定位22处泄漏点。国家智能语音创新中心推出的电机声纹智能质检方案,实现无需停机停产的在线检测,准确率高达98.5%。
“声音是设备健康状态最直接的反映,但过去只能依赖老师傅的经验。”一位电力行业从业者表示,AI听诊技术的普及,让设备巡检从“经验驱动”迈向“数据驱动”,大幅降低了人工成本和漏检风险。
行业分析人士指出,在工业智能化转型的浪潮中,智能音频检测技术正从“锦上添花”变为“刚性需求”。科大讯飞凭借国际顶尖赛事验证的核心算法,叠加深厚的产业化经验,有望在这一细分赛道持续领跑。
大模型时代,AI的能力边界不断拓展。从“听懂”人类语言到“听懂”机器声音,科大讯飞正以人工智能国家队的担当,探索技术赋能实体经济的更多可能。

