目前,开源的端到端语音识别工具比较多,比较常用的包括:ESPnet、wav2letter++、WeNet、PaddleSpeech、OpenSeq2Seq、Fairseq、新一代Kaldi等等。
其中,WeNet是首个面向产品和工业界的端到端语音识别开源工具,目前也是使用范围最广的端到端语音识别开源工具之一。
WeNet既可以在模型训练上达到在各数据集上SOTA的效果,也可以给出比较完善的工业方案。WeNet同时提供了基于python/pytorch的训练脚本和基于c++/libtorch的工程化部署方案,是真正面向工业界的ASR工具。基于WeNet的端到端语音识别产业应用目前已经有很多,目前已经落地到京东,网易,英伟达,喜马拉雅,作业帮,地平线,虎牙、58同城、顺丰科技等公司的语音识别项目上。2022年6月,语音之家联合WeNet社区推出了《WeNet语音识别实战》课程。一年来,我们根据语音技术和WeNet的发展不断更新课程内容,已开设了三期,每一期都收获了数百位学员的参与和好评。在与学员的交流中,我们发现很多人对WeNet相关培训有着迫切的需求,并愿意参与企业落地服务项目。因此,为了进一步满足学员们的需求,语音之家与WeNet社区再次合作,推出WeNet线下短训班。本次线下班是目前语音之家唯一一门线下短训课程。第一期线下班限量招募,提交申请的同学需要经过工作人员的审核,达到课程要求的基础水平后才可以加入。本期线下短训为时 4 天,致力于通过 8 个半天的高强度课程学习&实践,实战训练,帮助学员系统掌握WeNet语音识别的主流核心技术,并最终能独立实现从0构建工业产品级的语音识别系统,提升端到端语音识别建模能力、产品应用的开发能力,掌握云上和端上直接部署的方案。为了确保学员的实战效果,线下班学员会开通1个月线上录播课权限,在此期间继续享受线上答疑指导。- 报名8月19日(周六)- 8月20日(周日)为期2天的短训班;
- 报名8月19日(周六)- 8月22日(周二)为期4天的短训班。
✍地点:北京海淀区中关村 海淀黄庄地铁站C口出50米🙌费用:4天短训班 3999元,2天短训班 1999元- 本次线下班提供所有代码、说明文档及操作视频,为了确保学员的实战效果,线下班学员会开通1个月线上录播课权限,在此期间享受线上答疑指导;
前10名的新学员75折,戳“阅读原文”,领取75折优惠券。