Sherpa Go语言实战

简介 sherpa 是 Next-gen Kaldi 项目的部署框架。 使用 VAD 语音活动检测(Voice Activity Detection,简称VAD)是一种技术,用于检测音频信号中是否存在语音或其他声音活动。它在语音处理、语音识别、音频压缩等领域有广泛的应用。 VAD的主要功能 语音识别系统:通过VAD,系统可以在检测到语音时启动识别过程,提高效率。 音频压缩:在语音通信中,VAD可以帮助压缩算法仅对有效语音信号进行压缩,减少传输数据量。 噪声抑制系统:通过检测语音活动,系统可以在静默时段增强噪声抑制效果。 在GO中使用 todo KWS 关键词唤醒(Keyword Spotting,简称KWS)是一种技术,用于检测音频信号中特定的关键词或短语。它广泛应用于语音助手、智能家居设备、车载系统等领域,通过识别特定关键词来激活设备或执行特定命令。 主要功能 关键词检测:识别音频信号中是否包含预定义的关键词或短语。 唤醒设备:当检测到关键词时,激活设备或应用程序。 提高用户体验:通过语音命令简化操作流程,增强用户体验。 自定义keywords 通过官方的工具sherpa-onnx-cli,可以实现自定义关键字,下面是简单的介绍 原文 # Note: You need to run pip install sherpa-onnx to get the commandline tool: sherpa-onnx-cli sherpa-onnx-cli text2token --help Usage: sherpa-onnx-cli text2token [OPTIONS] INPUT OUTPUT Options: --text TEXT Path to the input texts. Each line in the texts contains the original phrase, it might also contain some extra items, for example, the boosting score (startting with :), the triggering threshold (startting with #, only used in keyword spotting task) and the original phrase (startting with @)....

一个免费的TTS接口

示例: https://dds.dui.ai/runtime/v1/synthesize?voiceId=ppangf_csn&text=您好世界&speed=1&volume=50&audioType=wav 使用步骤 graph LR; 选择声音 --> 输入要转语音文本 --> 拼接URL --> 使用语音 参数说明: text 要转音频的文本内容 (200字以内) speed 语速 volume 声音大小 voiceId 发音类型可以取下面的值: VoiceId 名称 说明 qiumum_0gushi 精品秋木 活泼开朗适合有声读物等场景 kaolam_diantai 精品考拉 电台男声温柔的电台男声 juan1f 小美 客服女声声音甜美热情,客服、营销场景均适用 xmguof 婷婷 营销女声音色亲切大方,适用于电话销售、调研回访等场景 xmamif 小咪 营销女声活力甜美,适用于电话营销、邀约等场景 lunaif_ctn 晓健 标准粤语女声偏正式的标准粤语,适用于新闻播报等场景 hchunf_ctn 何春 自然粤语女声音色偏甜美自然,适用于家居播报等场景 dayaof_csd 大瑶 山东话女声音色偏甜美自然,适用于家居播报等场景 wqingf_csn 文卿 四川话女声音色偏甜美自然,适用于车载导航等场景 ppangf_csn 胖胖 四川话女声音色偏甜美自然,适用于家居播报等场景 yezi1f_csh 叶子 上海话女声音色偏甜美自然,适用于家居播报等场景 madoufp_yubo 麻豆 娱播女声甜美欢快的女声,适合做娱乐新闻的播报 madoufp_wenrou 麻豆 甜美温柔客服、营销、阅读听书的场景均可使用 xjingfp 小静 甜美女声音色甜美知性,可用于娱乐新闻等播报 xjingf_gushi 小静 自然音色甜美知性,可用于娱乐新闻等播报 xjingf 小静 商务知性音色甜美知性,可用于娱乐新闻等播报 zhilingfp 小玲 甜美女神音色亲切、欢快、自然,适合用于各种场景 zhilingfp_huankuai 小玲 欢快自然音色亲切、欢快、自然,适合用于各种场景 zhilingfa 小玲 标准小玲的音色亲切,甜美,自然,适合用于各种场景 zhilingf 传统小玲 甜美性感音色甜美、自然、性感,适合用于各种场景 anonyf 小佚 平和沉稳音色沉稳严肃,适合用于新闻播报等 xbekef 贝壳 可爱女童童真可爱,适合讲幼儿故事 xijunma 精品小军 新闻播报适合新闻播报等场景 xijunm 传统小军 标准正式标准发音,适合新闻播报等场景 geyou 葛爷 淡定风趣模仿葛优音色 gdgm 纲叔 沉稳幽默模仿郭德纲音色 zxcm 星哥 风趣幽默模仿周星驰音色 qianranf 传统然然 天真俏皮成人女声模仿女童音色 hyanif 小妮 温柔亲切适合情感电台播报等场景 gqlanf 标准小兰 邻家女声温柔的邻家女声,适合做客服音色 gqlanfp 精品小兰 温柔甜美温柔的邻家女声,适合做客服音色 qianranfa 标准然然 天真俏皮语速1....