简介

今天的阿里云复仇记，我们来讲讲声纹识别。我车里的车机系统在登陆的时候有一种方式，声纹登陆。就是实现录入自己的声音，然后每次登陆的时候只要对着车机重复这句话 “你好，风神” ，就能识别出你是不是车的主人。

最近我仔细一琢磨，像东风风神这种国内四五线的车企，根本不可能自己开发声纹系统。事出反常必有妖啊，我就去看了一下阿里云，果然，，，，阿里云这老小子还真有这个服务，只不过他改了个名字，叫一句话识别。阿里云老小子的价钱是3.5元/千次。虽然不贵啊，但是我们主打的就是，想尽一切办法，给阿里云这个老小子造成损失。

我自己也做了一个声纹对比，我们一起来看一下。

工具、代码下载

链接：「【阿里云复仇记5】声纹识别，一句话识别」

视频教程

部署与安装

一、3D-Speaker 安装（语音对比）

# 安装
git clone https://github.com/modelscope/3D-Speaker.git && cd 3D-Speaker
pip install -r requirements.txt

# 测试
python speakerlab/bin/infer_sv.py  --model_id iic/speech_eres2net_sv_zh-cn_16k-common --wavs 语音1.wav 语音2.wav

二、Voicefixer 安装（语音去噪，人声增强）

pip install git+https://github.com/haoheliu/voicefixer.git
voicefixer --infile 将早前语音.wav --outfile 降噪后语音.wav

三、语音转码16000HZ

ffmpeg -i 转码前.wav -ar 16000 转码后.wav

四、运行

# 1、运行哈利写的对比脚本
compare_voice.bat

# 2、输入第一段语音
# 3、输入第二段语音
# 4、输出相似度

【阿里云复仇记5】声纹识别，一句话识别，本地实现

简介

工具、代码下载

视频教程

部署与安装

一、3D-Speaker 安装（语音对比）

二、Voicefixer 安装（语音去噪，人声增强）

三、语音转码16000HZ

四、运行

发表回复取消回复

DeepSeek多模态识图、文生图、验证码识别

如何自动下载QQ空间里的相册照片

【搞机/刷机/Root】一加手机如何获取Root权限

音乐平台下载的歌曲都被加密了，如何将其转为MP3格式。

联系方式(咨询、协助需付费)

哈利的微信

哈利的小店

服务器太贵了，感谢大佬为爱充电

近期文章

文章分类

简介

工具、代码 下载

视频教程

部署与安装

一、3D-Speaker 安装（语音对比）

二、Voicefixer 安装（语音去噪，人声增强）

三、语音转码16000HZ

四、运行

发表回复 取消回复

DeepSeek多模态识图、文生图、验证码识别

如何自动下载QQ空间里的相册照片

【搞机/刷机/Root】一加手机如何获取Root权限

音乐平台下载的歌曲都被加密了，如何将其转为MP3格式。

联系方式(咨询、协助 需付费)

哈利的微信

哈利的小店

服务器太贵了，感谢大佬为爱充电

近期文章

文章分类

工具、代码下载

发表回复取消回复

联系方式(咨询、协助需付费)