音频文件降噪及python示例

python · 浏览次数 : 15

正文

操作系统 :Windows 10_x64

Python版本:3.9.2

noisereduce版本:3.0.2

从事音频相关工作,大概率会碰到降噪问题,今天整理下之前学习音频文件降噪的笔记,并提供Audacity和python示例。

我将从以下几个方面展开:
  • noisereduce库介绍
  • 使用Audacity进行降噪
  • 使用fft滤波降噪
  • 使用noisereduce进行降噪
  • 运行效果截图及视频
  • 配套资源下载

一、noisereduce库介绍

pypi地址:https://pypi.org/project/noisereduce/

 

GitHub地址:

https://github.com/timsainb/noisereduce

安装命令:

pip install noisereduce

noisereduce库用于音频降噪,支持稳态降噪和非稳态降噪,大致介绍如下:

其中稳态降噪基于(并不完全是)Audacity的降噪算法,降噪Audacity效果可通过体验,对应的C++实现如下:

https://github.com/audacity/audacity/blob/master/src/effects/NoiseReduction.cpp

如果链接打不开,可从文末提供的渠道获取该文件。

Audacity的降噪算法需要两个输入:1) 带噪音的音频数据;2) 噪音特征音频数据;

其核心思路是通过fft在频域进行滤波处理并还原,具体实现建议阅读源码。

非稳定降噪算法是稳态降噪算法的扩展,但允许噪声门随时间变化。

二、噪音文件准备

Audacity版本:3.1.3

这里使用Audacity进行噪音文件的生成,如果不了解Audacity软件,可参考这篇文章:

1、生成鼓点音轨,模拟正常音频

这里使用鼓点模拟正常音频,具体如下:

2、生成噪音音轨

选择菜单“生成-》噪音”选项,这里选择“白噪音”,振幅选择0.1:

3、合并音轨并导出文件

选中两个音轨,然后混音:

如果想直接使用导出的混音文件(mix1.wav),可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240720 获取。

三、降噪示例

这里首先描述下如何使用Audacity进行降噪,其中,Audacity降噪是完全操作层面的事情,不涉及编写代码;进一步的,会提供如何使用fft进行滤波降噪的示例,主要是模拟稳态降噪算法(并不完全是);最后,会提供如何使用noisereduce进行降噪的示例。

1、使用Audacity进行降噪

1) 选中噪音特征数据

 2) 获取噪音特征数据

 3) 选中需要降噪的原始音频,执行降噪操作

 降噪后的效果如下:

 使用Audacity进行降噪的过程及效果视频,可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 2024072001 获取。

2、使用fft滤波降噪

傅立叶变换是可逆的,在频域中对信号所做的任何更改都将在将其变换回时域时应用。可利用这一点来过滤音频并去除高频,进而实现降噪,当然该方法仅适用于高频噪音。

直接在频域进行过滤,大致流程如下:

1) 加载混音文件(mix1.wav),使用fft获取频域数据;
2) 加载噪音文件(noise1.wav),使用fft获取频域数据;
3) 在频域进行滤波;
4) 进行ifft逆变换;
5) 导出降噪后的文件;

示例如下(fftTest1.py):

完整源码可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240720 获取。

 使用noisereduce库进行降噪的运行效果视频,可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 2024072003 获取。

3.2 使用标准降噪

也可以使用标准降噪,提取音频特征文件后过滤,示例如下:

from scipy.io import wavfile
import noisereduce as nr
# load data
rate, data = wavfile.read("mix1.wav")
_, noise_data = wavfile.read("noise1.wav")
# perform noise reduction
reduced_noise = nr.reduce_noise(y=data, sr=rate,
y_noise =noise_data,
stationary = True, # this should be true
#sigmoid_slope_nonstationary = 50,

)
wavfile.write("clean_nr2.wav", rate, reduced_noise)

运行效果如下:

三、资源下载

本文涉及源码及相关文件,可以从如下途径获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240720 获取。

与音频文件降噪及python示例相似的内容:

音频文件降噪及python示例

操作系统 :Windows 10_x64 Python版本:3.9.2 noisereduce版本:3.0.2 从事音频相关工作,大概率会碰到降噪问题,今天整理下之前学习音频文件降噪的笔记,并提供Audacity和python示例。 我将从以下几个方面展开: noisereduce库介绍 使用Aud

【Azure 媒体服务】Azure Media Service上传的视频资产,如何保证在Transfer编码后音频文件和视频文件不分成两个文件?保持在一个可以直接播放的MP4文件中呢?

问题描述 Azure Media Service上传的视频资产,如何保证在Transfer编码后音频文件和视频文件不分成两个文件?保持在一个可以直接播放的MP4文件中呢? 问题解答 Azure Media Service上提供的 Build-in Transform 生成的资产中,音频与视频分别存储

川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍

你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师.. 这听起来似乎很魔幻,可如今全部由VideoReTalking实现了 你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也

音频编辑服务UI SDK接入指导及常见问题

华为 HMS Core 音频编辑服务(Audio Editor Kit)是华为帮助全球开发者快速构建各类应用音频能力的服务,汇聚了华为在音乐、语音等相关音频领域的先进技术。音频编辑服务为开发者们提供音频基础编辑、AI配音、音源分离、空间渲染、变声、多种音效等丰富的音频处理能力,以及性能优异、简单易用

空间音频技术与生态发展高峰论坛成功举办,业界首个Audio Vivid创作工具花瓣三维声亮相

11月26日至27日,UWA世界超高清视频产业联盟(以下简称“UWA联盟”)、上海交通大学-南加州大学文化创意产业学院、华为联合举办了“互联智慧,共赢未来” 超高清音视频技术与生态发展高峰论坛暨Audio Vivid空间音频工具花瓣三维声训练营。中央广播电视总台超高清视音频制播呈现国家重点实验室、I

Java 把多个音频拼接成一个

本文简要介绍了Java 把多个音频拼接成一个音频的方法,给出了一个基于JLayer(用于MP3)和TarsosDSP(一个音频处理库)的简化示例,并给出了详细的代码示例。

【ESP32】制作 Wi-fi 音箱(HTTP + I2S 协议)

用 Wifi 来传输音频数据,会比蓝牙更好。使用蓝牙方式,不管你用什么协议,都会对数据重新编码,说人话就是有损音质,虽然不至于全损。而使用 Wifi 就可以将 PCM 数据直接传输,无需再编码和压缩。在 ESP32 开发板上可以通过 I2S(IIS)向功放芯片发出音频数据。 关于 i2s 的时序,老

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识(Automatic Speech Recognition,ASR)模型是被训练来运行语音辨识与

AR空间音频能力,打造沉浸式声音体验

随着元宇宙的兴起,3D虚拟现实广泛引用,让数字化信息和现实世界融合,目前大家的目光主要聚焦于视觉交互层面,为了在虚拟环境中更好的再现真实世界的三维空间体验,引入听觉层面必不可少,空间音频孕育而生。 空间音频是一种音频体验,会让用户更容易体验到声音的立体感和深度,将环绕声更准确地定位在合适的方位,让用

AI赋能音乐创作,人人都是音视频创作者

华为HMS Core音频编辑服务(Audio Editor Kit)依托自身AI技术的研发优势,上线全新的歌声合成音色及伴奏,给音视频创作者提供更多的创作可能。在短视频场景中,用户自定义歌词的歌声结合视频让用户感受到身临其境,自由表达自己的情绪;在虚拟偶像场景中,歌声合成功能赋予虚拟歌手们演唱风格各