
文章插图
Mel谱图mel谱图是频率转换为mel标度的谱图 。使用Python的librosa音频处理库它只需要几行代码就可以实现 。
【机器学习中的音频特征:理解Mel频谱图】
mel_spect = librosa.feature.melspectrogram(y=y, sr=sr, n_fft=2048, hop_length=1024)mel_spect = librosa.power_to_db(spect, ref=np.max)librosa.display.specshow(mel_spect, y_axis='mel', fmax=8000, x_axis='time');plt.title('Mel Spectrogram');plt.colorbar(format='%+2.0f dB');
文章插图
总而言之如果你像我一样是信号处理新手的话 , 这里有很多概念需要了解 。然而 , 如果你继续回顾这篇文章中提出的概念(花足够的时间盯着墙角思考它们) , 它就会开始有意义了!让我们简要回顾一下我们所做的工作 。
我们随时间采集了气压样本 , 以数字方式表示音频信号
1. 我们使用快速傅里叶变换将音频信号从时域映射到频域 , 并在音频信号的重叠窗口部分执行此操作 。
1. 我们将y轴(频率)转换为对数刻度 , 将颜色尺寸(幅度)转换为分贝 , 以形成频谱图 。
1. 我们将y轴(频率)映射到mel刻度上以形成mel频谱图 。
听起来很简单 , 对吧? 好吧 , 虽然不尽然 , 但是我希望这篇文章能使你了解音频特征的处理和梅尔频谱图的原理 。
作者:Leland Roberts
deephub 翻译组
推荐阅读
- 七月流火中流火的意思 七月流火中的火是什么意思
- Android中的三个蓝牙漏洞
- 高尔夫教学须知 高尔夫学习技巧
- 瘦人长胖最有效的方法是什么?
- 手机|央视网评下班前发手机电量截图:员工不是机器人!
- 中国古代十大刑法中的点天灯 古代刑法点天灯是什么
- 广告投放中的CPC和OCPC有什么区别?
- 四书五经中的四书指的是论语大学中庸和哪本书 论语属于四书五经吗
- 历史中的和珅 真实的和珅
- 用Python识别图片中的文字
