代码收藏家技术教程 2022-07-27

python读取音频文件的几种方式

今天也要加油鸭！冲冲冲😊

文章目录

1、wavefile.read

2、soundfile.read

3、librosa.load

4、torchaudio.load

总结

前言

由于本人研究的音频方面，一开始读取音频文件的时候就遇到了一些问题，比如，这个函数返回的是numpy,另外一个函数返回tensor，巴拉巴拉等等问题，所以在这里做一个简单的整理。

代码示例如下：

from scipy.io import wavfile
fs, audio = wavfile.read("0.wav")
print(type(audio))

得到的结果为：

<class 'numpy.ndarray'>

代码示例如下：

import soundfile as sf
audio, fs = sf.read("0.wav")
print(type(audio))

得到的结果为：

<class 'numpy.ndarray'>

代码示例如下：

import librosa
audio, fs = librosa.load("0.wav")
print(type(audio))

得到的结果为：

<class 'numpy.ndarray'>

代码示例如下：

import torchaudio
audio, fs = torchaudio.load("0.wav")
print(type(audio))

返回的结果为：

<class 'torch.Tensor'>

需要注意的两点：

(1)wavefile、soundfile、torchaudio返回的fs是文件本身的采样率；librosa返回的fs默认22050Hz。

(2)注意audio和fs的前后顺序。

以上就是总结的内容啦

来源：冲冲冲鸭鸭鸭~

分享到：