python读取音频文件的几种方式
今天也要加油鸭!冲冲冲😊
文章目录
1、wavefile.read
2、soundfile.read
3、librosa.load
4、torchaudio.load
总结
前言
由于本人研究的音频方面,一开始读取音频文件的时候就遇到了一些问题,比如,这个函数返回的是numpy,另外一个函数返回tensor,巴拉巴拉等等问题,所以在这里做一个简单的整理。
1、wavefile.read
代码示例如下:
from scipy.io import wavfile
fs, audio = wavfile.read("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
2、soundfile.read
代码示例如下:
import soundfile as sf
audio, fs = sf.read("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
3、librosa.load
代码示例如下:
import librosa
audio, fs = librosa.load("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
4、torchaudio.load
代码示例如下:
import torchaudio
audio, fs = torchaudio.load("0.wav")
print(type(audio))
返回的结果为:
<class 'torch.Tensor'>
需要注意的两点:
(1)wavefile、soundfile、torchaudio返回的fs是文件本身的采样率;librosa返回的fs默认22050Hz。
(2)注意audio和fs的前后顺序。
总结
以上就是总结的内容啦
来源:冲冲冲鸭鸭鸭~