fix: 修复WebM音频格式支持,改用librosa读取

This commit is contained in:
2026-04-21 18:33:50 +08:00
parent 8d45553ea6
commit 93e7e33c2f

View File

@@ -82,18 +82,10 @@ def process_audio(audio_bytes: bytes) -> tuple:
处理音频文件
返回: (audio_array, sample_rate)
"""
# 使用 soundfile 读取音频
audio_io = io.BytesIO(audio_bytes)
audio, sr = sf.read(audio_io)
# 转换为单声道
if len(audio.shape) > 1:
audio = audio.mean(axis=1)
# 重采样到 16kHz
if sr != SAMPLE_RATE:
import resampy
audio = resampy.resample(audio, sr, SAMPLE_RATE)
# 使用 librosa 读取音频支持更多格式WAV, WebM, MP3, FLAC 等)
audio, sr = librosa.load(audio_io, sr=SAMPLE_RATE, mono=True)
return audio, SAMPLE_RATE