恐怕很容易忽略过去文字转WAV音频