当然用波段来代表可能不太恰当文字转WAV音频