为了族群的稳定文字转WAV音频