这个只不过是我们的假设文字转WAV音频