虽然事先在脑海中模拟多次文字转WAV音频