他的策略是明智正确的文字转WAV音频