将一段完整的场景记录下来……文字转WAV音频