显然是在构思该如何排布使用文字转WAV音频