那就是提前的在现实中创作文字转WAV音频