就是因为不确定我们是否有机会文字转WAV音频