在他的声音才刚刚发出的时候文字转WAV音频