刚刚的说话声就是他文字转WAV音频