一套方案就是刚才发生的一幕文字转WAV音频