他们都是在接到指令后从四面八方赶来的文字转WAV音频