他们虽然觉得这样分配文字转WAV音频