毕竟从任务描述中可以得知文字转WAV音频