他八成也是会选择与莎尔类似的做法文字转WAV音频