另一半的原因是因为自己紧张文字转WAV音频