也就是让他们两人自己决定数目文字转WAV音频