显然他们此时已经明白了文字转WAV音频