稀疏的行人文字转WAV音频