现在两者就是在熬时间文字转WAV音频