虽然他们两个的消耗也巨大文字转WAV音频