前者很难办到文字转WAV音频