所以他强调的重点还是在于安全文字转WAV音频