所以并不会遗漏什么细节文字转WAV音频