针对的本就是原本的意识文字转WAV音频