形成了一个半透明的人形文字转WAV音频