分出一部分的注意力进行文字转WAV音频