最后发出的声音是支离破碎的文字转WAV音频