他不能直接表态文字转WAV音频