而且他只是掌控文字转WAV音频