但更重要的是有自己的推理文字转WAV音频