得出一个大体方向的推理文字转WAV音频