因为根据感知大地的结果文字转WAV音频