那么我们的重心肯定还是在北方文字转WAV音频