那么他们的重心肯定是在左边路的文字转WAV音频