但他会用更多的东西来弥补文字转WAV音频