无非是头的位置低一些文字转WAV音频