但是从两人的口型和表情举止也能猜的大概了文字转WAV音频