它们更注意连续性文字转WAV音频