它们很难利用文字转WAV音频