它们都不会利用文字转WAV音频