他们会自动合成一个世界文字转WAV音频