而且还发现他们大多数是通过文字转WAV音频