他们很可能使用BTR文字转WAV音频