他们也都是仔细观察文字转WAV音频