但更多都是在他们彼此之前转移文字转WAV音频