虽然在双方有意识的引导下文字转WAV音频