理论上两人完全不认识文字转WAV音频