从他们的口风中可以确定文字转WAV音频