可通过他们的行为与言语文字转WAV音频