大致猜到他的想法文字转WAV音频