按照小薰的说法去推测的话文字转WAV音频