是一种潜在的规则文字转WAV音频