如果是按照一般人在黑暗中的逻辑文字转WAV音频