而所算的结果却又是包涵了人和事文字转WAV音频