但是却根本不明白这些细微声音的差别都各自代表了什么文字转WAV音频