在里面已经听到了外面细微的说话声文字转WAV音频