他认为咱们可以接受到八百万文字转WAV音频