毕竟能够瞎蒙上去的概率是最大的文字转WAV音频