6月24日,2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)在京揭曉,共評(píng)選出250個(gè)項(xiàng)目。記者了解到,由科大訊飛股份有限公司牽頭,聯(lián)合中國(guó)科學(xué)技術(shù)大學(xué)、清華大學(xué)等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目榮獲2023年度國(guó)家科技進(jìn)步獎(jiǎng)一等獎(jiǎng)。據(jù)悉,這是深度學(xué)習(xí)引發(fā)全球人工智能浪潮以來,過去十年人工智能領(lǐng)域的首個(gè)國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)。
據(jù)了解,多語種智能語音技術(shù)對(duì)于支撐人機(jī)交互、人類語言互通及國(guó)家安全等需求具有重大戰(zhàn)略意義,具有十分廣闊的產(chǎn)業(yè)前景,是當(dāng)前國(guó)際科技競(jìng)爭(zhēng)的核心焦點(diǎn)之一。然而,智能語音也面臨著如何突破復(fù)雜場(chǎng)景語音技術(shù)大規(guī)模實(shí)用門檻,如何基于自主可控的平臺(tái)、實(shí)現(xiàn)國(guó)產(chǎn)軟硬件的語音產(chǎn)業(yè)鏈自主可控等問題。
為解決這一技術(shù)難題,科大訊飛聯(lián)合各單位、企業(yè)持續(xù)攻關(guān)十余年,通過提出復(fù)雜語音信號(hào)解耦建模技術(shù)、多語種共享建模技術(shù)、語音語義聯(lián)合建模技術(shù)、國(guó)產(chǎn)異構(gòu)硬件平臺(tái)訓(xùn)練及推理加速技術(shù)等,實(shí)現(xiàn)了國(guó)產(chǎn)多語種智能語音的關(guān)鍵技術(shù)突破,構(gòu)建形成了自主可控的智能語音技術(shù)體系。據(jù)悉,科大訊飛也是唯一獲得本屆國(guó)家科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)的民營(yíng)企業(yè)。
記者了解到,多語種智能語音技術(shù)是包含多語種語音識(shí)別、多語種語音合成、多語種翻譯技術(shù)等在內(nèi)的綜合技術(shù),也是新一代人工智能核心技術(shù)之一。目前,該技術(shù)支持全球69個(gè)主流語種,除了6個(gè)聯(lián)合國(guó)通用語言(漢語、英語、法語、西班牙語、俄語、阿拉伯語)之外,還包括挪威語、丹麥語等小語種54個(gè),均達(dá)國(guó)際通用標(biāo)準(zhǔn)。
如今,該技術(shù)成果不僅在博鰲論壇等重要政務(wù)和商務(wù)交流場(chǎng)合得到廣泛應(yīng)用,更在中國(guó)品牌“走出去”戰(zhàn)略中發(fā)揮了關(guān)鍵推動(dòng)作用。以近年來國(guó)產(chǎn)新能源汽車的海外出口為例,中國(guó)汽車出口企業(yè)十強(qiáng)中,有八家搭載了科大訊飛的多語種智能語音技術(shù),涵蓋23個(gè)語種,服務(wù)范圍擴(kuò)展至60多個(gè)國(guó)家和地區(qū),為中國(guó)汽車行業(yè)的國(guó)際化進(jìn)程提供了有力支撐。
記者了解到,近三年,多語種智能語音技術(shù)產(chǎn)業(yè)化項(xiàng)目累計(jì)實(shí)現(xiàn)直接經(jīng)濟(jì)效益521.28億元,并帶動(dòng)由工信部和安徽省政府共建、以科大訊飛為核心的“中國(guó)聲谷”產(chǎn)業(yè)集聚發(fā)展。
6月27日,訊飛星火V4.0也將正式發(fā)布,底座能力全面對(duì)標(biāo)GPT-4 Turbo,語音大模型也將迎來全新升級(jí)。