亚洲最大看欧美片,亚洲图揄拍自拍另类图片,欧美精品v国产精品v呦,日本在线精品视频免费

  • 站長資訊網(wǎng)
    最全最豐富的資訊網(wǎng)站

    百度機器閱讀理解競賽評審結(jié)束 最大、最具挑戰(zhàn)性數(shù)據(jù)集獲評“超贊”

      近日,由中國中文信息學(xué)會(CIPS)、中國計算機學(xué)會(CCF)聯(lián)手百度公司共同舉辦的“2018機器閱讀理解技術(shù)競賽” 圓滿落幕。來自全球各地的1062支參賽隊伍,在百度提供的中文閱讀理解數(shù)據(jù)集基礎(chǔ)上,對測試問題進行不斷探索,使得參賽系統(tǒng)水平得到顯著提升。大賽更多信息可登錄2018機器閱讀理解技術(shù)競賽官網(wǎng)http://mrc2018.cipsc.org.cn/查看。賽后,獲獎選手紛紛表示,百度向大眾開放大規(guī)模中文閱讀理解數(shù)據(jù)集意義深遠(yuǎn)。

    百度機器閱讀理解競賽評審結(jié)束 最大、最具挑戰(zhàn)性數(shù)據(jù)集獲評“超贊”

      共享優(yōu)質(zhì)數(shù)據(jù)集 百度直擊行業(yè)數(shù)據(jù)缺失痛點

      在機器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)是機器學(xué)習(xí)的原料,也是推進行業(yè)結(jié)構(gòu)轉(zhuǎn)型升級的燃料,而對于個人研究者與高校學(xué)子來說,數(shù)據(jù)缺失成為研究的困境所在。作為最大的中文搜索引擎,百度在數(shù)據(jù)方面具有得天獨厚的優(yōu)勢。2017年底,全球規(guī)模最大的“BROAD”百度AI公開數(shù)據(jù)集計劃(Baidu Research Open-Access Dataset)正式啟動,百度面向公眾開放包括室外場景理解數(shù)據(jù)集、視頻精彩片段數(shù)據(jù)集、閱讀理解數(shù)據(jù)集3個數(shù)據(jù)集。

      來自北京大學(xué)Dlib實驗室的尹伊淳正是在閱讀了百度DuReader數(shù)據(jù)集的論文后,才選擇參與到本次百度機器閱讀理解技術(shù)競賽中的。這批公開的、大規(guī)模、高質(zhì)量的真實數(shù)據(jù)集大大激發(fā)了他對于這項工作的興趣,使得他在最終角逐中獲得了總排名第二的好成績。

      本次機器閱讀理解競賽中百度提供給參賽者的,正是面向真實應(yīng)用場景的大規(guī)模閱讀理解數(shù)據(jù)集。該數(shù)據(jù)集是迄今為止最大的中文閱讀理解數(shù)據(jù)集,其中包含來自百度搜索的30萬個真實問題,每個問題對應(yīng)5個候選文檔文本,以及人工撰寫的優(yōu)質(zhì)答案。東北大學(xué)自然語言處理實驗室知識圖譜團隊在賽后表示,“數(shù)據(jù)集的開放使得機器閱讀理解系統(tǒng)得以映射到真實的使用場景中。”對于機器閱讀理解技術(shù)研究者而言,百度數(shù)據(jù)集彌合了國內(nèi)的真實場景語料多文檔閱讀理解數(shù)據(jù)集的空白,也為加速AI產(chǎn)品落地帶來了啟示。更多數(shù)據(jù)集論文可登錄https://arxiv.org/abs/1711.05073查看,供業(yè)界交流使用。

      獲獎團隊好評如潮 百度數(shù)據(jù)集帶來真實創(chuàng)想

      在比賽中,選手們依托百度閱讀理解數(shù)據(jù)集,參賽系統(tǒng)整體水平得到了顯著提升。比賽期間排行榜高分不斷刷新,ROUGE-L評價指標(biāo)由最初的35.96提升至終賽的63.38,接近半數(shù)的系統(tǒng)結(jié)果超過了基線系統(tǒng)。

      賽后,就百度數(shù)據(jù)集的數(shù)量與質(zhì)量,本次機器閱讀理解技術(shù)競賽的獲獎團隊,給出了一致好評。選手們紛紛表示,面向真實場景的大型閱讀數(shù)據(jù)集,為自然語言研究引入了寶貴的創(chuàng)想。

      最終在競賽中拔得頭籌的北京奇點機智科技有限公司(Naturali)團隊表示,此次比賽數(shù)據(jù)集聚焦于實用場景,問題來源于真實用戶,類型多樣,其中來源于真實網(wǎng)絡(luò)文檔的數(shù)據(jù),有別于經(jīng)過精心編輯的文檔,更有利于機器閱讀理解研究“從理想照進現(xiàn)實”。

      面向高校開源不斷 百度助力AI人才培養(yǎng)與升級

      作為一名機器學(xué)習(xí)方向的研究生,來自上海理工大學(xué)的王忠萌選手此前的研究材料以各種英文數(shù)據(jù)集為主。競賽中與百度數(shù)據(jù)集的交匯,點燃了他對中文機器閱讀理解的興趣。正如評測委員會成員劉凱所說,此次競賽提供的數(shù)據(jù),將幫助參賽者挖掘更多中文閱讀理解問題,同時更深入地接觸到實際的應(yīng)用需求,最終起到引導(dǎo)參賽者關(guān)注中文機器閱讀理解的目的。

      百度中文數(shù)據(jù)集的公開,只是百度數(shù)據(jù)集分享計劃的一小部分。百度通過本次競賽為學(xué)術(shù)界和工業(yè)界提供了一個公開的閱讀理解技術(shù)交流平臺,將大量優(yōu)質(zhì)的數(shù)據(jù)集與研究成果將觸達(dá)到更多高校學(xué)子和企業(yè)研究人員,降低了AI研究的門檻,使得個人研究者也能積極參與到系統(tǒng)研發(fā)與調(diào)試中去。這不僅直接推進了AI技術(shù)的發(fā)展進度,還將大量潛在的AI人才吸引到行業(yè)之中,培養(yǎng)與成就更多中國人工智能領(lǐng)域的精英技術(shù)人才,打造優(yōu)良的行業(yè)生態(tài)。

    特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

    贊(0)
    分享到: 更多 (0)
    網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號