亚洲最大看欧美片,亚洲图揄拍自拍另类图片,欧美精品v国产精品v呦,日本在线精品视频免费

  • 站長資訊網
    最全最豐富的資訊網站

    字節(jié)跳動火山翻譯上新 38 個稀有語種,自研訓練模型效率提升超 500%

      12 月 31 日消息,2021 年 12 月,字節(jié)跳動旗下的火山翻譯官網,上新了包括世界語、塔希提語、韃靼語等在內的 38 個稀有語種的翻譯。目前,包括漢語、英語、阿拉伯語、俄語、法語、西班牙語六個通用語種在內,火山翻譯已具備 94 個語種、8742 個語向的翻譯能力,整體 bleu(機器翻譯質量自動評估指標)達 33.45,處于行業(yè)領先水平。

    字節(jié)跳動火山翻譯上新 38 個稀有語種,自研訓練模型效率提升超 500%

    ▲ 藍色部分為火山翻譯上新的 38 個語種

      據了解,通過采用自研的 mRASP 多語言模型,火山翻譯僅使用一個模型就完成了上述 38 個語種與英文的雙向互譯,突破了傳統(tǒng)雙語言翻譯模型對每個語向單獨訓練、單獨上線服務的方式,大幅降低機器學習的訓練和服務成本。

      “通常情況下,訓練 76 個語向的雙語言模型需要 150-200 天。而相同硬件條件下,訓練一個多語言模型只需要 30 天。”火山翻譯團隊介紹,“對于請求量小的語種,使用 mRASP 模型集中服務可以大大節(jié)省計算資源,僅需半張用于深度學習訓練的 Tesla T4 顯卡就可以滿足 38 個語言的全部翻譯請求,和雙語翻譯所需的資源一樣。”

      火山翻譯通過 mRASP 中的對比學習和詞對齊信息,可以很好地借助單語語料和其他擁有豐富語料的語種來幫助訓練,彌補訓練數據的不足。數據顯示,火山翻譯此次上新的稀有語種平均 bleu 值達 33.36,其中,海地語翻譯表現最為突出,bleu 值達 50.76。

      目前,火山翻譯擁有:火山同傳、機器翻譯與視頻翻譯三大產品,支持飛書、今日頭條、西瓜視頻等業(yè)務的翻譯需求,并通過字節(jié)跳動旗下的企業(yè)級技術服務平臺火山引擎對外提供翻譯服務。

    特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

    贊(0)
    分享到: 更多 (0)
    網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號