亚洲最大看欧美片,亚洲图揄拍自拍另类图片,欧美精品v国产精品v呦,日本在线精品视频免费

  • 站長(zhǎng)資訊網(wǎng)
    最全最豐富的資訊網(wǎng)站

    英偉達(dá):美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)使用 NVIDIA T4 GPU,相比同成本 CPU 性能提升 10 倍

      12 月 25 日消息,據(jù)英偉達(dá)官方消息,美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)使用 NVIDIA GPU,通過(guò)算子融合、計(jì)算圖等價(jià)替換等一系列優(yōu)化 ,相較于 CPU 在相同成本約束下,NVIDIA T4 GPU 大幅加速美團(tuán) CTR(Click-Through-Rate)模型預(yù)測(cè)性能,神經(jīng)網(wǎng)絡(luò)模型吞吐能力提升了 10 倍;同時(shí)在搜索精排場(chǎng)景中,端到端整體吞吐能力提升了一倍以上。

    英偉達(dá):美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)使用 NVIDIA T4 GPU,相比同成本 CPU 性能提升 10 倍

      英偉達(dá)表示,美團(tuán)的 CTR 模型過(guò)去一直在使用 CPU 推理的方式,但隨著用戶訪問(wèn)量的提升和深度神經(jīng)網(wǎng)絡(luò)的引入,CTR 模型結(jié)構(gòu)趨于復(fù)雜,吞吐和計(jì)算量也越來(lái)越大,CPU 開(kāi)始不能滿足模型對(duì)于算力的需求,而僅僅通過(guò) CPU 服務(wù)器的堆疊帶來(lái)的性能提升性價(jià)比相較偏低。而 GPU 擁有數(shù)以千計(jì)的計(jì)算核心,可以在單機(jī)內(nèi)提供密集的并行計(jì)算能力,特別適合深度學(xué)習(xí)場(chǎng)景,在行業(yè)內(nèi)已經(jīng)在 CV、NLP 等領(lǐng)域展示了強(qiáng)大的能力。通過(guò) CUDA 及相關(guān) API,NVIDIA 建立了完整的 GPU 生態(tài)系統(tǒng)。基于此,美團(tuán)基礎(chǔ)研發(fā)平臺(tái)將 CTR 模型部署到 GPU 上,并通過(guò)一系列針對(duì) CPU 與 GPU 的異構(gòu)系統(tǒng)并行計(jì)算設(shè)計(jì)、數(shù)據(jù)存儲(chǔ)方式和傳輸方式上的特定優(yōu)化。

      NVIDIA Tesla T4 GPU 是一款推理加速器,搭載 NVIDIA Turing Tensor Core。官方稱,NVIDIA Tesla T4 GPU 具備人工智能推理的多精度計(jì)算性能,從 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,實(shí)現(xiàn)性能的重大突破。

    英偉達(dá):美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)使用 NVIDIA T4 GPU,相比同成本 CPU 性能提升 10 倍

    特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

    贊(0)
    分享到: 更多 (0)
    網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)