亚洲人成日本片,国产精品偷窥女精品视频,欧美老妇人在线一区二区三区,国产午夜福利不卡在线观看视频

  • <s id="2ymhs"></s>

    <acronym id="2ymhs"></acronym>

    <ol id="2ymhs"></ol>
        <s id="2ymhs"></s>

      • 每日經(jīng)濟新聞
        要聞

        每經(jīng)網(wǎng)首頁 > 要聞 > 正文

        DeepSeek公開大模型高效訓練又一秘訣!這家公司盤中直線拉升7.5%,背后有什么聯(lián)系?

        每日經(jīng)濟新聞 2025-02-25 16:58:44

        2月25日,DeepSeek宣布開源其DeepEP代碼庫,這是首個用于混合專家模型訓練和推理的開源專家并行通信庫。雖然EP技術能以較低的通信成本完成模型訓練,但中金認為,這種通信設計技術的進展并不一定會使高速通信的需求減少。值得注意的是,DeepEP代碼庫開源后半小時,兆龍互連股價一度拉升7.53%。這背后有無關聯(lián)?

        每經(jīng)記者 岳楚鵬    每經(jīng)編輯 蘭素英    

        2月25日,DeepSeek開源周第二波來襲。

        DeepSeek宣布開源DeepEP的代碼庫。DeepEP是首個用于混合專家(MoE)模型訓練和推理的開源專家并行 (EP)通信庫。

        和昨日開源的FlashMLA是核心技術MLA(多頭潛在注意力)的改進版本一樣,DeepEP也是DeepSeek-V3核心技術EP的改進版本。它提供高吞吐量和低延遲的全對全GPU內核,適用于MoE的分發(fā)(dispatch)和合并(combine)操作。 

        DeepSeek聲稱,DeepEP的特點包括高效的全員溝通;節(jié)點內和節(jié)點間均支持NVLink和RDMA;用于訓練和推理預填充的高吞吐量內核;用于推理解碼的低延遲內核;原生FP8調度支持;靈活的GPU資源控制,實現(xiàn)計算-通信重疊。

         

        圖片來源:X

        DeepSeek的官方解釋不免有些技術流,《每日經(jīng)濟新聞》記者邀請了DeepSeek模型來深入淺出地介紹下這一技術。

        雖然EP技術能以較低的通信成本完成模型訓練,但中金在最新的研報中認為,這種通信設計技術的進展并不一定會使高速通信的需求減少。

        中金認為,由于張量并行(TP)和專家并行(EP)的通信開銷比較沒有絕對的多少之分,受制于多種因素限制,因此在張量或專家并行的選擇上,需要具體問題具體分析,本質上都是現(xiàn)有硬件條件下的平衡。通信方面大量使用專家并行而減少張量并行并不能證明高速互聯(lián)需求在更強基礎模型訓練中呈下降趨勢。

        值得注意的是,在DeepSeek宣布開源DeepEP軟件庫后半個小時,兆龍互連(300913.SZ)的股價直線拉升7.53%,但隨后回落,截至收盤,兆龍互聯(lián)報收于每股60.57元,下跌1.5%。

        兆龍互連是一家什么樣的公司?和DeepSeek的開源有沒有關聯(lián)?

        針對這一問題,每經(jīng)記者使用了每日經(jīng)濟新聞App的“問投資”功能尋找答案。

        記者輸入兆龍互連的公司名后,頁面就彈出了股票趨勢、資金、機構和概念等十大維度。

        記者點擊“概念”維度后,發(fā)現(xiàn)兆龍互連是一家涉足高速通信設備(銅纜高速連接)的公司。不過,DeepSeek認為兆龍互連的盤中快速反彈,是受短期情緒驅動的,并沒有直接證據(jù)表明兆龍互連的股價和這項技術的開源有聯(lián)系。


        不得不說,在每日經(jīng)濟新聞App里使用DeepSeek非常絲滑,不會碰見“服務器繁忙”的情況。目前使用量已經(jīng)超14萬次了! 

        咋用呢?超簡單!

        先下載每日經(jīng)濟新聞App

        http://imagmundi.com/corp/2016app/index.html

        再往下看

        一、 在每日經(jīng)濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。 

        二、 進入“每經(jīng)大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。 

        最近,每經(jīng)“136計劃”還增加了新功能: 

        大模型解讀投資熱榜。  

        只需點擊投資熱榜中的任意新聞。

        立即就能得到大模型的全面分析。

        還能一鍵生成圖片分享給朋友。


        告別“服務器繁忙” 

        快用每日經(jīng)濟新聞App吧!

        免責聲明:本文內容與數(shù)據(jù)僅供參考,不構成投資建議,使用前請核實。據(jù)此操作,風險自擔。

        如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
        未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

        讀者熱線:4008890008

        特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

        DeepSeek 模型 兆龍互連 銅纜高速連接

        歡迎關注每日經(jīng)濟新聞APP

        每經(jīng)經(jīng)濟新聞官方APP

        2

        0