亚洲人成日本片,国产精品偷窥女精品视频,欧美老妇人在线一区二区三区,国产午夜福利不卡在线观看视频

<s id="2ymhs"></s>

<acronym id="2ymhs"></acronym>

<ol id="2ymhs"></ol>

<s id="2ymhs"></s>

<dfn id="or5lm"></dfn>

<address id="or5lm"><var id="or5lm"></var></address>

每日經(jīng)濟新聞

商訊推薦

每經(jīng)網(wǎng)首頁 > 商訊推薦 > 正文

受資本青睞長文本真的牛嗎？

2024-06-03 18:25:03

大模型長文本一度被吹捧為行業(yè)的未來，然而，這項技術(shù)是否真的值得如此高度推崇？又或許，其中隱藏的只是一場資本的角力游戲。

長文本技術(shù)今年來風(fēng)靡全球，一度被視為人工智能領(lǐng)域的重要突破之一，這項技術(shù)的應(yīng)用范圍廣泛，涵蓋自動寫作、智能客服、新聞報道等諸多領(lǐng)域，看似威力無窮。

但對于大模型長文本的真實效果，事實上業(yè)內(nèi)也有人質(zhì)疑，認為部分大模型使用的并非真正的長文本技術(shù)，而是RAG技術(shù)（即檢索增強生成技術(shù)），可能存在邏輯錯誤、信息不準確甚至是完全虛構(gòu)的情況。這種問題在某些場景下尤為突出，比如金融分析、醫(yī)療診斷等需要高度準確性的領(lǐng)域，一篇虛假的長文本分析可能導(dǎo)致嚴重的后果。

與此同時，資本市場對大模型長文本技術(shù)的熱情卻愈發(fā)高漲。一些知名的科技投資機構(gòu)紛紛將目光投向這一領(lǐng)域，希望能夠在這場技術(shù)革命中分得一杯羹。

資本賺錢才是真相？在這場大模型長文本的風(fēng)暴中，或許是如此。技術(shù)的價值固然重要，但更重要的是能否為投資者帶來可觀的回報。或許，在技術(shù)和資本之間，還需要找到一種平衡，才能真正實現(xiàn)人工智能的價值和意義。

長文本技術(shù)仍各有局限

長文本處理自年初突然成為人們關(guān)注的焦點之一。

然而，在現(xiàn)階段的長文本技術(shù)主要依賴的三種方法，依舊存在各自的局限性。算力與硬件的限制、滑動窗口的信息丟失以及RAG技術(shù)的信息遺漏，都在一定程度上制約了長文本技術(shù)的發(fā)展。

堆算力、堆硬件是目前主流的一種方式。大模型底層技術(shù)transformer架構(gòu)的限制使得對上百萬長文本的閱讀成為一項艱巨的任務(wù)。每一個“字”都會被換算成大模型能讀懂的token（即最小語義單元）來計算，導(dǎo)致算力成本高昂。企業(yè)只能不斷堆積算力和硬件，以支撐大規(guī)模的計算需求。然而，復(fù)雜外部因素導(dǎo)致資源有限，尤其是對于創(chuàng)業(yè)公司而言，實現(xiàn)算力自由成為一大挑戰(zhàn)。

滑動窗口技術(shù)是另一種常見的處理長文本的方法。這種方法將長文本分割成一段一段，并分別進行總結(jié)和標記。然而，這種處理方式往往會導(dǎo)致信息的丟失，無法完整理解長文本的內(nèi)容。最終的效果會大打折扣，無法達到理想的效果。

RAG技術(shù)（檢索增強生成技術(shù)）被某些AI創(chuàng)業(yè)公司鼓吹為解決長文本處理的利器。RAG技術(shù)可以從文檔中搜索出相關(guān)內(nèi)容，并將這些內(nèi)容提供給大模型進行推理。然而，這種技術(shù)可能只讀取文檔的部分內(nèi)容，然后通過從互聯(lián)網(wǎng)檢索的信息進行總結(jié)和分析。這種方式往往會遺漏關(guān)鍵信息，導(dǎo)致回答的質(zhì)量不高。

然而目前來看，RAG技術(shù)也暴露出了一些問題。首先，其對外部搜索的依賴性非常高，需要依靠龐大的文檔數(shù)據(jù)庫來支撐生成過程。這就意味著，若文檔庫的質(zhì)量或覆蓋范圍不足，可能會導(dǎo)致生成的內(nèi)容質(zhì)量參差不齊。其次，由于檢索結(jié)果是無法完全控制的，因此也存在著不可控的風(fēng)險，可能會引入一些不準確或不相關(guān)的信息，影響最終的結(jié)果。

在這樣的背景下，事實上一些從傳統(tǒng)搜索引擎起家的大模型公司似乎具備了更強的競爭優(yōu)勢。這些公司擁有龐大的文檔數(shù)據(jù)庫和成熟的搜索技術(shù)，能夠更好地支撐RAG技術(shù)的應(yīng)用。同時，傳統(tǒng)搜索公司在檢索增強方面擁有更豐富的經(jīng)驗和資源，能夠更好地控制檢索結(jié)果，提高內(nèi)容的質(zhì)量和相關(guān)性。

大模型發(fā)展應(yīng)回歸用戶需求

盡管長文本在某些專業(yè)領(lǐng)域有其獨特之處，但在日常應(yīng)用中，非長文本創(chuàng)作的需求實則更為廣泛，而且上下文理解能力也顯得更加重要。

目前來看，長文本處理的算力限制使得其對上下文的理解能力有所不足。盡管長文本能力對金融、法律、科研等領(lǐng)域的專業(yè)人士來說可能是不可或缺的工具，幫助他們快速閱讀研究報告、分析財務(wù)數(shù)據(jù)、閱讀科研論文等。然而，長文本處理需要大量的計算資源支持，這在一定程度上，依舊限制著對上下文的深度理解。

與此同時，長文本是否“越長越好”爭議依舊存在。一些業(yè)內(nèi)人士認為，今年大模型的開放文本長度并不具備太大的意義，據(jù)《經(jīng)濟觀察報》報道，有投資人表示，“去年大模型公司都在卷參數(shù)，從千億卷到萬億，意義并不大。”莊明浩稱，今年大模型開卷的文本長度，可能也沒有太大意義，“誰會經(jīng)常把1000萬字的文本喂給大模型？”

得益于在金融、法律、科研等領(lǐng)域，長文本的處理需求日益增加，長文本處理能力確實被認為是大模型的一大優(yōu)勢。然而，長文本處理能力在某些特定領(lǐng)域的突出表現(xiàn)并不意味著大模型發(fā)展應(yīng)該完全偏向于長文本。相反，作為從業(yè)者而言，或許應(yīng)該警惕技術(shù)發(fā)展的偏離，應(yīng)該回歸用戶的實際需求，尋找更廣泛、更實用的應(yīng)用場景。

長文本處理能力固然重要，但并不是所有用戶都需要長文本處理能力。在實際應(yīng)用中，絕大多數(shù)用戶更關(guān)心的是如何更高效地完成日常任務(wù)，如寫作、搜索、語音識別等。因此，大模型的發(fā)展應(yīng)該更加注重普適性，滿足更廣泛的用戶需求。

隨著AI普惠化成為主流趨勢，對于大部分科技公司而言，讓更多人能夠分享到科技的成果是更加務(wù)實，同時也是更加可持續(xù)的選擇。對絕大多數(shù)用戶而言，日常非長文本創(chuàng)作需求更為迫切，提高創(chuàng)作效率是真正的剛需。在這方面，上下文理解能力的提升比長文本處理能力更為關(guān)鍵。未來，AI技術(shù)的發(fā)展方向應(yīng)當更加注重滿足日常生活中的實際需求，以推動技術(shù)的普及和應(yīng)用的廣泛化。

在AIGC時代飛速向前的關(guān)鍵時刻，大模型的開發(fā)者和研究者，也應(yīng)當時刻審視技術(shù)的發(fā)展方向，回歸用戶需求，實現(xiàn)技術(shù)的真正價值。只有這樣才能夠?qū)崿F(xiàn)技術(shù)的可持續(xù)發(fā)展，為人類社會的進步作出更大的貢獻。

責(zé)編魏小靜

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

天華新能：累計回購約620萬股

返回每經(jīng)網(wǎng)首頁

下一篇文章

中成股份：實控人正在籌劃相關(guān)資產(chǎn)專業(yè)化整合

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn