每日經(jīng)濟(jì)新聞 2023-09-07 23:18:55
每經(jīng)記者 溫雅蘭 每經(jīng)編輯 張凌霄
人工智能是把雙刃劍。技術(shù)的使用在推動(dòng)社會(huì)經(jīng)濟(jì)飛速發(fā)展的同時(shí),也會(huì)帶來多重“安全隱憂”。
9月7日,在2023 Inclusion•外灘大會(huì)上,中國(guó)科學(xué)院院士何積豐以《大模型時(shí)代的安全問題》為題,與大家共同探討大模型發(fā)展所帶來的安全問題以及應(yīng)對(duì)之道。
人工智能擁有超強(qiáng)的自主學(xué)習(xí)能力,進(jìn)化速度極快,在數(shù)次迭代升級(jí)后,是否有可能在多個(gè)方面超越人類?
何積豐提到:“人類與機(jī)器都在學(xué)習(xí)。人類指導(dǎo)機(jī)器,機(jī)器不斷學(xué)習(xí)變得更加智能;在這一過程中人類也要學(xué)習(xí)指導(dǎo)方法,使機(jī)器所生成的內(nèi)容能夠更符合人類需要。”何積豐表示,在人工智能技術(shù)發(fā)展過程中,要牢記人類的核心角色,人工智能技術(shù)將成為人類的助手,而不是替代人類創(chuàng)造未來。
談及當(dāng)前大模型帶來的安全隱患,何積豐認(rèn)為,問題主要集中在隱私泄露以及對(duì)齊兩方面。
保護(hù)隱私安全至關(guān)重要
何積豐指出,隱私問題,即未經(jīng)本人同意的情況下,收集、使用和泄露個(gè)人信息,是大模型發(fā)展過程中最受關(guān)注的問題。
具體來看,他認(rèn)為,隱私問題在大模型的訓(xùn)練、與用戶對(duì)話和結(jié)果生成三個(gè)階段都有所涉及。
首先,大模型與傳統(tǒng)機(jī)器學(xué)習(xí)不同,其訓(xùn)練需要大量數(shù)據(jù),在這一過程中,盡管研究人員早已采取相關(guān)措施,但是提示技術(shù)仍然使得大量用戶的個(gè)人信息和數(shù)據(jù)被大模型吸入,從而造成隱私泄露。
其次,大模型在與用戶對(duì)話過程中,可能涉及到眾多用戶私密信息,而這類信息往往沒有受到應(yīng)有的隱私保護(hù)。如在使用大模型的過程中,數(shù)據(jù)控制鍵將要求用戶選擇“結(jié)束對(duì)話”或“繼續(xù)對(duì)話并允許獲取數(shù)據(jù)”。這意味著如果選擇繼續(xù)對(duì)話,將可能造成隱私泄露;如果選擇保護(hù)隱私,將會(huì)失去使用權(quán)。
再次,大模型在產(chǎn)出結(jié)果時(shí),其強(qiáng)大的生成力也讓隱私泄露的方式變得更加多元,用戶隱私獲取將更加容易,而這也將隱私保護(hù)變得更加困難。
反饋強(qiáng)化學(xué)習(xí)是實(shí)現(xiàn)對(duì)齊的技術(shù)途徑
而對(duì)齊問題,即引導(dǎo)智能系統(tǒng)的目標(biāo)和人類價(jià)值觀一致,使其符合設(shè)計(jì)者的利益和預(yù)期,不會(huì)產(chǎn)生意外的有害后果,是大模型發(fā)展過程中的另一大安全問題。
“如果將人工智能的能力比做《西游記》中的孫悟空,那么對(duì)齊技術(shù)就是唐僧口中的緊箍咒,它可以保證孫悟空不會(huì)隨意使用他的能力為所欲為。因此,對(duì)齊技術(shù)是控制人工智能安全的核心技術(shù)。”談及對(duì)齊技術(shù)的重要作用,何積豐拋出上述比喻。
那么,對(duì)齊問題將會(huì)帶來哪些安全挑戰(zhàn)?
何積豐表示,對(duì)齊的基礎(chǔ)是人類價(jià)值觀,而人類價(jià)值觀處于動(dòng)態(tài)變化中,且具有多元化特征。這樣的特點(diǎn)可能導(dǎo)致對(duì)齊成為一項(xiàng)眼花繚亂的跨學(xué)科研究,這不僅考驗(yàn)技術(shù),也審視著人類不同的文化。
此外,大模型有著“有用性”與“無害性”兩個(gè)目標(biāo)的沖突。在使用大模型的過程中,研發(fā)人員無法保證大模型是否會(huì)提供“錯(cuò)誤”觀點(diǎn),那么要如何糾正這類“錯(cuò)誤”觀點(diǎn),就是大模型發(fā)展過程中的重要挑戰(zhàn)。
對(duì)于這些問題,何積豐指出,反饋強(qiáng)化學(xué)習(xí)是實(shí)現(xiàn)對(duì)齊的技術(shù)途徑。
反饋技術(shù)的第一重含義,即通過反饋給模型不同的“獎(jiǎng)勵(lì)”信號(hào),來引導(dǎo)其高質(zhì)量的輸出。但是,每個(gè)人喜好不同,這種反饋也可能存在主觀因素,從而影響反饋的客觀性。
第二重含義,是基于給大模型提供明確的原則,使得系統(tǒng)自動(dòng)訓(xùn)練模型對(duì)所有生成的輸出結(jié)果提供初始排序。這樣的反饋可以使得大模型生成效率更高,生成的內(nèi)容更加透明,每個(gè)人都可以看到系統(tǒng)受到什么樣的指令,將會(huì)生成怎樣的“答案”。
總體來看,人類與大模型都在進(jìn)步,人類與機(jī)器持續(xù)共同學(xué)習(xí),將更好地使技術(shù)轉(zhuǎn)化為生產(chǎn)力,服務(wù)于經(jīng)濟(jì)社會(huì)發(fā)展。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP