當(dāng)?shù)貢r(shí)間1月27日,納斯達(dá)克股指出現(xiàn)3%下跌,原因是中國(guó)人工智能公司DeepSeek模型引發(fā)美國(guó)投資者關(guān)注。
央視記者在納斯達(dá)克交易所現(xiàn)場(chǎng)對(duì)納斯達(dá)克副主席麥柯奕進(jìn)行了采訪。麥柯奕表示,他認(rèn)為,DeepSeek將是人工智能領(lǐng)域革命的重要組成部分。
因受到DeepSeek人工智能模型沖擊,美國(guó)芯片巨頭英偉達(dá)(NVIDIA)當(dāng)日股價(jià)暴跌約17%,博通公司股價(jià)下跌17%,超威半導(dǎo)體公司(AMD)股價(jià)下跌6%,微軟股價(jià)下跌2%。此外,人工智能領(lǐng)域的衍生品,如電力供應(yīng)商也受到重創(chuàng)。美國(guó)聯(lián)合能源公司股價(jià)下跌21%,Vistra的股價(jià)下跌29%。
版權(quán)圖庫(kù)圖片,轉(zhuǎn)載可能引發(fā)版權(quán)糾紛
01 最新開源模型R1引發(fā)關(guān)注
本月,DeepSeek在世界經(jīng)濟(jì)論壇2025年年會(huì)開幕當(dāng)天發(fā)布了最新開源模型R1,再次引發(fā)全球關(guān)注。
據(jù)介紹,R1模型在技術(shù)上實(shí)現(xiàn)了重要突破——用純深度學(xué)習(xí)方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI的o1模型正式版,且訓(xùn)練成本僅為560萬(wàn)美元,遠(yuǎn)低于美國(guó)科技巨頭的數(shù)億美元乃至數(shù)十億美元投入。
02 DeepSeek到底是個(gè)啥?
DeepSeek是一款由國(guó)內(nèi)人工智能公司研發(fā)的大型語(yǔ)言模型,擁有強(qiáng)大的自然語(yǔ)言處理能力,能夠理解并回答問(wèn)題,還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問(wèn)題。
與OpenAI開發(fā)的ChatGPT相比,DeepSeek不僅率先實(shí)現(xiàn)了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達(dá)到了GPT-o1級(jí)別的表現(xiàn),引發(fā)海外AI圈的廣泛討論。
北京郵電大學(xué)人工智能學(xué)院人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉介紹,DeepSeek最大的優(yōu)勢(shì)在于算法的改進(jìn)和優(yōu)化,節(jié)省了算力和數(shù)據(jù)量。以前如果說(shuō)OpenAI是“大力出奇跡”,如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創(chuàng)造奇跡。
03 更大不再等于更聰明
據(jù)深度求索公司官網(wǎng)介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有很少標(biāo)注數(shù)據(jù)的情況下極大提升了模型的推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,測(cè)評(píng)性能與GPT-o1模型正式版接近。
國(guó)際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過(guò)顯著提高數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu),展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說(shuō),DeepSeek的模型現(xiàn)在低成本優(yōu)勢(shì)突出,與國(guó)際知名大模型相比,其成本大約低了一個(gè)數(shù)量級(jí)。
高盛集團(tuán)也認(rèn)為,DeepSeek新模型的成本遠(yuǎn)低于現(xiàn)有模型,這意味著開發(fā)利用大模型的門檻降低,互聯(lián)網(wǎng)巨頭將面臨初創(chuàng)公司的潛在競(jìng)爭(zhēng)。
英國(guó)《金融時(shí)報(bào)》發(fā)表的一篇評(píng)論文章指出,DeepSeek挑戰(zhàn)了人工智能產(chǎn)業(yè)在過(guò)去一段時(shí)間的核心信念,即認(rèn)為更強(qiáng)大的硬件才是推動(dòng)人工智能發(fā)展的關(guān)鍵。
版權(quán)圖庫(kù)圖片,轉(zhuǎn)載可能引發(fā)版權(quán)糾紛
04 開源:未來(lái)的發(fā)展方向?
DeepSeek采用了完全開源策略,不僅降低了用戶的使用門檻,還促進(jìn)了AI開發(fā)者社區(qū)的協(xié)作生態(tài)。通過(guò)開源,DeepSeek吸引了大量開發(fā)者和研究人員的關(guān)注,推動(dòng)了AI技術(shù)的發(fā)展。英偉達(dá)AI科學(xué)家Jim Fan稱贊DeepSeek是“真正開放的前沿研究,賦能所有人”。
當(dāng)然,開源也面臨著保護(hù)知識(shí)產(chǎn)權(quán)和開源社區(qū)秩序維護(hù)等挑戰(zhàn)。
俞揚(yáng)表示,開源只是一種商業(yè)模式,即便開源項(xiàng)目也擁有版權(quán)。開源與閉源之爭(zhēng),實(shí)質(zhì)上是不同商業(yè)模式在特定場(chǎng)景和時(shí)代背景下的有效性對(duì)比。
DeepSeek的成功被一些人視為中國(guó)技術(shù)理想主義的體現(xiàn),甚至被外國(guó)人比喻為神秘的東方力量。
但從整個(gè)AI大模型產(chǎn)業(yè)來(lái)看,DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過(guò)算法優(yōu)化而非單純依賴算力和數(shù)據(jù)量來(lái)提升模型性能。這一方向也為AI大模型產(chǎn)業(yè)的發(fā)展提供了新的思路。
歡迎掃碼關(guān)注深i科普!
我們將定期推出
公益、免費(fèi)、優(yōu)惠的科普活動(dòng)和科普好物!