來源:中國基金報 來源:中國基金報 1月28日凌晨,國內(nèi)火爆的AI大模型公司DeepSeek稱遭受大規(guī)模惡意攻擊,! DeepSeek稱遭受大規(guī)模惡意攻擊 DeepSeek官網(wǎng)的服務(wù)狀態(tài)頁面顯示:“近期DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊,,注冊可能繁忙,請稍等重試,。已注冊用戶可以正常登錄,,感謝理解和支持?!?/p> 1月20日,DeepSeek推出了AI模型R1,,這是一款為解決復(fù)雜問題而設(shè)計的專用模型,。在海外出圈之后,DeepSeek的服務(wù)需求激增,。DeepSeek表示,,最新的AI模型可以與OpenAI的ChatGPT媲美,且開發(fā)成本遠(yuǎn)低于競爭產(chǎn)品,。 這次更新引發(fā)了美國和歐洲科技股市值蒸發(fā)超過1萬億美元的暴跌,投資者質(zhì)疑美國一些大公司虛高的估值,。 全球科技股紛紛下跌,,英偉達(dá)暴跌15%!納斯達(dá)克指數(shù)暴跌超3%,,該指數(shù)以科技股為主,。除英偉達(dá)外,其他芯片股也在暴跌,,博通公司暴跌近17%,,臺積電暴跌14%,阿斯麥暴跌超6%,。 分析稱,,DeepSeek推出的低成本人工智能模型可能會使推動牛市的科技估值難以為繼。 Murphy & Sylvest財富管理公司的保羅·諾爾特(Paul Nolte)表示,,“我們不知道這是不是股票市場的'斯普特尼克時刻’,但這肯定是一個警鐘,,提醒我們并不是市場上唯一的玩家,,將極高的估值賦予這些股票,認(rèn)為它們壟斷了市場,,這是一個巨大的錯誤,,現(xiàn)在正在被重新評估?!?/p> 對于Miller Tabak的馬特·馬利(Matt Maley)來說,,DeepSeek最新的人工智能模型更具成本效益,并且運(yùn)行在技術(shù)要求較低的芯片上,,這引發(fā)了對人工智能熱潮能帶來多大收益的嚴(yán)重質(zhì)疑,。 DeepSeek火上澆油,發(fā)布了新款人工智能模型 當(dāng)?shù)貢r間1月27日,, DeepSeek團(tuán)隊正式發(fā)布兩款多模態(tài)框架——Janus-Pro 和 JanusFlow,。其中,Janus-Pro是一款統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,,通過解耦視覺編碼的方式,,極大提升了模型在不同任務(wù)中的適配性與性能。 JanusFlow是一款通過生成流(Rectified Flow)與自回歸語言模型融合實(shí)現(xiàn)統(tǒng)一的框架,。它不僅在理解任務(wù)中表現(xiàn)優(yōu)異,,還能生成高質(zhì)量圖像,展現(xiàn)了框架設(shè)計的極簡與強(qiáng)大,。 北京時間1月28日凌晨,,就在美國科技股暴跌之際,人工智能社區(qū)Hugging Face顯示,,DeepSeek發(fā)布了開源多模態(tài)人工智能模型Janus-Pro,。其中Janus-Pro-7B在GenEval和DPG-Bench基準(zhǔn)測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。 頁面顯示,,Janus-Pro是一種新穎的自回歸框架,統(tǒng)一了多模態(tài)的理解與生成,。它通過將視覺編碼分離為獨(dú)立的路徑,,解決了以往方法的局限性,同時仍然采用單一的統(tǒng)一Transformer架構(gòu)進(jìn)行處理。視覺編碼的分離不僅緩解了視覺編碼器在理解與生成任務(wù)中的角色沖突,,還提升了框架的靈活性,。Janus-Pro不僅超越了之前的統(tǒng)一模型,還能匹配或超越任務(wù)專用模型的性能,。其簡單性,、高靈活性以及高效性使Janus-Pro成為下一代統(tǒng)一多模態(tài)模型的有力候選者。 Janus-Pro是一款統(tǒng)一理解與生成的多模態(tài)大語言模型(MLLM),,通過對多模態(tài)理解與生成的視覺編碼進(jìn)行解耦來實(shí)現(xiàn)功能,。Janus-Pro構(gòu)建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基礎(chǔ)之上。 在多模態(tài)理解方面,,它使用SigLIP-L作為視覺編碼器,,支持384x384的圖像輸入。在圖像生成方面,,Janus-Pro使用了來源于此的分詞器(tokenizer),,其下采樣率為16。 |
|