28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級,歡迎前往官方網(wǎng)頁(yè)、APP、小程序測試(打開(kāi)深度思考),API 接口和使用方式保持不變。
據了解,根據DeepSeek內部?jì)?yōu)化方向和自身的感知,這次升級主要集中在以下幾個(gè)方面:
* 響應質(zhì)量?jì)?yōu)化:復雜推理、多步驟計算更準確;長(cháng)文理解與生成更連貫、邏輯更清晰;數學(xué)、編程等專(zhuān)業(yè)性輸出更可靠。
* 響應速度小幅提升:在網(wǎng)頁(yè)端、App、API 接口中響應更敏捷;尤其在處理超長(cháng)文本輸入時(shí),延遲有所降低(約提升 10%~20%)。
* 對話(huà)穩定性增強:上下文記憶更穩定,尤其在超長(cháng)對話(huà)中(支持最多128K上下文);減少偶爾“遺忘設定”或“跑偏”的情況。
* API 和接口兼容性保持穩定:如公告所說(shuō):API 調用方式、參數、返回結構完全不變;用戶(hù)無(wú)需調整現有集成,即可無(wú)縫使用新版本。
R2沒(méi)有來(lái),但R1升級了。這是自3月底以來(lái),DeepSeek的一次最新動(dòng)作。今年3月,DeepSeek曾對V3模型進(jìn)行小版本升級,同樣是通過(guò)官方交流群率先宣布,隨后公布了具體更新內容。此前,也有許多關(guān)于R2大模型的傳聞出現,比如“參數規模被曝達到驚人的1.2萬(wàn)億,相比前代R1的6710億參數幾乎翻倍等”。但截至目前,并未獲得官方證實(shí)。
這家總部位于杭州的初創(chuàng )公司今年1月發(fā)布了DeepSeek-R1人工智能模型,震驚了全球科技界。R1模型在多項標準化指標上的表現均優(yōu)于西方競爭對手,而其成本據稱(chēng)僅為數百萬(wàn)美元。此舉引發(fā)了全球科技股的暴跌,投資者開(kāi)始質(zhì)疑,領(lǐng)先的公司是否仍需要投入巨資來(lái)構建人工智能服務(wù)。
據用戶(hù)反饋,DeepSeek升級后的模型,思維鏈 (CoT) 的行為似乎發(fā)生了顯著(zhù)變化。
也有用戶(hù)總結了更新后的幾個(gè)亮點(diǎn),其中包括:現在像Google模型一樣進(jìn)行深度推理;改進(jìn)寫(xiě)作任務(wù)——更自然、格式更好;獨特的推理風(fēng)格——不僅快速,而且深思熟慮;長(cháng)時(shí)間思考——每個(gè)任務(wù)最多30-60分鐘。