AI技術(shù)正在從獨(dú)立功能向基礎(chǔ)設(shè)施轉(zhuǎn)變。
微信終于在聊天框放了個(gè)AI助手。
雖然名稱(chēng)上還是「元寶紅包封面助手」,但在介紹里可以看到其是依托于騰訊混元大模型的AI服務(wù),可以提供陪聊、答題、作圖以及定制紅包封面等功能。
微信作為國(guó)內(nèi)最大的社交平臺(tái),這次內(nèi)置AI助手元寶或許意味著AI技術(shù)正在從獨(dú)立功能向基礎(chǔ)設(shè)施轉(zhuǎn)變,騰訊正在將微信的生態(tài)優(yōu)勢(shì)轉(zhuǎn)化到AI領(lǐng)域。
這會(huì)是騰訊重回AI牌桌的絕殺開(kāi)端嗎?
圖片來(lái)源:極客公園
01實(shí)測(cè),用AI更絲滑了
極客公園做了一番簡(jiǎn)單實(shí)測(cè)。先是問(wèn)了一下它和元寶app的異同有哪些:
圖片來(lái)源:極客公園
然后我丟入一篇極客公園昨天發(fā)布的公眾號(hào)文章鏈接,內(nèi)容是關(guān)于DeepSeek發(fā)布V3模型更新,「元寶紅包封面助手」回復(fù)說(shuō)「收到,我問(wèn)問(wèn)元寶~」,這個(gè)回復(fù)有點(diǎn)人性化的。
隨后它也沒(méi)問(wèn)我是否需要開(kāi)啟深度思考,就直接進(jìn)行了21秒的深度思考:
元寶的深度思考過(guò)程|圖片來(lái)源:極客公園
然后給出了我一份分析:
DeepSeek公司于2024年3月24日發(fā)布了V3模型的重要更新,該版本雖非預(yù)期的V4或R2迭代,但在性能表現(xiàn)和開(kāi)源政策上實(shí)現(xiàn)了顯著突破。以下是本次更新的核心要點(diǎn):
技術(shù)規(guī)格與發(fā)布信息
模型參數(shù)規(guī)模達(dá)6850億,屬于小版本升級(jí)(V3-0324)
基于全新32K GPU集群進(jìn)行后訓(xùn)練優(yōu)化
已通過(guò)官網(wǎng)、App及小程序等多渠道開(kāi)放使用
開(kāi)源版本同步上線,延續(xù)初代V3「557.6萬(wàn)美元成本比肩Claude3.5」的高性?xún)r(jià)比特性
核心能力提升
前端開(kāi)發(fā)能力接近Claude3.7專(zhuān)家級(jí)水平,用戶測(cè)試顯示:
能生成包含CSS動(dòng)畫(huà)與JavaScript交互的完整HTML文件(如天氣卡片動(dòng)態(tài)效果)
代碼質(zhì)量顯著優(yōu)于舊版R1模型(對(duì)比案例顯示視覺(jué)效果與功能實(shí)現(xiàn)差距明顯)
在網(wǎng)站搭建測(cè)試中生成效果與Claude3.7 Sonnet相當(dāng)
支持復(fù)雜指令解析(如通過(guò)函數(shù)/按鈕組實(shí)現(xiàn)多天氣動(dòng)畫(huà)切換)
上下文理解能力提升,尤其在多輪對(duì)話場(chǎng)景
可精準(zhǔn)處理跨語(yǔ)言混合編程需求(示例未展示但文中暗示)
開(kāi)源生態(tài)建設(shè)
采用更寬松的開(kāi)源協(xié)議,降低商業(yè)應(yīng)用限制
延續(xù)初代V3作為首個(gè)沖入Chatbot Arena榜單前十開(kāi)源模型的優(yōu)勢(shì)
發(fā)布1小時(shí)內(nèi)即吸引全球開(kāi)發(fā)者參與測(cè)試驗(yàn)證
行業(yè)影響與用戶反饋
被專(zhuān)業(yè)用戶評(píng)價(jià)為「相當(dāng)于Claude Sonnet3.5到3.6的升級(jí)幅度」
在無(wú)官方基準(zhǔn)測(cè)試情況下,用戶實(shí)測(cè)數(shù)據(jù)成為主要驗(yàn)證依據(jù)
開(kāi)發(fā)者社區(qū)高度關(guān)注其開(kāi)源協(xié)議調(diào)整帶來(lái)的商業(yè)化可能性
未來(lái)展望
官方未透露V4/R2研發(fā)進(jìn)展,但用戶期待值持續(xù)升溫
當(dāng)前版本已確立開(kāi)源大模型領(lǐng)域新標(biāo)桿,可能加劇行業(yè)競(jìng)爭(zhēng)
該更新標(biāo)志著DeepSeek在保持成本優(yōu)勢(shì)的同時(shí),通過(guò)技術(shù)迭代縮小了與頂尖閉源模型的差距,特別是在編程領(lǐng)域展現(xiàn)出顛覆性潛力,其開(kāi)源策略調(diào)整或?qū)⒅厮艽竽P蜕鷳B(tài)格局。
眼看清明節(jié)就要到了,我也問(wèn)了問(wèn)它「清明節(jié)做點(diǎn)什么好」,對(duì)這個(gè)問(wèn)題它倒是沒(méi)回復(fù)「收到,去問(wèn)元寶」,也沒(méi)開(kāi)啟深度思考模式,而是很快就輸出了答案:
清明節(jié),作為中國(guó)傳統(tǒng)節(jié)日之一,不僅是緬懷先人、寄托哀思的時(shí)刻,也是親近自然、感受春天氣息的好機(jī)會(huì)。以下是一些清明節(jié)期間可以進(jìn)行的活動(dòng)建議:
祭掃祖先:前往祖墳或陵園,清掃墓地,獻(xiàn)上鮮花、紙錢(qián)等,表達(dá)對(duì)逝去親人的懷念和敬意。
踏青賞春:利用清明假期,與家人朋友一同外出踏青,欣賞春天的美景,呼吸新鮮空氣,放松心情。
植樹(shù)造林:參與植樹(shù)活動(dòng),為大地增添一抹新綠,既是對(duì)自然的回饋,也是對(duì)生命的禮贊。
品嘗清明食品:制作或購(gòu)買(mǎi)清明節(jié)特有的食品,如青團(tuán)、清明果等,體驗(yàn)傳統(tǒng)節(jié)日的風(fēng)味。
文化體驗(yàn):參觀博物館、文化遺址,了解清明節(jié)的歷史文化背景,增長(zhǎng)知識(shí)。
家庭聚會(huì):利用假期與家人團(tuán)聚,共敘親情,享受家庭的溫馨。
靜思冥想:在寧?kù)o的環(huán)境中,進(jìn)行冥想或靜思,反思生活,規(guī)劃未來(lái)。
公益活動(dòng):參與社區(qū)或慈善機(jī)構(gòu)組織的公益活動(dòng),幫助需要幫助的人,傳遞正能量。
戶外運(yùn)動(dòng):進(jìn)行徒步、騎行、野餐等戶外活動(dòng),鍛煉身體,享受戶外的樂(lè)趣。
攝影創(chuàng)作:帶上相機(jī),捕捉春天的美麗瞬間,進(jìn)行攝影創(chuàng)作,記錄生活的美好。
無(wú)論選擇哪種方式,重要的是要用心感受節(jié)日的意義,珍惜與家人朋友相處的時(shí)光,同時(shí)也要注意安全和環(huán)保,讓清明節(jié)成為一個(gè)有意義且愉快的假期。
還有分析文件的功能我也試了一下,之前如果看到比較復(fù)雜的文件想讓AI先幫忙概括總結(jié)一下要點(diǎn)再去細(xì)讀的話,得先去打開(kāi)AI產(chǎn)品或者去相應(yīng)的網(wǎng)頁(yè),但現(xiàn)在可以直接在微信里丟給這個(gè)助手,使用體驗(yàn)更絲滑了一些。
這次「元寶紅包封面助手」也自行開(kāi)啟了深度思考模式:
圖片來(lái)源:極客公園
在21秒的深度思考后,助手給出了出一份分析:
對(duì)文檔內(nèi)容的技術(shù)分析與行業(yè)洞察
一、語(yǔ)言模型技術(shù)演進(jìn)
核心突破:
從N-gram到Transformer的范式轉(zhuǎn)變,語(yǔ)言模型參數(shù)量級(jí)從百萬(wàn)級(jí)(GPT-1)躍升至萬(wàn)億級(jí)(GPT-4)
自監(jiān)督學(xué)習(xí)(MLM/NSP)解決了海量數(shù)據(jù)標(biāo)注難題,預(yù)訓(xùn)練+微調(diào)模式成為行業(yè)標(biāo)準(zhǔn)
詞嵌入維度從768(BERT)擴(kuò)展到12888(GPT-3),語(yǔ)義表征能力呈指數(shù)級(jí)提升
關(guān)鍵技術(shù)指標(biāo):
訓(xùn)練數(shù)據(jù)量:GPT-3使用45TB數(shù)據(jù)(約1萬(wàn)億詞),相當(dāng)于1351萬(wàn)本牛津詞典
算力成本:ChatGPT訓(xùn)練需1萬(wàn)張V100 GPU,成本超10億人民幣
模型效率:DeepSeek通過(guò)稀疏注意力等技術(shù),將訓(xùn)練成本降低至同規(guī)模模型的1/3
二、Transformer架構(gòu)創(chuàng)新
技術(shù)革命性:
自注意力機(jī)制實(shí)現(xiàn)O(n2)的全局關(guān)聯(lián)建模,相比RNN的序列依賴(lài)突破顯著
多頭注意力層數(shù)從12層(BERT)增至96層(GPT-3),上下文窗口從512擴(kuò)展到32K(Llama2)
位置編碼從絕對(duì)位置(Sinusoidal)發(fā)展到相對(duì)位置(RoPE),更好處理長(zhǎng)序列
工程實(shí)踐突破:
混合精度訓(xùn)練(FP16/FP32)節(jié)省40%顯存消耗
梯度檢查點(diǎn)技術(shù)(Gradient Checkpointing)實(shí)現(xiàn)百倍序列長(zhǎng)度擴(kuò)展
張量并行+流水線并行將千億參數(shù)模型訓(xùn)練效率提升80%
三、DeepSeek的技術(shù)突破
開(kāi)源生態(tài)貢獻(xiàn):
模型架構(gòu):提出動(dòng)態(tài)稀疏注意力機(jī)制,推理速度較Llama提升2.3倍
訓(xùn)練效率:MoE架構(gòu)實(shí)現(xiàn)萬(wàn)億參數(shù)模型在千卡集群上的可行訓(xùn)練
中文優(yōu)化:構(gòu)建包含2.6萬(wàn)億token的中英雙語(yǔ)預(yù)訓(xùn)練語(yǔ)料庫(kù)
性能指標(biāo)對(duì)比:
數(shù)學(xué)推理:DeepSeek-Math-7B在GSM8K達(dá)到83.5%準(zhǔn)確率(GPT-4為92%)
代碼生成:HumanEval得分68.9%(CodeLlama-34B為53.7%)
多模態(tài)理解:ViT-22B在ImageNet-21K上top-1準(zhǔn)確率達(dá)88.7%
四、行業(yè)發(fā)展趨勢(shì)
技術(shù)前沿方向:
多模態(tài)融合:GPT-4o實(shí)現(xiàn)200ms級(jí)跨模態(tài)響應(yīng)延遲(人類(lèi)平均反應(yīng)時(shí)間250ms)
推理能力突破:DeepSeek-V3在定理證明任務(wù)上達(dá)到IMO金牌選手水平
能源效率:新型混合架構(gòu)(如DeepSeek-R1)實(shí)現(xiàn)每瓦特算力提升5倍
中美競(jìng)爭(zhēng)格局:
開(kāi)源模型差距從12個(gè)月縮短至3個(gè)月(Llama3 vs DeepSeek-v2)
算力基建:中國(guó)在建智算中心規(guī)劃算力達(dá)2000EFLOPS(美國(guó)當(dāng)前運(yùn)營(yíng)1200EFLOPS)
行業(yè)應(yīng)用滲透率:中國(guó)制造業(yè)AI質(zhì)檢部署率達(dá)37%,超越美國(guó)29%
五、關(guān)鍵數(shù)據(jù)啟示
經(jīng)濟(jì)學(xué)視角:
大模型訓(xùn)練邊際成本曲線:參數(shù)規(guī)模每提升10倍,單位token訓(xùn)練成本下降28%
ROI周期:頭部企業(yè)模型商業(yè)化回報(bào)周期從36個(gè)月縮短至18個(gè)月
人才密度:頂尖AI研究員中美薪資差距從50%收窄至15%
技術(shù)倫理考量:
安全對(duì)齊:最新RLHF技術(shù)將有害輸出概率從3.2%降至0.07%
能耗優(yōu)化:液冷集群PUE值從1.5優(yōu)化至1.08,碳排放減少40%
可解釋性:因果歸因算法實(shí)現(xiàn)85%的決策路徑可視化
注:文中涉及企業(yè)及技術(shù)參數(shù)均來(lái)自公開(kāi)資料,分析基于技術(shù)演進(jìn)規(guī)律推導(dǎo),具體實(shí)施需結(jié)合行業(yè)動(dòng)態(tài)調(diào)整。建議關(guān)注浙江大學(xué)CCAI中心官網(wǎng)獲取最新研究成果。
看來(lái)關(guān)于是否開(kāi)啟深度思考模式,「元寶紅包封面助手」有自己的判斷,如果任務(wù)很簡(jiǎn)單,就不開(kāi)啟,反之自動(dòng)開(kāi)啟。
02加速AI布局
過(guò)去一個(gè)月,騰訊在AI應(yīng)用領(lǐng)域加速布局。
2月起,騰訊旗下多個(gè)核心產(chǎn)品,如微信、元寶、QQ瀏覽器、QQ音樂(lè)、ima(騰訊智能工作臺(tái))、騰訊文檔、騰訊地圖等,均接入了DeepSeek模型,并同步支持自研的混元大模型;元寶走向日更級(jí)迭代,35天版本更新30次;混元大模型推出騰訊首個(gè)自研推理模型混元深度思考模型Thinker(T1)、發(fā)布新一代快思考模型TurboS、推出5個(gè)全新3D生成模型并全部開(kāi)源……
業(yè)務(wù)線也作出整合,為了更好地發(fā)揮AI技術(shù)的協(xié)同效應(yīng),2月,騰訊將QQ瀏覽器、搜狗輸入法、ima等十余款A(yù)I產(chǎn)品及團(tuán)隊(duì)從PCG(平臺(tái)與內(nèi)容事業(yè)群)劃歸CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),形成以「元寶」為核心的「C端工具+B端服務(wù)」矩陣。
在資金投入上,騰訊也展現(xiàn)了其在AI基礎(chǔ)設(shè)施建設(shè)上的決心。在1月的2024年度員工大會(huì)上,馬化騰提到騰訊會(huì)持續(xù)投入資源進(jìn)行算力的儲(chǔ)備。據(jù)報(bào)道,騰訊計(jì)劃在2025年加大算力基礎(chǔ)設(shè)施的投資,投資金額或達(dá)1000億,其中計(jì)算約580億(GPU約400億、服務(wù)器約110億、存儲(chǔ)設(shè)備約55億、網(wǎng)絡(luò)設(shè)備將近58億),IDC部分,自建及相關(guān)費(fèi)用加起來(lái)將近131億,租用部分將近要花200億。3月19日,騰訊總裁劉熾平在財(cái)報(bào)后的電話會(huì)議上稱(chēng),資本支出占收入的百分比將上升到十幾個(gè)百分點(diǎn),人工智能將成為戰(zhàn)略投資的重點(diǎn)。
微信這次將大模型產(chǎn)品「元寶」內(nèi)嵌于聊天界面,看似是功能升級(jí),實(shí)則是騰訊對(duì)AI時(shí)代的戰(zhàn)略卡位。
通過(guò)將大模型產(chǎn)品以「AI版文件傳輸助手」形態(tài)嵌入高頻聊天場(chǎng)景,微信將用戶的工作流、信息流統(tǒng)一收束,通過(guò)總結(jié)公眾號(hào)文章、解析文件、圖片等剛需功能,微信在原有的功能之外,新增了一個(gè)可以持續(xù)產(chǎn)生價(jià)值的AI助手角色,這可能會(huì)讓用戶在微信的停留時(shí)長(zhǎng)和打開(kāi)頻次迎來(lái)結(jié)構(gòu)性增長(zhǎng)。
微信作為國(guó)內(nèi)最大的社交平臺(tái),這次內(nèi)置AI助手元寶或許意味著中國(guó)互聯(lián)網(wǎng)正式進(jìn)入「AI原生應(yīng)用」時(shí)代,AI技術(shù)正在從獨(dú)立功能向基礎(chǔ)設(shè)施轉(zhuǎn)變。
而隨著開(kāi)源日漸成為行業(yè)趨勢(shì),單純的大模型技術(shù)能力越來(lái)越難以成為產(chǎn)品和市場(chǎng)競(jìng)爭(zhēng)的絕對(duì)壁壘。當(dāng)微信這樣的龐大生態(tài),帶著海量用戶接入AI功能,對(duì)于所有的AI創(chuàng)業(yè)者來(lái)說(shuō)可能都要思考:到底什么樣的功能和創(chuàng)新,可以讓小公司與微信這樣的生態(tài)競(jìng)爭(zhēng)用戶接觸AI的入口;到底什么樣的壁壘,才能不被現(xiàn)有的超級(jí)產(chǎn)品生態(tài),以接入新功能的方式吞噬。
DeepSeek重塑了AI行業(yè)的格局,技術(shù)公司、大廠和AI原生創(chuàng)業(yè)者,都要重新思考自己的生態(tài)位。
本文來(lái)源:36氪
文章轉(zhuǎn)載于其他網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系我們及時(shí)刪除