
新聞資訊
News and information
-
25
04/19
DeepSeek 是企業軟件的“救命稻草”,還是“催命符”?
未來可能沒有軟件,只有數據庫未來可能沒有軟件了,就剩個數據庫,前面全是AI調用,機器人就把所有事都干了。當DeepSeek以開源之勢席卷技術圈,企業軟件行業正面臨一場前所未有的價值重估。大模型的能力平權是否會讓SaaS廠商失去技術壁壘?AI驅動的“數字員工”是否會終結傳統軟件的存在邏輯?既有廠商該如何守住護城河,新銳勢力又該如何抓住彎道超車的機會?在崔牛會策劃的“DeepTalk|DeepSeek猜想系列”對話中,崔牛會創始人&CEO崔強主持了主題為“DeepSeek對企業軟件是「利好」還是「利空」?”對話,特邀沃行科技創始人&CEO郭舜日、53AI創始人&CEO楊芳賢、「信息化與數字化」主理人沈旸,就相關話題進行了深入探討。郭舜日認為,有價值創造能力和組織力的企業不容易被淘汰。如果問哪類軟件最危險,他認為是單一功能的技術型、工具型SaaS。以RPA(機器人流程自動化)軟件為例,現在Claude提出的MCP協議等功能,已經能用多模態技術直接觀察屏幕操作,完全替代傳統RPA。企業不再需要專業的RPA工具,就能輕松實現自動化。這對傳統RPA公司是顛覆性的。再比如機器人領域。以前波士頓動力的機器人需要編程各種動作規則,現在基于大模型的機器人可以通過學習直接執行任務,不再需要預先編寫規則。這類技術進步會讓很多單一功能的工具型軟件失去存在價值。楊芳賢的判斷是,今天大模型端到端的能力被嚴重高估了。無論是科技界、學術界還是產業界,對大模型的預期都非常高。實際上目前大模型在企業的落地應用,真正能拿到確定性結果的場景還比較有限。而且這些場景需融合企業知識、流程,還有一些需要基于企業現有的數字化基座實現的。他認為,10-20年后,傳統SaaS將消失,AI的終極形態是AI生產力,會是數字人與SaaS的融合。傳統軟件會消亡,軟件從業者會轉型為AI從業者。沈旸的看法則更為激進,認為這個時間周期會更短,可能在半年內是“救命稻草”,但半年或一年后就會變成“殺手锏”。未來SaaS會變成“ServiceasaService”,Software本身的重要性會大大降低。他認為,SaaS的訂閱模式(按人頭收費)會被AI顛覆,未來要么賣實時數據,要么賣服務效果。這場對話充滿了尖銳的觀點碰撞,對于企業來說,與其焦慮被顛覆,不如先讓AI幫你省下10個外包人力。閱讀目錄1.是“救命稻草”,還是“催命符”?2.“前期投入,后期躺賺”將不復存在3.哪類軟件會先被淘汰?4.AI有哪些真正可落地的場景?5.比技術和產品更重要的是方法論6.別做“半吊子”產品7.“數據安全”不再是企業落地大模型的主要障礙8.企業“上云”,還是“下云”?說明:在此,也特別感謝ECCRM創始人&CEO張星亮對這場對話的參與和支持。以下為對話內容,經牛透社編輯整理:(有刪減)是“救命稻草”,還是“催命符”?崔強:今天是我們「DeepTalk」欄目的第三期討論,主題是探討DeepSeek對SaaS行業的影響。前兩期我們分別從投資人和原生AI創業者的角度進行了探討,今天我們將聚焦SaaS從業者的視角。三位嘉賓簡單介紹下自己。郭舜日:我是沃行科技的創始人,公司對外叫WallTech,主要做航運SaaS。我們有兩類產品:國際貨代SaaS和跨境電商物流SaaS。目前國內3%的國際物流企業使用我們的平臺,服務了1500多家SaaS客戶。期待和大家交流AI如何賦能ToB企業。楊芳賢:我是53AI創始人。過去兩年我們一直在探索大模型在企業的落地應用,我親自參與了公司大部分重要項目的售前與交付工作,同時也擔任了幾家上市公司的大模型落地應用顧問。很高興能和大家分享我以一個創業者的角色在一線的實踐經驗和思考。沈旸:我在ToB領域工作多年,最早做了十年ERP咨詢,后來轉到甲方做數字化建設,現在負責一家供應鏈金融公司的數字化業務。過去兩年我們在AI落地方面做了很多實踐,也踩過不少坑,積累了一些心得。很高興能和大家交流。崔強:今晚我們主要討論兩個核心問題:一是DeepSeek對SaaS行業來說是“救命稻草”還是“催命符”?DeepSeek是不是SaaS的“葵花寶典”?大家都知道“欲練此功,必先自宮”,但練完之后可能也沒什么用。各位怎么看?楊芳賢:這個觀點很有意思,我也很認同。從長遠來看,比如10~20年的維度,DeepSeek確實是SaaS的“催命符”。回歸到當下,未來3~5年大模型對SaaS企業是有促進作用的。核心在于,AI終極形態是AI生產力,是要替代知識工作者的腦力勞動,本質上是數字人與SaaS的融合。從這個角度看,傳統SaaS軟件將會消失,但SaaS行業的從業者會一直在,因為中國企業的創新精神不會消失。沈旸:我基本同意楊芳賢的觀點,不過我認為這個時間周期可能會更短。可能在半年內是“救命稻草”,但半年或一年后就會變成“殺手锏”。未來SaaS可能會變成“ServiceasaService”,Software本身的重要性會大大降低。郭舜日:這個問題需要結合SaaS行業和企業發展的現狀來看。AI既帶來機遇也帶來挑戰,本質上是對現有商業模式的重構。很多SaaS企業不盈利,主要因為高昂的實施和獲客成本。如果AI工具能替代這些非結構化工作,將極大降低成本結構。從這個角度看,AI對一些企業確實是"救命稻草"。更進一步,運用AI得當的企業不僅能解決生存問題,還能提升競爭力。但對AI反應遲緩的企業來說,AI就是"催命符"了。他們可能會被擅長使用AI的競爭對手超越,甚至出現小企業借助AI反超大企業的情況。所以關鍵要看企業擁抱AI的程度,以及AI能具體賦能哪些業務環節。“前期投入,后期躺賺”將不復存在崔強:如果拋開現有的立場和包袱,作為一個新進入企業服務領域的創業者,應該怎么看待和思考這個問題?郭舜日:我認為現在AI的發展給新創業者帶來了非常好的機會。首先,AI帶來了全新的能力,很多原本需要復雜架構和大量人力才能完成的工作,現在通過AI就能實現,大大降低了管理難度和成本。其次,對于新進入SaaS領域的企業來說,如果能用好AI技術,可以在某些特定功能上實現突破,甚至超越傳統的行業領先企業。我舉個具體的例子,比如倉庫管理軟件(WMS),以前需要開發復雜的調度算法和處理策略,現在通過AI大模型就能實現,而且效果可能比傳統算法更好。最關鍵的是,傳統企業可能需要10年積累的經驗和能力,新創企業通過運用AI大模型就能快速掌握。這意味著新創企業可以更快地開發出創新的產品體驗,建立更具競爭力的成本結構。所以這對新進入者來說是個巨大的機會,而對于現有的行業領先企業來說,則需要特別警惕這個發展趨勢。崔強:沈旸,你屬于以前是客戶的身份,你剛才的判斷很激烈——說半年內是“救命稻草”,半年到一年后就是“催命符”。這個判斷是基于什么邏輯?那天有朋友來找我說,未來可能沒有軟件了,就剩個數據庫,前面全是AI調用,機器人就把所有事都干了。會不會是這樣?沈旸:現在的情況已經很接近這個預測了。除了DeepSeek,市面上另一個模型Claude的影響也很大。特別是Claude3.5和3.7版本出來后,具備了很強的調用工具和軟件的能力。在這之前,包括DeepSeek更多是做推理,能把過程拆解,但直接落地還做不到,需要很多外掛處理。我最近和工程師打交道比較多,明顯看到像Cursor這樣的編程工具,借助Claude模型可以調用很多本地工具,通過MCP協議操作本地文件,甚至可能誤刪文件。這讓原本只是聊天的AI變得可執行。DeepSeek進化快的一個重要原因是強化學習。數學題訓練有個特點:學得好可以拿滿分,但語文很難滿分,因為評判標準不固定。同樣,大語言模型很難做到100%準確。但在DeepSeek領域,雖然仍是概率模型,但通過強化學習可以驗證答案是否正確。在代碼領域更明顯:代碼可以運行測試,驗證頁面是否符合預期。一旦工業化、規模化,AI很容易處理這種場景。最近三個月這樣的場景越來越多。Manus帶給行業很大的刺激,但更多進展是在軟件工程領域。未來,只要是AI能看到的,它就有能力復制軟件。如果軟件靠功能點疊加,比如企業管理軟件按功能點計價,以前要追趕需要投入同樣的人力。但任何公司都很難持續投入上千人做三年。現在AI可以把軟件拆解、運行、驗證,24小時并行處理,很快就能找到可復制的方式,這對軟件工程是巨大顛覆。以前,SaaS和軟件行業想“前期投入,后期躺著賺錢”的模式將不復存在。企業要么持續投入研發,要么提供實時服務和數據,不可能再靠十年前做的軟件持續盈利。崔強:芳賢,你怎么看剛才的問題?為什么判斷“AI對于企業軟件來說,十年內是救命稻草,十年后是催命符”?楊芳賢:首先,從AI的終極形態來看,我跟沈旸的觀點是一致的。但沈旸說半年、一年,我覺得沒那么快。背后的邏輯在于,今天大模型端到端的能力被極大的高估了。無論是科技界、學術界還是產業界,對大模型的預期都非常高。實際上,目前大模型在企業的落地應用,真正能拿到確定性結果的場景還相對有限。而且這些場景需要融入企業的知識和流程,還有一些需要基于企業現有的數字化基座來實現。大模型被稱為“第四次工業革命”,這在業界已經有極大的共識。以史為鑒,無論是電力還是信息技術,從技術出現到極大地提升生產力,需要一定的時間。所以我的觀點是,大模型落地應用也是這樣,大規模地形成AI生產力也需要三五年,甚至十年以上的時間。一方面是源于對歷史的觀察,另一方面是我們過去兩年在企業落地實踐看到的——今天還無法直接通過大模型及各種Agent全鏈路完成大部分崗位的全流程,但是在這些崗位工作流中的一個節點、一個工序,借助大模型能極大地提升效率。基于此,在未來很長的一段時間企業軟件還是會長期存在,并且會成為企業邁向智能化的基礎。郭舜日:我補充一下。現在AI應用面臨的最大問題是,很多企業的數據還處于信息孤島狀態,數據清洗和基礎知識的完整度、單元化程度都不夠。這種情況下,AI對知識的積累和理解是有限的。目前,主要瓶頸不在于AI技術本身,而在于傳統SaaS領域的數據沉淀和經驗積累不足。比如我們平臺上有37%的出口數據,看似量大,但這些數據之間互不聯通,很難形成系統化的知識體系。所以,現在最關鍵的不是AI能力的問題,而是如何把分散的數據和經驗整合成可供AI學習的素材。我們正在做的重要工作,就是把數據和能力真正沉淀下來,形成可學習的知識體系。這才是當前最需要解決的問題。崔強:到底是利好還是利空?剛才沈旸提到大家都在用MCP協議,今早我看到AI大神卡帕西(AndrejKarpathy)的觀點,他說內容服務、AI服務應該停止使用MCP。為什么現在有人追捧,也有人看不上?沈旸:其實MCP本質上就是個簡單的API服務協議,讓Claude等大模型能方便調用各種工具。在MCP出現前,大家也是通過API調用工具,只是Claude把它標準化了。現在有幾百個開源軟件和SaaS服務都支持該協議。現在AI領域有個特別的現象:以前推廣一個開源項目可能要幾年才能獲得1萬Star,現在兩三天就能達到。如果你的軟件不支持MCP、沒有API,或者不能被AI抓取,就會面臨被淘汰的風險。目前MCP有個局限,它原本為本地編程設計,沒有考慮商用軟件的計費問題。有些SaaS公司雖然支持MCP,但會在內部設置調用次數限制。MCP生態主要基于開源體系,未來可能出現兩種情況,要么商業軟件都加入這個生態,要么AI只使用免費開源工具,把商業軟件排除在外。目前還看不清楚最終會如何發展。崔強:兩位對這個話題有什么補充嗎?郭舜日:沈旸提到MCP主要是開源體系,但它本質上是個協議標準。我們公司內部也在討論如何利用MCP協議來提升內部AI能力。我們現有的SaaS軟件已經積累了各種基礎能力,比如制單、訂倉、客戶通知(通過微信、企業微信、QQ、郵件等)。通過MCP協議,我們可以把這些能力標準化,讓AI來執行交互流程,減少對人工操作的依賴。因為AI本身就具備行業知識,這樣能簡化架構,快速實現對現有交互流程的優化和能力替代。雖然協議本身不難實現,但關鍵是大模型引擎廠商都接受這個事實標準。這是我們內部架構團隊正在討論的方向。崔強:有網友問沈旸:按照你剛才的觀點,像金蝶這樣的企業該何去何從?沈旸:這個問題很敏感。未來軟件必須加速迭代,把所有AI能力整合進來。傳統軟件往往多年才做一次大升級,比如ERP通常5~7年才升級一次。這不是企業不想升級,而是測試和變更太復雜。現在必須提升迭代效率,把7年一次的升級周期縮短到2~3年。就像電動車對燃油車的替代,燃油車5~7年升級一次,現在電動車每年都有新款,智能駕駛等功能快速迭代。對金蝶這樣的大公司來說,最危險的還不是現在,因為他們還有資源投入。但必須意識到AI帶來的變革。如果意識不到這點,就會像燃油車面對電動車那樣,兩三年后就發現自己無力進行架構升級。整個組織的開發模式和文化都可能成為阻礙變革的因素,所以首先要從文化上進行重大改變。哪類軟件會先被淘汰?崔強:做個極限假設,以你們的觀察來看,哪類軟件會最先面臨風險,最可能被淘汰?楊芳賢:在企業服務領域,后發優勢特別顯著。軟件行業不完全是技術驅動的,市場、銷售、服務和交付等環節同樣重要,技術領先性沒那么關鍵。回到沈旸說的時間問題,如果只有半年一年,像金蝶、用友這樣的企業確實危險。但如果有5~10年時間,它們都會轉型成AI企業,就像金蝶已經從傳統軟件轉型為SaaS企業一樣。具體到哪些軟件企業容易被淘汰?我認為還是看企業的組織能力和運營效率。與軟件類型無關,組織能力弱、運營效率低的企業最容易倒下。軟件企業無論是創新還是保守,最終競爭的都是組織效率。從品類來看,AI最先替代的是大量簡單重復性腦力勞動的崗位,我目前看到的這是一個增量市場,可能會逐步蠶食與這些場景相關的,功能相對單薄的工具類軟件。崔強:郭總,你怎么看這個問題?郭舜日:一般來說,有價值創造能力和組織力的企業不容易被淘汰。如果要具體說哪類軟件最危險,我認為是單一功能的技術型、工具型SaaS。最直接的例子就是RPA軟件。現在像Claude提出的MCP協議、OpenAI的Operator等功能,已經能用多模態技術直接觀察屏幕操作,完全替代傳統RPA。企業不再需要專業的RPA工具,就能輕松實現自動化。這對傳統RPA公司是顛覆性的。以沃行科技為例,我們用多模態技術實現了OCR(光學字符識別)功能。傳統OCR需要大量樣本訓練特定模板,而現在的AI多模態技術不僅識別率更高(達到99%),還能理解內容含義。比如我們與客戶在珠海合作的項目,AI不僅能識別貨運單據上的文字,還能理解運輸條款和貿易條款的關聯性,這是傳統OCR做不到的。再比如機器人領域。以前波士頓動力的機器人需要編程各種動作規則,現在基于大模型的機器人可以通過學習直接執行任務,不再需要預先編寫規則。這類技術進步會讓很多單一功能的工具型軟件失去存在價值。沈旸:我補充一下,什么樣的軟件容易被替代?像金蝶這樣的跨部門軟件其實比較難被取代,因為它們不僅是功能工具,更是組織內部達成共識的磨合過程。比如ERP系統,從前端銷售到后端財務,整個流程是各部門長期磨合形成的體系。要替換這樣的系統,組織往往不愿意改變。但部門級或個人級的軟件就不同了:一,部門級軟件未來被替代的可能性非常大;二,個人工具領域,會出現很多新的AI工具替代舊工具。由于AI能大幅提升效率,個人會愿意花錢購買AI工具來提升競爭力。在SaaS領域,如果只是針對某個非常細分的部門級應用,這樣的軟件會面臨較大風險。目前還看不到這類軟件能保持優勢的路徑。AI有哪些真正可落地的場景?崔強:目前有哪些讓人眼前一亮、真正可落地的AI應用場景?去年崔牛會AI大賽時,60%~70%的項目都是知識庫、陪練等方案。經過一年發展,三位看到了哪些有價值的原生應用?具體在什么場景?郭舜日:知識庫確實是一個非常典型的場景,效率提升非常明顯。通過向量化機制,特別是RAG技術的應用,可以把企業私有數據庫建立起來。以我們企業為例,近10年積累的大量文檔知識,以前都要去問人,個別專家還不一定掌握全量知識。現在我們通過內部知識庫建設,相當于培養出一個機器人專家,可以沉淀企業十幾年的知識。這塊效能確實很明顯。但難度我也要說明,絕對不是簡單把文檔扔進去就能產生好效果。因為存在大量知識沖突,需要花精力進行知識梳理、向量化處理。我們和AW工程師合作,做了很多知識增強的工作,才讓效果真正顯現出來。建議有一定沉淀的SaaS公司都應該在內部效能提升上應用知識庫,但需要認真對待知識增強和梳理工作。第二點,我認為更重要的是企業內部組織對AI的理解和意識培養。我們現在每周都組織AI高層匯報會,要求全員使用AI。只有真正用起來,才能在具體工作中發現有價值的應用場景。這是比找單點應用更重要的事。在具體應用場景方面,AI在單點能力上的提升非常明顯。以我們航運軟件為例,以前處理各家船公司的運價導入非常復雜,需要業務理解,而且格式經常調整。以前要投入幾周開發時間跟進這些變化,現在用大模型動態識別就能快速完成。還有財務對賬,AI理解財務邏輯、處理非結構化數據的能力都很強。這些單點技術突破投入低但客戶價值高,是SaaS廠商應該重點關注的。崔強:沈旸,你現在看到了哪些比較令人興奮的應用場景?沈旸:最近最令人興奮的是像Manus這樣的AIAgent,能夠從前到后完成閉環場景。這類場景從去年12月底才開始出現,之前完全沒有這樣的工具和體系。這種AIAgent能在內部集成瀏覽器、虛擬機等組件,最終運行出結果并驗證可行性。這才是最重要的突破。過去我們做的很多工作,比如知識庫梳理,其實更多是在為AI服務,而不是為人服務,因為AI對知識的理解能力遠超人類。現在更有價值的是讓AI完成特定環節的閉環,并驗證結果是否正確。比如郭總提到的報價環節,如果能用AI完成并驗證,就是重大進步。雖然目前AI處理數據的速度和精度可能不如傳統軟件(比如傳統軟件半秒完成的任務,AI需要10秒~20秒),但這不重要。一旦證明可行,后續肯定會有人優化性能。目前這類應用主要在科技公司和工程師團隊中測試,但我預計3個月左右就會在各行業普及,用于POC測試。開源版本也會很快出現,我們內部也在測試類似的開源方案,一旦實現閉環,就能清晰看到這個技術的終點在哪里。崔強:一個再小的業務,你也要把它閉環做完,能單獨搞定它,對吧?沈旸:對。但是很多事情,比如像知識庫,它可能就并不是一個真正的閉環。因為最終你還是依賴于人去評判做得好不好,或者要人去落地完成。對我來說這就不是一個閉環的事情。楊芳賢:大模型在企業的落地場景我們見得比較多,說知識庫是一個場景,我認為這是一個誤讀。今天行業里大家講的知識庫,本質是讓大模型掌握企業的知識和流程,替代重復性腦力勞動。但這個說法太泛了,需要拆到具體解決什么問題,投入產出比是怎樣,這才能算是一個落地的場景。比如:客服助手場景、在線客服場景、對員工服務的共享服務中心、業務陪練、加盟商指導、數字教練、客戶篩選、客戶孵化、邀約到店等等。這些場景的第一階段目標都是成為員工的數字助理提升效率,當數字助理有了極高的準確率和采納率后,就可能直接替代部分真人工作,這些單點場景在有一定規模的企業里,其投入產出比非常高。除了知識庫,智能工單在很多大企業也應用得特別好。例如:通過RPA機器人自動感知微信上內外部聊天內容,自動創建、處理、流轉工單,包括對工單數據進行分析和預測。把業務專家的能力萃取出來后,它的感知和分析能力會比人更穩定、更可靠。我們有客戶的客服團隊有幾百人,水平參差不齊,借助AI后相當于每個客服旁邊都坐著一位業務專家,直接給出85分以上的意圖識別和處理建議。我再舉個具體的審核場景例子。我們有個客戶去年一期項目用AI支撐近千家經銷商,今年的二期項目做業務審核。他們目前有500人的業務審核團隊,預計今年業務量要翻倍。如果不引入AI,他們的客服審核團隊要再招500人。在他們的審核流程中有六個步驟,例如:信息審核時要處理不同區域的電費劃轉單、各省不同的購售電合同、投資項目備案證等;技術審核時要檢查光伏組件安裝是否被遮擋、施工規范是否符合要求等。過去一個資深審核員處理一單要15~20分鐘,現在用AI輔助1~2分鐘就能搞定。企業里有很多依賴資深的業務專家的場景,這些業務專家的知識、經驗和流程萃取出來之后,AI掌握后往往比人做得更好,而且不需要考慮人員流動的問題。過去兩年,我們看到很多類似的場景,企業規模越大、同一個崗位影響的人越多邊際成本越低,AI帶來的ROI就越大。比技術和產品更重要的是方法論崔強:現在很多SaaS企業都在考慮AI落地的問題。AI到底要怎么幫助我們這些SaaS企業實現真正的落地?現在很多廠商都想要嘗試,但是不知道具體該怎么開始,需要投入多少資源,以及能帶來什么樣的實際價值。郭總,聽說你們已經在做這方面的落地實踐,馬上要發布新產品了,能具體說說嗎?郭舜日:我結合我們的實踐經驗來說說。從技術實現的角度來看,AI落地可以分成三個主要的階段,每個階段的難度和投入都不一樣。第一個階段是提示詞工程(PromptEngineering)。這個階段主要是利用現有的大模型技術,通過優化提示詞來解決具體的業務場景問題。根據我們的實踐,只是做好提示詞工程就能解決80%左右的常見業務場景。比如我們現在做的OCR場景,就是通過多模態技術加上精心設計的提示詞,已經能夠完美替代傳統方案。還有我們即將發布的AI助理產品,以及像Manus展示的那些閉環應用案例,核心都是基于提示詞構建的任務流程。楊芳賢:不過要說明的是,提示詞工程在POC階段可以用來快速場景驗證,應用到生產環境,光靠提示詞是不夠的。郭舜日:確實是這樣。所以,第二個階段就是RAG增強。這個階段難度會大一些,主要是通過知識補充和能力增強來解決更復雜的業務問題。我舉個具體的例子,很多企業都在用BI系統,但老板們經常用不起來,因為每次想看個報表都得找數據工程師專門配置。我們現在做的方案是,通過RAG技術把歷史報表數據向量化,當老板說“我想看最近一個月銷售對利潤的貢獻情況”時,AI就能自動生成相應的復雜報表。知識庫建設也是類似的原理,但這里特別要注意向量化的質量,這個很關鍵。第三個階段就是模型微調。當業務場景需要帶入大量上下文信息時,可能就需要對基礎模型進行微調了。這個階段的投入會比較大,因為要構建自己的專用模型,硬件投入可能要幾十萬到上百萬。所以,要不要走到這一步,需要仔細評估業務價值。我們內部現在就是按照這三個階段來規劃AI應用的,從提示詞工程開始,逐步推進到RAG增強,最后根據業務需要決定是否進行模型微調。崔強:芳賢,剛才有不同意見,你們看到的相對成熟的落地方法論是什么?楊芳賢:在參與運營LangGPT提示詞社區時,我們和客戶一起共創了一套被廣泛認可的大模型落地應用“三步走”方法論。我們認為企業落地大模型可以分三步走。第一步是“工作+AI”。就是讓大模型提升全員的工作效率。很多人認為大模型只在企業內少數崗位,例如:文案、設計、開發等崗位提效顯著。其實不是這樣。我們看到在企業內,每一個部門、每個崗位,借助AI都能獲得不同程度的效率提升,只是有些崗位能提效5倍~10倍,而有些可能只提效5%~10%。而且落地“工作+AI”幾乎沒有門檻,甚至零投入,但需要企業有AI文化,老板有AI思維,在企業內部營造AI的氛圍,鼓勵大家工作中能用上的AI工具都盡量能用上。第二步是“業務+AI”。就是讓大模型掌握企業的知識和流程成為AI生產力。今天基于大模型構建AI生產力有兩種范式,一種是替代簡單的重復性的腦力勞動,另一種是輔助創造研究型的腦力勞動。讓大模型掌握企業的知識和流程不是和大模型對話或者將企業的知識一股腦的上傳就完成了,將企業的知識進行清洗和加工是前提,上線后持續的調優是效果越來越好的關鍵步驟。讓大模型像剛入職的新員工一樣,先掌握基礎的企業知識和作業流程,然后再基于數據持續的迭代。就像招個985畢業生,在熟悉了公司的知識和流程后才能上崗,在日積月累的工作中能力不斷的提升。第三步是“AIx業務”。這個階段是以AI為基礎重構產品和服務流程。就像今天所有企業都是互聯網企業、電商企業一樣,未來所有企業都會是AI企業。也可以分享一下我們在實際落地應用的最佳實踐的幾個關鍵點:一是企業內領導層、管理層和骨干員工對大模型的能力邊界要有統一的認知。今天我們大多數對大模型的了解來自短視頻和各種自媒體的推送,自媒體為了抓眼球往往只報道極端條件下的成功案例,與實際的落地應用有很大差距。二是了解行業內的先進企業及跨界的先進企業的真實案例拆解。不只是看媒體的宏觀報道,而是看企業配置了什么資源,真實做了什么、踩了什么坑、投入產出比如何。三要先聚焦單個場景進行試點。現在很少有企業有專業的AI團隊,臨時組建的AI虛擬團隊一定要先集中資源做好一個場景。一個場景驗證成功后,代表這個企業、這個團隊有駕馭大模型的能力,一個場景拿到超出預期的效果再擴展到其他場景會容易很多。今天落地應用大模型技術和產品很重要,比技術和產品更重要的是落地方法論。相比于已經發展了20年的數字化,大模型進入到產業才2年多時間,能力變化也很快。落地應用遇到挑戰是普遍現象,全球范圍內都缺乏成熟案例,最頂級咨詢公司也是在探索階段。在這個過程中,找到正確的落地方法和靠譜的落地團隊比單純追求技術更重要。別做“半吊子”產品崔強:沈旸,你剛才提到自媒體的局限性,但我覺得新媒體人還是有價值的,畢竟不是每個企業都有像你這樣的專業CIO。你怎么看這個問題?能不能分享些實際踩過的坑?沈旸:我舉個去年底的例子。我們嘗試做一個智能會議室預定場景,聽起來很簡單:讓AI根據“朝南”“看海”這種需求自動選會議室。這需要解決幾個問題,給會議室打標簽、讓AI看懂平面圖方位、處理企業微信里的聯系人(包括重名情況),還要解析“下個月第二天”這種模糊時間表達。我們半天就搭了個原型,但實際使用發現問題很大——時間理解準確率70%,地點匹配80%,人員識別80%,三個維度一疊加,結果完全沒法用。后來我們沒急著調模型,而是做了兩件事,一是用AI生成測試數據集,比如針對時間維度造了2000多條“下周二”“大下周”之類的樣本;二是拿這個數據集持續測新模型,直到去年10月發現某家模型的時間解析突然做到100%準確(雖然理論上大模型是概率模型,但實測結果就是全對)。如果一個場景一周內搞不定,說明要么團隊能力不足,要么技術還不成熟。去年我們做了一個類似Manus的金融版AI工作流,但當時開源工具鏈殘缺,評估要縫上百個接口,直接放棄。技術迭代快得很,去年6月國內能私有部署70B模型(具有700億個可訓練參數),年底Claude和DeepSeek出來又是質變。現在每季度回頭測舊場景,發現很多過去做不到的現在能做了。我們最后把AI深度嵌到企業微信,員工不用跳轉系統,直接聊天界面就能用。比如設計師做了個吉祥物生成工具,運營同事機器人10秒出圖,以前找設計部排隊得等半天。所以,要么做成“開箱即用”的閉環(比如集成到釘釘/企微),要么明確測試標準,耐心等機會,千萬別做個半吊子功能,既浪費資源,又透支團隊信任——用戶試兩次不好用,以后連AI本身都不信了。“數據安全”不再是企業落地大模型的主要障礙崔強:一個網友的問題:企業在引入AI過程中如何防護數據安全,有哪些泄露風險點?特別是需要私有化部署的企業,目前他們可能更關心這個問題。我看你今年給很多大企業、國央企講過課,他們肯定很關心安全問題。這個有解嗎?怎么解?楊芳賢:關于大企業通過私有化部署來解決數據隱私和大模型的安全問題,有兩個維度的私有化:第一個是中間層應用私有化部署,比如Agent平臺,語料向量數據庫部署在內部,但模型層通過開發者接口接入。這種情況下,大模型廠商用自己的商業背書承諾不會把這些接口數據用于模型訓練。如果不是涉密部門,這種模式是值得信任的。就像今天我們使用公有云一樣,對大模型廠商來說,單個企業的數據意義并不大,他們愿意用商業信用做背書,這個方案是OK的。所以企業可以把涉及企業內部流程、知識的Agent平臺,語料向量數據庫部署在自己本地。當然對于黨政機關、軍工企業、涉密機構等特殊部門,他們需要基座模型都做私有化部署。這也是為什么今年DeepSeek開年之后就出圈了,各行各業都非常關注。因為過去的開源模型和國產模型能力跟OpenAI還是有一定的差距,但DeepSeek的R1模型已經接近甚至在某些中文場景下超越了OpenAI的o1模型。而且它開源后可以做私有化部署,這就解決了大家過去只能用少量脫敏后的數據測試體驗一下,現在可以大規模的應用在工作生產環境了。如果基座模型也做了本地化部署,那么它的安全問題其實和數字化時代的安全管理非常類似。針對大模型也有一些額外的安全防控點,很多安全廠商也給出了解決方案。所以,安全不是落地應用大模型的主要障礙。前兩年大家還在討論要不要上、怎么接入的問題,而今天已經變成討論怎樣借助大模型構建AI生產力了。今年,我們看到很多企業都在找具體場景,思考怎樣融入業務。數據安全現在對企業落地大模型來說,已經不是一個很重要的門檻了。企業“上云”,還是“下云”?崔強:今天的DeepSeek對企業軟件到底是利好還是利空?回到SaaS這部分,DeepSeek會不會使得業務部門傾向于自己私有部署,這會是一個“下云”的趨勢嗎?會不會影響現有SaaS軟件公司的業務?郭舜日:數據安全確實是非常敏感的問題。我們這些做了十幾年的SaaS服務商,在安全方面都有保障和承諾。像我們服務的中國郵政、民航等大型企業,500多個分公司、3000多個賬號都在我們平臺上運行,已經建立了對SaaS軟件的信任。但AI帶來的新問題是,當數據都在公有云平臺時,通過大數據挖掘可以分析出企業自己都還沒總結出的商業邏輯和規則。去年9月,我們去美國考察時發現,SAP的很多大型客戶正從公有云轉向私有云部署,就是擔心公有云廠商可能利用平臺數據挖掘能力來服務整個行業。這對數據貢獻最大的企業來說確實存在戰略顧慮。不過對中小企業來說,它們既沒有足夠數據量,也沒有能力進行獨立的數據挖掘。所以我認為會有兩個趨勢:一是超大型企業可能會選擇私有化部署,出現“下云”趨勢;二是大多數企業還是會相信SaaS服務商,因為單個企業的數據價值有限,而SaaS廠商可以提供行業級的AI賦能。崔強:沈旸,從客戶角度你怎么看?“下云”和“上云”會是什么比例?沈旸:我以前在企業提出過“敏變穩”架構:SaaS軟件+開源低代碼+商業ERP套件。現在AI可能會替代原來的低代碼場景,業務部門不再需要拖拉拽,直接通過AI對話就能調用API獲取數據。對于SaaS軟件來說,如果軟件不持續迭代,客戶很可能會用AI在內部復制一套。很多客戶其實只用到SaaS軟件的少數功能,以前用低代碼重建很困難,但現在AI讓這事變得簡單。未來,要讓大企業真正使用SaaS,必須做到功能持續迭代,提供實時更新的數據服務,比如提供股票信息的SaaS,因為數據實時更新才有價值。如果軟件功能或信息常年不變,客戶就沒必要用SaaS。楊芳賢:從企業視角看,DeepSeek這類模型的本地化部署是增量業務,不會影響企業現有的云策略。算力也不一定要本地部署,也可能在云計算廠商租用算力私有化部署,而且算力成本正在急劇下降,未能相同能力的模型尺寸會越來越小。未來的趨勢是云側的大尺寸模型和端側的小尺寸模型的混合協同架構,所以云上的比例未必會下降。從SaaS服務商角度看,過去依賴閉源大模型,現在可以用開源模型開發更匹配場景的應用,模型部署在云端,通過集中調度能大幅降低成本。所以不一定是“下云”,部分業務“下云”,但更多業務會“上云”,整體對云服務還是利好的。崔強:今天我還見了個投資人,他們非常看好這波Agent浪潮會催生全新的服務形態。就像沈旸說的“ServiceasaService”,關鍵是要能交付明確價值的服務。我們把服務分為兩類:開源(創收)型和節流型,但都需要清楚計算出為客戶解決了什么問題,創造了多少價值。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
04/19
科技大廠掀起醫療界的AI革命,誰更有勝算?
醫療AI的改革正如火如荼,多家大廠紛紛下場,結果又會鹿死誰手?近兩年,在大模型領域,國內外科技巨頭在醫療賽道的布局都持續加速。王小川甚至曾高調宣稱,醫療是“大模型‘皇冠上的明珠’”。醫療場景對AI的需求的確很高:數以萬計的藥品、繁瑣又重復的閱片工作,乃至厚厚一摞專業書籍和臨床指南……借助“硅基生物”的能力解決“碳基生物”的“看病貴看病難”“醫療資源不均”等問題,毫無疑問代表著科技的未來。正因如此,自最早的“互聯網+”開始算起,從影像到病理診斷、從手術機器人到醫療大模型,AI在醫療領域引起的投資熱潮和市場關注始終不減。但客觀上,醫療AI的真正落地,離不開技術、產品、醫患教育、政策監管等多維度的合力。這也是過去10多年來,醫療AI概念下的許多企業始終沒能突破商業化瓶頸的原因。如今,隨著大模型技術又一次突破邊界,過去困擾醫療AI企業的諸多問題,有望迎來一個新解法。各大企業加碼布局,或許只是開始。在這場由大模型掀起的醫療AI“革命”中,誰在搶跑?誰能成功?一、生成式AI,可能改變哪些醫療問題小到基層衛生院,大到頭部三甲,醫院爭相部署自己的大模型應用,堪稱2025年春節后醫療行業的第一個“奇觀”。坦誠說,醫生群體中雖不乏樂于擁抱新技術者,但“保守派”仍是大多數。相比于有事問AI,他們更信任從埋頭苦讀和臨床實踐中獲得的“真知”。那么,認知是如何打破的?韓偉如今是首都醫科大學附屬北京中醫院的信息科主任,最近,他們接入了螞蟻醫療大模型,其具備醫學思維推理能力與多模態交互,“不僅能給出解決方案,也會呈現思考過程”。“這對醫生而言具有特別意義,因為我們想要的不僅是一個結果,更希望能參考它的思路,將來在遇到同類問題時,可以按照這個思路去思考。”他以一位意識喪失、無法進行心梗診斷的患者舉例,往常,醫院在接診這類病例時只能召集多學科會診,存在耗時長、效率低下等問題。但這一次,大模型只是根據患者既往接診數據和病史情況,就逐步完成了病情分析和診斷建議,并對潛在風險進行了提示。“整個思路和結果與我們找的兩位真人專家的診療建議基本一致。說明大模型的確可以幫我們省去一些會診步驟,讓醫生將更多診療時間集中在病人身上。”韓偉解釋。這種“AI更好用”的體驗背后,主要得益于大模型的技術升級。有醫療大模型從業者介紹,如果對比兩代AI技術,此前2.0時期的醫療AI更像是“判別式AI”,更擅長基于影像、推演數據做醫學診斷問題;而基于生成式大模型的3.0時期,則是在做“序列預測模型”,即可以根據個人歷史健康數據序列,預測未來的健康狀態和疾病發展情況,進而形成個人的健康發展軌跡。而這道軌跡,對“個性化治療和精準健康管理極具價值”。換句話說,過去,人們雖能感受到AI帶來的就醫服務升級(如AI預問診),但體驗上好像總差了點意思,是因為醫療服務的供應并未真正發生變化,核心勞動力仍然是醫生。而如今,大模型技術帶來的“生產力變革”,得以讓AI開始深入醫療前端,通過更高質量的輔助能力讓整個供應資源得到擴展。“有些變化看起來很小,比如遠程會診效率提升10分鐘,但對患者而言就搶回了不止1小時。在過去與醫療服務從業者的深度合作中,我們也更加確定了AI醫療的價值。”螞蟻方面解釋。不再是“取代醫生”或“爆改醫療”,10余年探索之后,科技公司們終于尋找到了AI技術與人類醫生間的“平衡點”,即通過推動醫療資源擴容與服務普惠,比如更快縮小各級醫院之間的診療差距、提升醫生看新文獻、研究病例、病患管理等方面的效率,讓每個人都能擁有自己的高質量“AI私人醫生”。尤其是今年,DeepSeek的“出圈”,更以洶涌之勢在專業醫療機構、普通大眾之間完成了一場“AI使用教育”,讓AI更深入地滲透進醫療場景成為可能。這份潛力,為各大科技巨頭、互聯網公司再一次“押寶”醫療AI注入信心。二、取勝關鍵:醫療資源的爭奪戰當大模型技術為從業者帶來了足夠信心之后,下一個問題隨之到來:如何讓自己的產品在諸多競爭者中勝出?在醫療AI領域的諸多探索和敘事中,不變的一點始終是以醫院為核心的醫療資源爭奪。訓練模型需要診療記錄、影像報告等高質量醫療數據,培養模型的“醫生”思維需要在具體科室里做針對性訓練……換言之,誰覆蓋的優質醫院更多,勝算自然會更高些。新老玩家中,對于代表了老玩家的老牌醫療信息化企業、設備廠商而言,既往積累的渠道優勢自然成為手中最大的底牌,而作為新銳玩家的科技公司們,不少則選擇利用自己在算力、算法上的優勢,通過和頭部醫院合作開發大模型來彌補這部分短板。但與醫院的深度結合需要時間,無論是哪一方參與者,對醫院的覆蓋動作其實都是遲緩且有限的。是否有一種更輕盈些的方法?諸多案例中,螞蟻的“長板”或許是略微不同的一種。螞蟻最早的互聯網醫療經驗,應該從2014年在廣州婦女兒童醫療中心開通支付寶掛號和繳費開始算起。截至目前,借由支付環節的打通,螞蟻已聯合3600家醫院、服務超8億用戶。時至今日,仍然很難說有第二家互聯網醫療公司能夠復制這點。天平的一端面向醫院:通常情況下,醫院對軟件類企業放開的合作往往只是一個小端口,比如面向某個科室。但在支付這個“總環節”上,整個醫院的系統流程一定是向支付寶開通的,這意味著與醫院擁有更深的合作基礎。這也為螞蟻將大模型等更深度介入醫療服務的產品帶入院內,奠定了一定基礎。天平的另一端則面向用戶。互聯網是患者獲得醫療信息最重要的渠道之一。不過,常規的搜索平臺、內容平臺雖數量眾多,但能帶來優質使用體驗者寥寥。直到今天,國內其實都尚未出現一個足夠完備且深受患者信賴的互聯網醫療健康平臺。而依托于支付寶“超級平臺”提供的獨特落地通道,螞蟻其實已經先一步完成了用戶使用支付寶解決健康問題的市場教育。如今,許多患者已經習慣了不帶醫保卡,打開支付寶也能在醫院簽到候診、繳費拿藥。而支付寶首頁的“醫療健康”模塊里,也已聚合了全國九成以上的三級醫院,覆蓋買藥、體檢等上百種服務,為用戶提供更便捷的健康服務體驗。歸根結底,在核心醫療資源的“搶奪”戰里,所有參與者其實都是在用自己之前鋪的渠道,做更擅長的事情。諸多玩家中,螞蟻憑借此前在互聯網醫療領域的長期深耕,或許會成為一個“全面布局、深度下場”的樣本。三、聯動醫院、醫生、用戶,構建“生態壁壘”是不是解題新思路當掌握關鍵的醫療資源后,再下一步是什么?過去,不少醫療AI企業在從事產品開發時的問題在于,受限于經驗和資源,往往會從某個單點切入,比如圍繞放射科做AI閱片、輔助診斷等。而整個院內醫療體系龐大且復雜,牽扯的鏈條很多,這樣“單點切入”的方式能解決的問題始終有限。正因如此,我們可以看到,一些醫療AI概念企業、大模型創業公司,的確做到了在短期內通過技術或商業模式上的創新在市場中突圍,但很難構成長期壁壘。醫療AI競爭“內卷”的態勢下,豐富的產品矩陣和生態“護城河”,或許是更難被復制的決勝關鍵。對此,螞蟻方面也對36氪提到,大模型即產品,很多場景下的功能點都可以在一個對話框里解決掉。但在醫療行業,一個產品很難“打天下”,不同場景下AI能辦的事不一樣,滿足需求的邏輯也不一樣。因此,“我們從2023年開始研發醫療大模型時,就決定要和醫療機構深度合作,介入到完整的傳統醫療場景中”。螞蟻宣布整合現有資源,進行以醫療大模型為基礎的“三端一體”戰略布局,完成醫院、醫生、用戶三大產品體系升級,正是出于這個原因。所謂“三端一體”,即面向醫療機構推出可供其直接部署的“大模型一體機”全棧式解決方案;面向旗下好大夫平臺上28萬注冊醫生的AI醫生助手工具,提供文獻檢索、科研助手服務,以及服務于用戶一側的“AI健康管家”。這樣的布局,并非是盲目將攤子鋪開,每一項針對的都是當下某個醫療環節中的痛點。以“AI健康管家”為例,這項服務核心定位于服務普通用戶找醫生、讀報告、陪診等日常剛需的醫療服務。自去年9月上線的半年多來,該產品服務的用戶量已達到4000萬。值得一提的是,整個過程中,螞蟻也不是一味自己“死磕”,而是邀請行業伙伴進行深度共建。比如在硬件部署上,螞蟻就聯合了華為、阿里云等廠商推出“訓推一體,開箱即用”的輕量化設計;在大模型技術能力之外,則攜手醫療機構一起實現應用層面創新,比如和浙江衛健委聯合推出的官方AI健康應用“安珍兒”,現已覆蓋超1000家公立醫院、服務超3000萬人次。過去,單打獨斗難有出頭之日。如今,平臺型企業依托“場景+技術+開放生態”的獨特路徑布局,能不能為醫療AI搏出一個未來?本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
04/19
AI時代的軟件開發:提示驅動開發
從語法流暢到架構理解的范式轉移編者按:大模型的文生文能力正在引發軟件開發的范式轉移,下一代的軟件開發將由提示驅動,開發者不會消失,但溝通能力與戰略思維會變得更加重要。我在感恩節期間開發了一個應用,很快就收獲了1000名用戶,并在圣誕節前實現盈利。但最瘋狂的是……我本人一行代碼都沒寫。那都是我一步步指導大模型(LLM)寫的,我們一起開發了一個全棧的NodeJS/React應用,這個應用帶有PostgreSQL數據庫,實現了與Stripe的集成,托管在Heroku上,用SendGrid發送電子郵件,用CloudFlare進行DNS處理。此后我一直都在思考提示驅動開發的事情,琢磨著該怎么做才好,思考其對行業發展的意義。以下就是我的想法。▋概要什么是提示驅動開發(PDD)?工具與工作流成功的心智模式行業影響▋什么是提示驅動開發(PDD)?從本質上講,PDD是一種開發工作流程,開發人員主要促使LLM生成所有必要的代碼。讓我們將其與傳統開發進行對比。PDD本質上是這么一種開發范式:開發者主要通過向LLM提供提示(prompt)來生成所有的必要代碼。我們來跟傳統開發模式對比一下。傳統軟件開發的高階流程通常是這樣的:1.開發者收到需求2.開發人員在IDE本地迭代代碼變更3.開發者提交代碼變更以供審查4.另一位開發者審查并合并變更傳統開發的高階流程相比之下,PDD有幾個關鍵區別。首先,LLM會參與并編寫主要(甚至全部)代碼。其次,開發者專注于提示工程和代碼審查,而不是自己編寫代碼。除此之外,其余流程大致是相同的。高階提示驅動開發流程:1.開發者收到需求2.開發者將需求分解為一系列提示*3.LLM針對每個提示生成代碼4.開發者審查LLM生成的代碼*5.開發者提交所有變更以供審核6.另一位開發者審查并合并變更提示驅動開發高階流程*我想強調幾個步驟。1.“將需求分解為提示”是一項新技能,需要學習和練習。我會在“思維模式”章節討論怎么做。2.“審查LLM生成的代碼”至關重要。你不會不假思索就合并進人工編寫的代碼,所以對LLM編寫的代碼也別這樣做!▋給誰用?簡而言之,每個人。我曾經跟一位資深工程師交流過,他們正在用這種做法開發極具創新性的技術。我的一位朋友甚至用PDD從頭開始做出了自己的編程語言。我也接觸過一些非技術人員,這些人能開發出功能完備的原型,甚至有人還部署到生產環境并吸引到用戶了。LLM最驚人的特性之一就是大幅降低了編程門檻,讓零技術經驗的人也能生成可運行的代碼。但我認為有類人群特別適合這種技術:那就是具有技術背景但轉型從事產品、戰略或設計工作的人。這當中包括技術產品經理、技術設計師以及工程經理等。由于我的個人背景與此類似(開發者→用戶體驗→產品經理),所以我對PDD的熱情可能有些偏頗。這種技能組合之所以能夠從PDD獲益,是因為這些人可能對軟件工作原理具備了架構上的理解,但對編程語法卻不太熟悉。由于LLM可以幫忙處理語法,因此語法不熟練不再是制約因素。通過PDD,他們可以高效、無拘束地進行開發。▋工具和工作流基礎模型以下是可編寫代碼的一些LLM。隨著新模型不斷被訓練并部署到市場上,這個領域會非常活躍,充滿活力。就PDD而言,需關注:·我通常用Claude3.5Sonnet、GPT4o和GPTo1·對各種模型的編碼能力進行測試的基準測試有很多。選擇模型時請參考最新的基準測試這些基準數據可能已過時聊天工具ChatGPT,Claude,Gemini常規聊天工具可作為PDD的一個選項。就我個人而言,我更喜歡大模型原生IDE,但我訪談過的幾位開發者都用了聊天工具,因為比較簡單。因為要給LLM提供一切適當的上下文,然后還要將輸出粘貼到代碼庫中,這種做法的人工操作更多,但用起來是沒問題的。其工作流如下:1.給LLM寫提示2.從代碼庫中復制所有必要的代碼上下文,并將其作為提示的一部分3.復制LLM生成的代碼4.將代碼輸出粘貼到代碼庫中的正確位置雖然我的主要工作流不是這樣,但PDD過程中也會偶爾使用。如果要嘗試這種方式,強烈推薦使用ClaudeProjects或ChatGPTProjects功能,你可用來組織文件和聊天記錄,極大提升上下文管理效率。ChatGPTProjectLLM原生IDECursor、Windsurf、Bolt、v0、Replit工具這些工具徹底改變了游戲規則。它們將LLM集成到IDE中,相比聊天模式有兩大優勢:1.為LLM提供代碼上下文非常容易2.LLM能夠直接在IDE中編輯你的文件這顯著加快了代碼生成反饋循環,無需反復復制粘貼到IDE內。此類工具層出不窮,我個人用的是Cursor。說實話,這些工具大同小異:Replit可自動部署代碼庫,Windsurf與GitHub集成等,但核心價值都在于簡化PDD的用戶體驗。我強烈建議選擇個LLM原生的IDE然后堅持用下去。在各種選項之間切換的成本非常低。關鍵要培養如何編寫出色提示的技能,而不是記住特定IDE的所有功能。所以選好一個,堅持用下去,聚焦在提示上。Cursor,注意右側的“Composer”窗口我的工作流我在工作流結合了ChatGPT與Cursor的使用。大致分解如下:·80%時間與Cursor交互:通過Composer功能向Claude發送提示,審查接受/拒絕修改。重復此過程。如有錯誤,我們會一起解決。·15%時間把GPT4o當作技術思考伙伴:處理復雜變更或新功能開發時,要求其提供技術方案并創建任務工單,以此作為提示輸入給Cursor,然后進入Cursor工作流·5%的時間使用GPTo1進行深度規劃:啟動新項目或實施系列復雜變更時,GPTo1可生成更高質量、更長篇幅的輸出(例如一次性生成十余個任務工單)我對PDD工具使用的大致分布情況▋成功的心智模式更好的提示==LLM生成更好的代碼。垃圾進,垃圾出,對吧?每個人的目標、環境和技能組合都不一樣。所以這里不會告訴你究竟該怎么寫提示,而是會提供一些思維模式,這些思維模式可提高提示質量,進而提高生成代碼的質量。LLM是剛加入本項目的初級開發者LLM擁有令人難以置信的編碼能力。但是,如果你是PDD新手,我強烈建議你先想到這一點。告訴自己,LLM是剛接觸該項目的初級開發者。在編寫提示時,要考慮到如何指導這類人。錯誤示范:“給我寫個可以讓朋友們發布照片并互相關注的app。”這樣絕對行不通。別這樣,你得給出很小、非常具體的變更。你可能還要提供各種相關的文件,并說明關于產品是什么以及別人會怎么用的一大堆信息。這是思考如何給LLM提示來生成代碼的正確方法。這樣不僅會生成更好的結果,還會迫使你更好地給出提示,你的關注點應該在這里。更好的提示==LLM生成更好的代碼。垃圾進,垃圾出,對吧?表現得像自己就是一整支產品團隊一樣給LLM提供的東西不用局限在技術背景上。不妨設想自己是產品經理、設計師、開發主管以及QA工程師,你可以就工作范圍提供意見。你要盡可能地模仿角色,但也不要用力過度。除了技術指導之外,你還應提供:·用戶故事·業務目標·UI描述·UX流程描述·測試計劃把這些類型的附注添加到提示中可以給LLM提供更全面的上下文,也能提高其實現預期目標的能力。上下文、具體性及范圍這是調整提示時需要考慮的三個變量。這些變量跟代碼質量的關系很簡單。為了提高LLM生成代碼的質量,你需要:·增加提供的上下文的信息量·提高請求的具體性·縮小變更范圍為了獲得最佳輸出,你需要上下文豐富、特別具體,范圍很窄以下是我對這些術語的定義……上下文是提示提供的代碼庫片段或文件。·上下文不充分:“在后端進行這些變更”·上下文豐富:“調整backend/routes/user.js文件的getMarker函數。文件在這兒,它一般會進行交互的另外3個文件在這兒......”具體性是指請求定義得有多明確、多精確。·不夠具體:“當用戶單擊提交時,將其提交添加到feed中。”·非常具體:“當用戶單擊提交時,調用saveSubmission端點將提交存儲到數據庫內。保存后,自動調用loadFeed函數刷新前端的feed,讓用戶能夠立即看到自己的提交,而無需重新加載頁面。”范圍是要求LLM一次性變更多少東西。范圍很廣:“添加一個設置頁面,用戶可以在該頁面管理和更新賬號。”范圍很窄:“在設置頁面上添加一個切換按鈕,用戶可以將自己的帳戶設置為私密或公開。”請記住,要想得到最佳輸出,上下文得豐富、請求要足夠具體,范圍不要太寬。是,寫成這樣需要時間,但寫代碼也一樣。提示成什么樣你得根據自己的技能組合來權衡。LLM寫代碼也會有bug(就像人類一樣)知道不,LLM并不完美。我和曾經嘗試過PDD的人聊過,“因為AI產生了一個bug,所以我就放棄了。”我建議你不要期望過高,只需知道LLM會時不時產生bug就行了。這是正常開發過程的一部分,那怕是人類寫代碼也會出錯。這也是為什么在接受LLM代碼之前對其進行審查和測試如此重要的原因。不要盲目地合并它所做的變更。人寫的代碼你不會無腦合并,那為什么LLM寫的代碼你就會無腦合并呢?如果你遇到bug的概率超過5%,請使用上述建議重新審視你的提示技術。人寫的代碼你不會無腦合并,那為什么LLM寫的代碼你就會無腦合并呢?▋行業影響門檻提高了常見誤區認為LLM將取代開發者。更準確的認知是:對所有從業來說門檻提高了。對于技術人員來說,熟練掌握一門編程語言已不再足夠。因為這項技能可以100%外包給LLM。現在,開發者需要對所用的代碼庫有深入的架構理解,并且需要具備強大的寫作技能,以便能夠準確地向LLM表達所需做出的變更。對于非技術人員來說,能夠給開發團隊編寫需求已經不夠了。相反,他們還得會開發可在本地運行的功能齊全的原型。為此,他們需要具備足夠的技術知識,好向LLM描述所需的內容,還得知道如何啟動本地Web服務器。低階工作不會消失,但工作性質會改變最近有很多關于入門級(甚至中級)開發者角色被AI取代的討論。我知道他們想說什么,但我認為那是不對的。其實他們是想說LLM現在已經能做我們目前認為需要入門級或中級開發者才能完成的工作了。這一點我大抵是同意的。但認為這些角色會消失的想法是只見樹木不見森林。消滅初級和中級崗位會導致開發者的人才斷代。現在那些高級開發者總有一天會退休的,而由于沒有人才儲備,我們沒法用足夠快的速度去替換他們。中級開發者的定義肯定會發生變化。他們需要完成的任務類型會變得更加復雜。他們可能會使用LLM來生成大量代碼。而且,他們還需要對產品有深入的架構理解,并具備強大的書面溝通能力。軟件開發的學法不一樣了2010年代我剛開始學習軟件開發時,概念學習的順序大致是像下面這樣的:1.基本概念(變量、數據結構等)2.語言語法和特性(我學過C++、Java、LISP、Ruby、JavaScript)3.協作(Git)4.架構模式(前端/后端、MVC)5.之后我轉行去做產品了我預計現在對于學軟件的人來說會發生一些變化了。首先,他們不會像我一樣去學5種編程語言。沒有理由去做這樣的事情了。他們可能會學習一種語言,然后靠LLM去學習其他語言和框架。其次,他們會學習架構模式的時間會提前,可能學習基本概念的同時就開始學了。這是因為你必須掌握這些知識才能編寫出高質量的提示。第三,他們從第一天開始就會學習使用LLM,逐步練就非常強大的書面溝通技巧,從而寫出高質量的提示。整個過程大概是這樣的:1.學基本概念+架構模式2.學一種編程語言+提示寫作(語言可能是python或Javascript,會通過提示來學習)3.合作4.......等等小一點、新一點的公司會率先采用提示驅動開發改變很難,組織慣性會妨礙成熟的大型科技公司大規模采用這些做法。他們需要更長的時間才能共同建立起對LLM代碼質量的信任感,才能理解提示質量才是更重要的因素,才不會感到受到LLM的威脅,并最終接受這些工具。小一點、新一點的公司有充分的理由從第一天開始就成為AI原生企業,沒有理由不這樣做。他們沒有歷史負擔,很快就能學會如何將其融入自己的獨特文化,并以業內前所未有的速度交付產品。這種情況正在上演,Headstart等公司就是典范。▋結論提示驅動開發(PDD)是一場軟件開發變革,強調的是對架構的理解而非語法流暢。通過利用LLM,開發者和非開發者都可以更快、更高效地開發出產品。不過,LLM生成代碼的質量在很大程度上要取決于提示夠不夠清晰,夠不夠具體,因此,溝通能力與戰略思維至關重要。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
04/19
又一家AI獨角獸出現,1/4的美國醫生都在用,用互聯網的思維做AI醫療
又一家AI獨角獸出現,1/4的美國醫生都在用,用互聯網的思維做AI醫療披著AI醫療外殼的互聯網公司又一家新晉AI獨角獸出現了。今年2月,AI醫療公司OpenEvidence拿下了紅杉資本的7500萬美元融資。這次融資后,OpenEvidence的10億美元,成為了新的AI獨角獸。雖然說干著AI醫療的活,但OpenEvidence的經營策略更像一家消費互聯網公司。與大多數AI醫療公司走toB道路不同,OpenEvidence卻把目光放到了C端醫生群體,向所有醫生免費開放,通過廣告產生收入。不僅商業模式像,OpenEvidence的用戶增長也很“互聯網”。據公司創始人DanielNadler透露,現在1/4的美國用戶醫生已經在用OpenEvidence。而一年之前,這一數字幾乎為零。這種迅速的市場滲透速度在醫療領域極為罕見。也難怪,紅杉合伙人PatGrady會評價說,OpenEvidence更像是一家披著AI醫療外殼的互聯網公司。01披著AI醫療外殼的互聯網公司OpenEvidence的界面與ChatGPT很像,不過是專注于醫療領域的聊天機器人。簡單來說,OpenEvidence能夠幫助醫生在漫長的「長尾」醫療信息里,精準找到他們需要的知識,從而顯著提升醫生處理罕見和復雜病例的能力。不過與大多數垂直AI產品不同,OpenEvidence更像是一家消費互聯網公司。從服務對象看,OpenEvidence沒有選擇醫院,而是把目光放在了醫生上。原因很簡單,傳統醫療產品的路徑需要通過醫院或其他機構的層層審批,落地周期過于漫長。在傳統醫療落地路徑下,AI醫療公司負責人需要花三個月找到大型醫療集團的高層開個會,然后再花三個月找醫院的「AI委員會」開會。這個過程中還不排除會遇到醫院AI政策和AI監管政策的變化,落地前景存在很大的不確定。在公司創始人Nadler看來,醫生不僅是一個職業,同時也是消費者。如果產品足夠優秀,能夠滿足他們的需求,醫生自然也會用,甚至還會形成自然傳播。這一點就像早期的特斯拉一樣。其實,DanielNadler的想法并非沒有道理。在AI醫療領域,越來越多產品開始把服務對象放到醫生上,以避免了醫療機構冗長的購買審批流程。比如,AI醫療筆記產品FreedAI就面向的是獨立執業臨床醫生。產品發布不到2年的時間,每天有1萬個付費醫生使用,達到了1000萬美金ARR(年度經常性收入)。在商業模式上,OpenEvidence也更像一家消費互聯網公司。與大部分AI產品走訂閱模式不同,OpenEvidence選擇了免費提供服務,向所有醫生免費開放,通過廣告產生收入,產品迅速實現了自發傳播。OpenEvidence的成長軌跡,也正如Nadler預想得一樣。Nadler披露說:“如果算上所有活躍用戶,每月有30-40萬人接觸我們的系統,其中20多萬醫生會登錄并提問。換句話說,美國大約10%-25%的醫生,已經在某種程度上使用OpenEvidence了。”也就是說,已經有1/4的美國用戶醫生在使用OpenEvidence的工具。而一年之前,這一數字幾乎為零。這種迅速的市場滲透速度在醫療領域極為罕見。紅杉資本合伙人PatGrady認為,這種自然傳播模式在醫療行業極為罕見,通常只在互聯網產品中才能見到。那么,OpenEvidence為什么能夠實現如此快速的增長?02用AI幫助醫生找資料OpenEvidence的成功之處在于,抓住了醫生的一個痛點:醫學知識更新速度遠超醫生處理能力。在美國,醫生的工作壓力很大。現在美國人口已達3.4億,且不斷增長,但老齡化趨勢加劇,而美國在職醫生只有100萬,醫生人手捉襟見肘。除了臨床工作,他們還要花費大量時間仔細查閱期刊,以確保他們能夠掌握最新的治療信息。但想要跟蹤最新醫學知識并不容易。原因是,醫學知識的更新速度太快了。現在基本上每分鐘就有兩篇新的醫學論文發表,一天24小時不間斷,一周七天都是如此。根據OpenEvidence測算,真正對醫生有用的,往往是頂尖的期刊,比如影響因子最高的前三分之一的期刊。按這個數量計算,醫學知識每五年就會翻一倍。這意味著,醫生畢業后不久所學知識就會迅速過時。當面臨復雜的病情,例如病人同時患有銀屑病和多發性硬化癥時,傳統醫學信息檢索工具(如PubMed和Google)難以直接有效地回答這些特定患者的特定用藥安全性問題,因為這些關鍵信息通常隱藏在醫學論文的正文深處。這時候,OpenEvidence的價值就來了。之所以OpenEvidence能實現這一點,與其高度強調信息的準確性和透明度不無關系。為了徹底解決幻覺的問題,OpenEvidence對訓練數據卡得很嚴格,所有訓練數據都必須是經過同行評審的醫學研究。正因為如此,與大模型海量收集互聯網數據不同,OpenEvidence走了另一條相反的路:完全放棄了互聯網上的健康博文或社交媒體內容,完全基于嚴格的同行評議醫學文獻進行訓練。除了FDA和CDC公開的醫學文獻,OpenEvidence還與《新英格蘭醫學雜志》等頂尖醫學期刊建立了合作關系。(《新英格蘭醫學雜志》由馬薩諸塞州醫學會(MassachusettsMedicalSociety)所出版的評審性質的綜合性醫學期刊,1812年由約翰?柯川博士創辦,至今已連續出版超過200年。)除了嚴格限制數據來源外,OpenEvidence在架構上沒有選擇只靠一個大模型的做法,而是采用了多個模型組成的「集成架構」,每個模型負責不同的任務,比如檢索、排序等。Nadler的思路是,與其追求龐大的通用模型,不如訓練更小、更專業化的模型,在特定領域里做到極致。解決完了信息準確性,OpenEvidence在信息透明度上也花了很多功夫。比如,醫生在使用OpenEvidence時,醫生能直接查看答案的來源。也就是說,OpenEvidence不是簡單地「壓縮」期刊的內容然后輸出,而是直接把流量送回期刊網站。這樣一來,就形成了一個良性循環:醫生找到了可靠的內容,醫學期刊獲得了流量,也愿意讓我們收錄他們的內容。在Nadler的設想里,AI醫療最大的想象在于,真正實現個性化醫療。AI都會把病人的所有具體情況與全球所有相關醫學知識進行匹配,形成一個超個性化的治療方案。到那時候,可能120歲、130歲都不再是人類壽命的上限了。03總結OpenEvidence的脫穎而出,再次證明了兩件事情:一是垂直場景數據的價值。正如NorwestVenturePartners合伙人ScottBeechuk所說,AI公司最深的護城河將由大型專有數據集創造。那些擁有獨特的數據集,能訓練或微調出自己的模型,并能夠在特定垂直渠道中脫穎而出。二是AI的價值并不體現在多厲害的測評數據,而在于能否抓住用戶需求。當下,醫生們并不期待大模型能夠創造癌癥治愈的奇跡,他們更現實的期望是,AI能否幫助自動化解決某個環節的小問題,而這些真實需求只有在長期深入行業、充分理解臨床工作流程后才能真正理解。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
04/02
個性化軟件:程序員的解綁?
為何說大語言模型將重塑開發邏輯?軟件開發正經歷著深刻變革,但情況跟大多數預測不一樣。雖頭條叫囂“編程已死”,但真相更為微妙:我們正見證“個性化軟件”的崛起——用戶與創作者的界限逐漸消融。這一切都是由大語言模型與AI輔助開發工具的進步所驅動的。當前最令我興奮的AI趨勢是個性化應用。現在,任何人都能創建滿足特定需求的應用而無需開發者或設計師的參與。作為產品設計工作室創始人,我需要擔憂嗎?完全不必。大家開發的應用越多,越能體會優秀軟件背后的匠心。——ShaneLevine這場變革跟取代程序員無關,關乎的是軟件創作的開疆拓土,特別是那些過去因過于個性化或小眾而無法落地的應用。故事的主旨并非AI替代人類開發者,而是AI工具如何催生前所未有的軟件新物種。審視當前開發版圖:傳統軟件公司專注滿足廣泛市場需求,忽視海量的小眾場景。這些空白不只是待開發的功能,而是一整個因過度專業化而美化商品化的軟件類別。但AI輔助開發的興起正在改寫規則。當人們通過自然對話描述需求即可生成可用代碼時,個性化軟件開發的經濟性蔚然改觀。這不是要打造下一個Photoshop或Figma,而是賦能個體為獨特工作流、愛好與難題創造專屬工具。我本人就毫無技術背景(從未編碼),但通過Replit平臺與AI對話,我用手機開發出了追蹤“狗狗吃了沒有”的網頁應用。——a16z風投機構JustineMoore個性化軟件與傳統應用開發有著本質差異。前者涉足的是一個在特殊約束下的新領域:無需支持百萬用戶、無需處理開發者需求以外的邊緣案例,也不需要保持版本的兼容性。當軟件開發所需時間與專業知識斷崖式下降,項目的最小可行市場規模趨近于1。這不僅是量變,更是對“可市場化軟件產品”定義的質變。正是這種簡化場景,讓AI輔助開發在這個領域大顯身手。對某領域認知越淺,越容易對AI的輸出驚艷——此謂“能力幻覺”。——GerardSans資深開發者對AI取代程序員的質疑確有道理:開發維護大型軟件系統仍需當前的AI所缺乏的深厚技術知識、架構理解與經驗。但此類懷疑往往會導致我們忽視個性化軟件開發領域的真實變革。不妨這么想,就像電子表格賦能非程序員完成復雜計算與數據分析一樣,AI開發工具正讓非程序員創建個性化軟件解決方案。關鍵區別在于:電子表格提供的是受限環境,僅針對特定問題,而AI開發打開了為個體需求定制完整應用的可能性。這一轉變對軟件行業影響深遠。我們正從“購買所需”邁向“生成所需”。當個體能自主創建解決方案而非等待商業軟件響應需求時,軟件市場的總潛在規模將爆發式增長。這不僅關乎搶占現有市場份額,更重要的是重新定義了軟件市場的構成。傳統模式下,軟件開發如同工業制造:高固定成本需龐大市場支撐。新模式則類似手工作坊,能為任意規模市場(直至個體用戶)打造工具。對軟件市場的衡量標準亦隨之改變。隨著更多的軟件開發針對的是個人使用而非商業分發,許可證銷售或訂閱收入等傳統指標可能也會失效。我們或需采用新指標,比方說節省的時間或解決問題的數量,來捕捉個性化軟件創造的價值。但需注意一點:AI輔助做出來的個性化軟件可能在健壯性、安全性與可維護性方面比不上專業開發應用。必須理解這些局限性,并認識到這并非專業開發的替代品,而是具備獨特優劣勢的新物種。個性化軟件的涌現引發對開發職業未來的思考。它非但不會削弱專業開發者角色,反而可能推動領域向更抽象與更復雜進化。隨著基礎開發門檻降低,專業人士會更專注于技術專長仍十分關鍵的領域:可擴展性、安全性、性能優化與復雜系統集成。軟件工程史可看作是不斷抽象化的過程。就像編譯器發明并未消除程序化思維的需求,而是將工作提升至更高抽象層級,AI助手亦代表著此進程邁向了下一站。關鍵區別在于:用戶無需學習正式的編程語言,只需掌握如何通過自然語言精確表達計算意圖即可生成可用代碼。AI并未消滅編程,而是為“指示計算機執行特定任務”這一底層過程提供了新的抽象接口。越來越多零編碼經驗者通過lovable_dev等平臺創建應用。這對開發者其實是個利好:用戶終將觸及工具極限,轉而尋求專業解決方案。本欲取代開發者的技術,反而可能創造出更多的機遇。——JulienAI輔助開發的悖論在于:它可能為專業開發者創造更多機會。當用戶通過無代碼平臺與AI助手入門后,終將觸碰到工具的能力邊界。就像建站工具通過賦能中小企業反而擴大了專業網頁開發市場一樣,AI開發工具或將培養出理解定制軟件價值的新一代具備技術素養的客戶。展望未來,包括AI生成代碼共享市場、應用定制擴展工具,以及專為AI輔助開發設計的新框架在內,圍繞個性化軟件開發的新平臺與社區將崛起。軟件開發的真正革命不在AI取代程序員,而在于AI創造出一個前所未有的軟件開發新類別。這一轉變或將孕育出更豐富多元的生態體系——商業應用與長尾個性化解決方案共存共生。在此轉型的過程中需維持一個平衡的視角:個性化軟件的崛起并不預示著傳統開發的終結,正如電子表格并未終結金融軟件一樣。它代表的是軟件創作可能性的拓展,在開辟新機遇的同時,保留專業開發的核心價值。軟件開發的未來并不是有你沒我,而是兼容并蓄。專業開發者會繼續開發復雜系統,AI工具則賦能個體實現曾不可及的個性化方案。這有望令軟件前所未有地更加觸手可及、更加個性鮮明、更加深度地融入生活之中。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
04/02
蘋果重拾“AI醫生”
蘋果的AI醫生為何來遲?3月30日彭博社爆料,蘋果大改其健康App,意欲開發一個全新的“AI醫生”。據悉,該計劃為代號ProjectMulberry,現階段包含AI健康教練、食物追蹤、鍛煉分析、教育內容四大模塊,嘗試利用iPhone作為媒介,向用戶提供一個算法構成的虛擬醫生。ProjectMulberry的四個健康模塊如果用戶同意應用的條款,蘋果將會收集用戶日常生活產生的各類健康數據,并交予AI醫生進行分析,進而為用戶定制個性化的健康管理計劃。同時,蘋果還會與睡眠、營養、物理治療、心理、心臟等方面的醫生共創科教視頻。這些內容將作為AI醫生的補充,向用戶直觀地描述他們的健康信息,或是解釋健康計劃的制定邏輯。舉個例子,當蘋果的App收集到反映心率異常的數據,AI醫生便會在給予用戶提醒的同時,推送一些解釋心臟病風險的視頻,敦促患者及時進行干預。不過,早在深度學習萌芽時,谷歌、微軟、IBM等巨頭便沿著自己的理念推出過各具特色AI醫生,但其中的絕大多數已經折戟,少有企業再提“AI醫生”。而今已是大語言模型時代,蘋果的醫生似乎有些姍姍來遲。01蘋果的AI醫生為何來遲?單單從ProjectMulberry的內容來看,蘋果此次爆出的四個模塊沒有太多吸睛之處。AI健康教練、視頻教育不是什么新鮮概念,食物追蹤、鍛煉分析等基于計算機視覺的應用也早有國內外廠商試水。但對于蘋果而言,當下可能是屬于它最好的時機。眾所周知,蘋果的生成式AI能力一直落后于GAFA中的其他成員。當Gemini和GPT在AI邏輯推理上打得不可開交時,對話式Siri僅僅交出測試成功率66%~80%的答卷。由于每三次交互中便會出現一次錯誤響應,原本2024年的上線計劃被直接推到了2027年。為了追回頹勢,蘋果2月宣布了5000億美元本土投資計劃,打響翻身戰。計劃之中,蘋果將在未來四年重點發展AI服務器制造、研發擴張等產業,強化云計算、AI推理、數據分析能力,預計在2025WWDC大會上推出自研AI系統,整合語音、視覺與多模態交互。因此,在當下這個節點上爆出新計劃,要么是“AI醫生”的想法已在蘋果健康生態構想中孕育多年,要么由于庫克對于健康產業的鐘愛,ProjectMulberry趕上了自家的AI風口。其次,國內外企業雖在“AI醫生”早早開啟布局,但由于算法的局限及數據的缺失,很多企業開發應用效果都不盡如人意,未能走到市場中。舉一個例子:過去很多醫生都提到了這樣一個需求,他們希望AI廠商開發一個智能算法,盡可能準確地識別圖片中各個食物的熱量,以此給予用戶直觀的計算結果,達到熱量攝入控制的效果。在那個沒有生成式AI的時代,AI廠商只能通過深度學習去進行食物的分割,基于食物加工后熱量的平均值進行估算。但因為食物種類多元、加工方法各異,當時的AI無論在食物要素的分割,還是熱量的估算上,都與現實存在較大的誤差。蘋果選擇此刻切入這一賽道,其中的重要原因便是因為相關的AI技術已經趨于成熟。如今,iPhone16已能較為準確地估算食物的卡路里和碳水化合物含量,幫助肥胖癥、糖尿病等疾病患者進行健康管理,加之生成式AI的賦能,新一代的“食物跟蹤”大概率能將分割與計算做得更精準,達到醫用的標準。同理,鍛煉分析亦能借助新的AI技術實現突破。基于iPhone的后置攝像頭,AI醫生能夠取得更為豐富的數據研究用戶的鍛煉情況,提供相應的動作糾正和姿勢糾正,實現“數字物理治療師”功能。總的來說,本有的AI基礎制造投資計劃疊加常年積累的AI視覺能力,蘋果有望將圍繞這些陳舊的概念做出新一代的數智應用。何況,有可穿戴設備這一生態優勢作為支撐,蘋果或許真能盤活AI醫生,使其規模性地落地市場。02越過數字醫療難以逾越的阻礙從ProjectMulberry現有的內容看,蘋果AI醫生期望切入的領域可能是“AI+健康管理”,也可能是“AI+數字療法”。近幾年間風云變幻,兩個賽道中的不少初創公司已經無功而返。追其究竟,相關企業由于缺乏數據難以給出精準的個性化診療計劃,因而服務產生的價值未能覆蓋研發推廣過程付出的高額成本。得益于可穿戴設備生態賦予的多模態數據集成能力,蘋果首先能夠解決“精準性”與“個性化”帶來的問題。2014年,初代AppleWatch便已集成心率傳感器,能夠連續手機用戶的心率變化信息。2018年后,AppleWatch又引入了ECG功能,使其能夠在后臺動態檢測用戶的心臟節律。ECG可謂可穿戴設備在醫療健康功能上的第一個“殺手級”功能,讓真正需要持續體征監控的帶病人群也能從技術的發展中受益,從而打開了慢病人群這一巨大的市場。2021年,蘋果的單導聯ECG和房顫提醒兩個功能以“突破性創新醫療器械”的形式獲得了FDA的器械審批,使其成為全球第一款直接面向消費者的通過手腕檢測心電圖的非處方產品,實現了AppleWatch消費級到醫療級的跨越。2020年9月,新發布的AppleWatchSeries6又加入了血氧監測功能。結合心率變異性(HRV)分析,蘋果可生成深度睡眠質量報告,揭示用戶夜間呼吸與心血管狀態的關聯,為慢性疲勞、睡眠障礙等亞健康狀態提供了早期預警窗口。血糖監測方面,蘋果此前和RockleyPhotonics合作開發硅光子技術,旨在通過激光光譜分析實現無創血糖監測。盡管在2021年雙方分道揚鑣,但蘋果在微型傳感器、光學算法上的積累,正加速這一重要項目的落地。若成功,AppleWatch將首次實現血糖、血壓、心電圖等代謝與心血管指標的閉環監測,顛覆慢病管理的已有范式。多模態數據融合之下,蘋果已為用戶繪制出一幅完整的健康畫像。基于連續的、多維的數據進行輔助決策,AI醫生理論上能夠制定精準的健康計劃,并根據用戶身體變化進行動態調整。蘋果健康生態中各類軟硬件設備的作用其次,“AI健康管理”和“AI數字療法”中的許多企業長期面臨高昂的運營費用,他們必須在研發、獲客、醫生服務等方面投入大量成本。而在ProjectMulberry披露的內容模塊中,大部分服務僅需要內部開發即可,僅有視頻相關內容需要需求醫生的支持。此外,蘋果本身就具備擁有龐大用戶的平臺,因此能夠省下了大量前期成本,使得憑借較低的客單價也能盈利。最后是商業模式。初創公司的絕大多數收入需要依靠提供服務獲取,而蘋果可選擇的商業模式更為豐富。譬如,AI醫生一方面可以軟件的形式,隨Health+納入AppleOne套餐,抽成30%的醫療訂閱費;另一方面可單單作為成本項,通過與蘋果生態的強綁定,拉升蘋果旗下其他可穿戴設備的銷量。三大優勢之下,蘋果或能憑借AI醫生開拓過去初創公司未能跑通的市場,在新的千億院外健康市場中掘金。03重新審視那些被拋棄的醫療AI場景雖說現有的AI技術距離打通嚴肅醫療還有一段距離,但縱觀當下AI企業的應用開發趨勢、國家藥監局審評審批改革路徑、普通百姓對于AI技術極快的接受程度,我們可以清晰預見那個將AI作為私人醫生的時代。而一向謹慎的蘋果開啟布局,或許意味著這個賽道已經存在跑通的可能。當然,發生根本性變化的不止“AI醫生”。這個時候,我們有必要像蘋果那樣,重新審視十年AI發展間功虧一簣的智能應用。當技術的底座向前躍遷,那些被拋棄的醫療AI場景,或已拾得新生的可能。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
03/26
互聯網大廠的AI APP大戰:亂成一鍋粥,誰都怕錯過
三大派別決戰AI新入口。就在上周,小紅書旗下AI搜索APP「點點」不僅接入了DeepSeek,還正式宣布基于自研大模型上線「深度思考」功能,號稱是學了超過10億篇小紅書筆記。與此同時,抖音APP測試接入豆包的消息也在上周悄然流出,從截圖來看,豆包的入口甚至與點贊、評論直接并列,相當醒目。目的并不難猜,根本上還是為了打破豆包與海量抖音用戶之間壁壘,減少用戶使用豆包的體驗成本。抖音Beta測試截圖,圖/Tech星球但應該不止我有這種感受:時至今日,各種AI的APP、APP的AI不是少了,而是太多了。且不提ChatGPT、DeepSeek、Kimi、智譜清言、訊飛星火等各種大模型的APP端,各大互聯網公司也在結合自身平臺的海量數據,推出了各種「更/最懂xxx的AI」,不僅小紅書有「點點」,還有微博智搜、知乎直答、騰訊元寶等等。包括海外,馬斯克的X也有GroxAI。實在有點用不過來。《紅樓夢》里賈寶玉曾對林黛玉言:「任憑弱水三千,我只取一瓢飲。」但面對各種APP里的AI,恐怕用戶想用都用不過來。而且不同平臺的產品策略也有很大不同,知乎直答、微博智搜都是直接集成在主APP之中,點點是在小紅書之外推出獨立的APP,Grox不僅集成在X的APP上,還有獨立的APP。甚至在具體到集成后的入口,各家也有不同的思考和選擇,唯一的共識可能就是幾乎都額外接入了DeepSeek。互聯網公司只要訓練AI、打造APP就可以,但面對市面上已經非常多的通用類、垂直類AIAPP,用戶要考慮的事情就很多了。從APP船票到AI入口,誰都害怕錯過既然AIAPP已經多到讓人用不過來,那我們不禁要問:這些互聯網公司為什么還在一窩蜂地做AI?答案其實很簡單,因為誰都不敢缺席,誰都希望AI能成為自己的下一張王牌。就像10年前大家都想做自己的社交網絡、5年前每家公司都在卷短視頻,現在,AI越來越有可能成為一個吞噬一切的「超級入口」。圖/DeepSeek誰的AI能吸引更多用戶,自然就意味著流量、規模、市場——未來。互聯網公司們自然很在乎,畢竟在這場從APP時代向AI時代過渡的競賽中,誰也不能掉隊,誰都不想認輸。不過,盡管目標都是在AI時代繼續偉大,但各家互聯網公司的AI策略卻明顯不太一樣。而對用戶來說,更關心的問題可能是AI進入APP之后能帶來的獨特價值,而不只是接入大家都已經接入的DeepSeek。1、大模型派:AI即APP,APP即AI。ChatGPT、DeepSeek、Kimi、智譜清言、訊飛星火……這一類大模型玩家的玩法最純粹:直接推出獨立AIAPP,試圖讓用戶把AI當作一個全新的生產力工具,而不是APP里的附加功能。但這條路顯然并不容易。「AI即APP」最大的挑戰在于用戶習慣的改變——畢竟,不是每個人都愿意為一個個AI單獨下載一個又一個的APP,甚至更習慣在已有的APP里順手調用AI。圖/雷科技OpenAI在這方面還是最領先的,ChatGPTAPP擁有全球最多的用戶基數,DeepSeek、Kimi們也都在緊追不舍,尤其是努力拓展用戶規模。2、垂直平臺派:讓AI成為APP的一部分。相比大模型公司,知乎、微博等平臺的選擇更加務實——它們沒有推出獨立的AIAPP,而是直接把AI整合進主APP里。甚至包括小紅書,之前也是在小紅書APP中上線了「達芬奇」「搜搜薯」等實驗性的AI功能。相比單獨推出一個APP會遇到獲客難的問題,這種策略的好處對中小平臺的優勢非常明顯,既避免單獨培養AIAPP的用戶群體所帶來的冷啟動風險,也在最大限度降低用戶使用門檻,讓AI融入已有的用戶習慣。比如說知乎直答、微博智搜直接集成到主APP,用戶無需額外下載就能使用。在微博APP,直接就把微博智搜的入口設置在搜索框中,點擊就能跳轉到「微博智搜」的獨立界面。微博截圖,圖/雷科技但問題在于,這種方式很難讓AI形成獨立的品牌心智,用戶可能并不會記住「知乎直答」或「微博智搜」這個名字,而只會認為這只是APP里的一個普通功能。這或許也是小紅書幾次嘗試過后,最終選擇獨立推出「點點」AI搜索APP的關鍵原因。3、超級巨頭派:獨立App與集成AI雙管齊下相比大模型創業公司,騰訊、字節、百度這類互聯網巨頭有大得多的資源,也有多得多的打法,既能從頭開發一款AI原生APP,也可以通過旗下的超級/頭部應用導流,比如騰訊元寶就直接拿到了微信的推廣位。當然,也包括將AI集成到已有的超級APP之中。這也是字節正在采取的策略,在借助旗下各大渠道的流量推廣,成為2024年中國第一大AIAPP之后,面對DeepSeek的異軍突起,豆包終于也要接入短視頻超級APP——抖音之中。而且入口層級非常高,測試顯示了兩個入口:一個直接出現在短視頻播放界面,與點贊、評論并列;一個是出現在消息列表,更加無縫。這兩個入口,也能讓用戶不知不覺就用上了豆包AI。馬斯克的GroxAI也是類似的模式,不僅推出了獨立APP,還將其直接集成在了X(原Twitter)APP的底欄,還有自己的獨立APP,希望能同時抓住兩類用戶。這種策略相對穩妥,既能利用主APP的流量優勢推廣AI,又能在獨立AIAPP方向上留下后手,但也意味著更高的投入成本。另外值得一提的是,根據官方運營人員的回復,「點點」AI搜索之后也會集成在小紅書APP之中,但入口尚未可知。小紅書截圖,圖/雷科技替代還是互補?一場AI時代的「入口」之爭毋庸置疑,AI的快速進化正在挑戰APP作為主要信息和交互入口的地位。未來,AI會完全替代APP,還是AI只是APP的一部分?從理論上來說,AI是有可能替代一部分傳統APP的,尤其是那些以信息檢索和內容消費為主的應用。試想一個場景,你原本需要打開百度搜索一篇攻略,但AI直接匯總了10篇優質內容,精準給出結論;原本需要在知乎、微博翻閱討論,但AI已經幫你提煉出了核心觀點……當AI能直接完成任務,用戶自然不再需要跳轉多個APP——這意味著,許多APP可能會被AI消解掉,或者說「降級」成AI的數據來源,而不再是用戶主動訪問的目的地。在騰訊元寶使用DeepSeekR1,圖/雷科技但這并不意味著APP會消失。相反,AI也需要APP,或者說,AI需要一個「承載體」。畢竟,AI本身只是個「能力」,而用戶習慣是很難改變的。就像當年移動互聯網崛起時,許多人以為微信會干掉所有APP,但實際上,微信只是成為了「超級入口」,大量APP仍然依賴它來獲取流量。同理,AI可能不會取代所有APP,而是成為一個新的信息分發和交互方式,讓APP變得更加智能。換句話說,未來AI與APP的關系,更可能是「融合」而非「取代」。寫在最后當前AIAPP亂戰的局面,像極了2008年AppStore誕生后最初幾年,大家都在爭搶新的用戶習慣和流量入口。而這場戰爭的最終贏家,可能不會是單一的AI,也不會是單一的APP,而是那些真正能讓用戶「無縫使用AI」的產品。而對用戶來說,更重要的一個命題是我們是否真的需要那么多AI?或者說,未來的AI是否能真正讓用戶「更省心」而不是「更焦慮」?互聯網公司們或許可以繼續往前跑,但普通用戶真正的需求可能沒那么復雜——我們不需要100個AI,我們只需要一兩個真正好用的AI。而目前來看,這場AIAPP之戰,還遠未到蓋棺定論的時候。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
03/26
微信聊天框內置元寶,超級 App 又一輪進化開始
AI技術正在從獨立功能向基礎設施轉變。微信終于在聊天框放了個AI助手。雖然名稱上還是「元寶紅包封面助手」,但在介紹里可以看到其是依托于騰訊混元大模型的AI服務,可以提供陪聊、答題、作圖以及定制紅包封面等功能。微信作為國內最大的社交平臺,這次內置AI助手元寶或許意味著AI技術正在從獨立功能向基礎設施轉變,騰訊正在將微信的生態優勢轉化到AI領域。這會是騰訊重回AI牌桌的絕殺開端嗎?圖片來源:極客公園01實測,用AI更絲滑了極客公園做了一番簡單實測。先是問了一下它和元寶app的異同有哪些:圖片來源:極客公園然后我丟入一篇極客公園昨天發布的公眾號文章鏈接,內容是關于DeepSeek發布V3模型更新,「元寶紅包封面助手」回復說「收到,我問問元寶~」,這個回復有點人性化的。隨后它也沒問我是否需要開啟深度思考,就直接進行了21秒的深度思考:元寶的深度思考過程|圖片來源:極客公園然后給出了我一份分析:DeepSeek公司于2024年3月24日發布了V3模型的重要更新,該版本雖非預期的V4或R2迭代,但在性能表現和開源政策上實現了顯著突破。以下是本次更新的核心要點:技術規格與發布信息模型參數規模達6850億,屬于小版本升級(V3-0324)基于全新32KGPU集群進行后訓練優化已通過官網、App及小程序等多渠道開放使用開源版本同步上線,延續初代V3「557.6萬美元成本比肩Claude3.5」的高性價比特性核心能力提升前端開發能力接近Claude3.7專家級水平,用戶測試顯示:能生成包含CSS動畫與JavaScript交互的完整HTML文件(如天氣卡片動態效果)代碼質量顯著優于舊版R1模型(對比案例顯示視覺效果與功能實現差距明顯)在網站搭建測試中生成效果與Claude3.7Sonnet相當支持復雜指令解析(如通過函數/按鈕組實現多天氣動畫切換)上下文理解能力提升,尤其在多輪對話場景可精準處理跨語言混合編程需求(示例未展示但文中暗示)開源生態建設采用更寬松的開源協議,降低商業應用限制延續初代V3作為首個沖入ChatbotArena榜單前十開源模型的優勢發布1小時內即吸引全球開發者參與測試驗證行業影響與用戶反饋被專業用戶評價為「相當于ClaudeSonnet3.5到3.6的升級幅度」在無官方基準測試情況下,用戶實測數據成為主要驗證依據開發者社區高度關注其開源協議調整帶來的商業化可能性未來展望官方未透露V4/R2研發進展,但用戶期待值持續升溫當前版本已確立開源大模型領域新標桿,可能加劇行業競爭該更新標志著DeepSeek在保持成本優勢的同時,通過技術迭代縮小了與頂尖閉源模型的差距,特別是在編程領域展現出顛覆性潛力,其開源策略調整或將重塑大模型生態格局。眼看清明節就要到了,我也問了問它「清明節做點什么好」,對這個問題它倒是沒回復「收到,去問元寶」,也沒開啟深度思考模式,而是很快就輸出了答案:清明節,作為中國傳統節日之一,不僅是緬懷先人、寄托哀思的時刻,也是親近自然、感受春天氣息的好機會。以下是一些清明節期間可以進行的活動建議:祭掃祖先:前往祖墳或陵園,清掃墓地,獻上鮮花、紙錢等,表達對逝去親人的懷念和敬意。踏青賞春:利用清明假期,與家人朋友一同外出踏青,欣賞春天的美景,呼吸新鮮空氣,放松心情。植樹造林:參與植樹活動,為大地增添一抹新綠,既是對自然的回饋,也是對生命的禮贊。品嘗清明食品:制作或購買清明節特有的食品,如青團、清明果等,體驗傳統節日的風味。文化體驗:參觀博物館、文化遺址,了解清明節的歷史文化背景,增長知識。家庭聚會:利用假期與家人團聚,共敘親情,享受家庭的溫馨。靜思冥想:在寧靜的環境中,進行冥想或靜思,反思生活,規劃未來。公益活動:參與社區或慈善機構組織的公益活動,幫助需要幫助的人,傳遞正能量。戶外運動:進行徒步、騎行、野餐等戶外活動,鍛煉身體,享受戶外的樂趣。攝影創作:帶上相機,捕捉春天的美麗瞬間,進行攝影創作,記錄生活的美好。無論選擇哪種方式,重要的是要用心感受節日的意義,珍惜與家人朋友相處的時光,同時也要注意安全和環保,讓清明節成為一個有意義且愉快的假期。還有分析文件的功能我也試了一下,之前如果看到比較復雜的文件想讓AI先幫忙概括總結一下要點再去細讀的話,得先去打開AI產品或者去相應的網頁,但現在可以直接在微信里丟給這個助手,使用體驗更絲滑了一些。這次「元寶紅包封面助手」也自行開啟了深度思考模式:圖片來源:極客公園在21秒的深度思考后,助手給出了出一份分析:對文檔內容的技術分析與行業洞察一、語言模型技術演進核心突破:從N-gram到Transformer的范式轉變,語言模型參數量級從百萬級(GPT-1)躍升至萬億級(GPT-4)自監督學習(MLM/NSP)解決了海量數據標注難題,預訓練+微調模式成為行業標準詞嵌入維度從768(BERT)擴展到12888(GPT-3),語義表征能力呈指數級提升關鍵技術指標:訓練數據量:GPT-3使用45TB數據(約1萬億詞),相當于1351萬本牛津詞典算力成本:ChatGPT訓練需1萬張V100GPU,成本超10億人民幣模型效率:DeepSeek通過稀疏注意力等技術,將訓練成本降低至同規模模型的1/3二、Transformer架構創新技術革命性:自注意力機制實現O(n2)的全局關聯建模,相比RNN的序列依賴突破顯著多頭注意力層數從12層(BERT)增至96層(GPT-3),上下文窗口從512擴展到32K(Llama2)位置編碼從絕對位置(Sinusoidal)發展到相對位置(RoPE),更好處理長序列工程實踐突破:混合精度訓練(FP16/FP32)節省40%顯存消耗梯度檢查點技術(GradientCheckpointing)實現百倍序列長度擴展張量并行+流水線并行將千億參數模型訓練效率提升80%三、DeepSeek的技術突破開源生態貢獻:模型架構:提出動態稀疏注意力機制,推理速度較Llama提升2.3倍訓練效率:MoE架構實現萬億參數模型在千卡集群上的可行訓練中文優化:構建包含2.6萬億token的中英雙語預訓練語料庫性能指標對比:數學推理:DeepSeek-Math-7B在GSM8K達到83.5%準確率(GPT-4為92%)代碼生成:HumanEval得分68.9%(CodeLlama-34B為53.7%)多模態理解:ViT-22B在ImageNet-21K上top-1準確率達88.7%四、行業發展趨勢技術前沿方向:多模態融合:GPT-4o實現200ms級跨模態響應延遲(人類平均反應時間250ms)推理能力突破:DeepSeek-V3在定理證明任務上達到IMO金牌選手水平能源效率:新型混合架構(如DeepSeek-R1)實現每瓦特算力提升5倍中美競爭格局:開源模型差距從12個月縮短至3個月(Llama3vsDeepSeek-v2)算力基建:中國在建智算中心規劃算力達2000EFLOPS(美國當前運營1200EFLOPS)行業應用滲透率:中國制造業AI質檢部署率達37%,超越美國29%五、關鍵數據啟示經濟學視角:大模型訓練邊際成本曲線:參數規模每提升10倍,單位token訓練成本下降28%ROI周期:頭部企業模型商業化回報周期從36個月縮短至18個月人才密度:頂尖AI研究員中美薪資差距從50%收窄至15%技術倫理考量:安全對齊:最新RLHF技術將有害輸出概率從3.2%降至0.07%能耗優化:液冷集群PUE值從1.5優化至1.08,碳排放減少40%可解釋性:因果歸因算法實現85%的決策路徑可視化注:文中涉及企業及技術參數均來自公開資料,分析基于技術演進規律推導,具體實施需結合行業動態調整。建議關注浙江大學CCAI中心官網獲取最新研究成果。看來關于是否開啟深度思考模式,「元寶紅包封面助手」有自己的判斷,如果任務很簡單,就不開啟,反之自動開啟。02加速AI布局過去一個月,騰訊在AI應用領域加速布局。2月起,騰訊旗下多個核心產品,如微信、元寶、QQ瀏覽器、QQ音樂、ima(騰訊智能工作臺)、騰訊文檔、騰訊地圖等,均接入了DeepSeek模型,并同步支持自研的混元大模型;元寶走向日更級迭代,35天版本更新30次;混元大模型推出騰訊首個自研推理模型混元深度思考模型Thinker(T1)、發布新一代快思考模型TurboS、推出5個全新3D生成模型并全部開源……業務線也作出整合,為了更好地發揮AI技術的協同效應,2月,騰訊將QQ瀏覽器、搜狗輸入法、ima等十余款AI產品及團隊從PCG(平臺與內容事業群)劃歸CSIG(云與智慧產業事業群),形成以「元寶」為核心的「C端工具+B端服務」矩陣。在資金投入上,騰訊也展現了其在AI基礎設施建設上的決心。在1月的2024年度員工大會上,馬化騰提到騰訊會持續投入資源進行算力的儲備。據報道,騰訊計劃在2025年加大算力基礎設施的投資,投資金額或達1000億,其中計算約580億(GPU約400億、服務器約110億、存儲設備約55億、網絡設備將近58億),IDC部分,自建及相關費用加起來將近131億,租用部分將近要花200億。3月19日,騰訊總裁劉熾平在財報后的電話會議上稱,資本支出占收入的百分比將上升到十幾個百分點,人工智能將成為戰略投資的重點。微信這次將大模型產品「元寶」內嵌于聊天界面,看似是功能升級,實則是騰訊對AI時代的戰略卡位。通過將大模型產品以「AI版文件傳輸助手」形態嵌入高頻聊天場景,微信將用戶的工作流、信息流統一收束,通過總結公眾號文章、解析文件、圖片等剛需功能,微信在原有的功能之外,新增了一個可以持續產生價值的AI助手角色,這可能會讓用戶在微信的停留時長和打開頻次迎來結構性增長。微信作為國內最大的社交平臺,這次內置AI助手元寶或許意味著中國互聯網正式進入「AI原生應用」時代,AI技術正在從獨立功能向基礎設施轉變。而隨著開源日漸成為行業趨勢,單純的大模型技術能力越來越難以成為產品和市場競爭的絕對壁壘。當微信這樣的龐大生態,帶著海量用戶接入AI功能,對于所有的AI創業者來說可能都要思考:到底什么樣的功能和創新,可以讓小公司與微信這樣的生態競爭用戶接觸AI的入口;到底什么樣的壁壘,才能不被現有的超級產品生態,以接入新功能的方式吞噬。DeepSeek重塑了AI行業的格局,技術公司、大廠和AI原生創業者,都要重新思考自己的生態位。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
03/26
企業管理軟件的“AI革命”:是救命稻草,還是曇花一現?
不以用戶為中心,任何技術升級都是在炫技,毫無價值可言。2025年隨著deepseek的推出AI技術可以說是火得一塌糊涂,而各大企業軟件行業也紛紛搭上了這趟快車。在短時間內紛紛官宣其接入了deepseek,更有甚者已經再宣傳自身的AI能力了,但問題就是是,這些所謂的AI功能,到底是真能解決問題,還是只是為了蹭熱度?老楊認為企業軟件接入DeepSeek等AI技術,既有蹭熱度的可能,也有真正為用戶服務的動機,但問題是這種動機是否能真正的實現。其實行業人士都看的出大部分的管理軟件公司在短時間內官宣接入DeepSeek都是在蹭熱度,動機何在呢?第一,想通過蹭熱度吸引用戶關注,快速提升銷量或估值;第二,看到競爭對手接入AI,擔心落后,于是匆忙跟進;第三,技術能力不足,接口來湊,部分軟件公司缺乏深度開發AI功能的能力,只能選擇簡單的接口調用這種方式來體現;老楊認為如此做法對于企業管理軟件而言無疑是在“飲鴆止渴”,對于企業用戶而言什么開發過程如何來實現是不懂,只關注結果,軟件公司如此宣傳導致的后果就是企業用戶被宣傳吸引,可能為這些所謂的“偽AI”功能支付額外費用,但實際使用后發現功能雞肋,未能獲得實際價值導致失望和信任流失。此時企業用戶對軟件產品的失望會轉化為負面口碑,可能導致對整個行業的技術能力產生懷疑。作為企業管理軟件應該知道的是AI是工具,不是目的。AI技術的價值在于解決實際問題,而不是作為營銷噱頭。企業管理軟件在接入或開發AI功能時,應該以用戶需求為核心,思考AI如何優化業務流程、提升效率或降低成本。深度整合是關鍵,簡單的接口調用無法發揮AI的真正價值。其實道理誰都懂,只是逃脫不了市場的卷。企業管理軟件加入AI接口或者開發AI功能本身是件好事,但問題是要以用戶為中心,不能為了追潮流、為了AI而AI,AI賣點可以獲取流量高曝光率,可以騙騙不懂技術的企業領導,但也會反噬。比如某軟件公司宣稱自己接入了AI,功能如何智能,結果用戶發現,所謂的AI功能只是一個簡單的關鍵詞搜索工具而已,根本談不上“智能”,反而還很“弱智”,結果很快就在圈子里“臭名遠揚”。圈子里的人都知道AI功能的開發和應用是一個長期過程,需要持續投入資源進行優化和迭代。軟件公司不能指望一蹴而就,企業軟件加入AI功能,絕對不是簡單地接入一個DeepSeek接口就能搞定的事情。AI的引入是一個系統工程,涉及技術、業務、用戶體驗、數據安全等多個層面的深度整合。如果只是簡單地接入一個接口,不僅無法發揮AI的真正價值,還可能帶來一系列問題。DeepSeek與AI技術當前很火,但應用了AI技術就真的能拯救企業管理軟件嗎?老楊認為AI技術確實有潛力為企業管理軟件帶來顯著的價值,但它并不是萬能藥。要真正提升企業管理軟件的競爭力,必須從用戶需求、業務場景、技術整合、用戶體驗等多個維度綜合考慮。企業軟件加入AI功能可以在一定程度上提升企業用戶的效率,比如分析大量數據,提供洞察和預測,幫助企業做出更科學的決策。但AI的效果取決于數據的質量和數量。如果企業管理軟件的數據不完整或不準確,AI的輸出結果也會大打折扣,但對于大部分傳統企業領導而言是不懂這些的,他們不會在管理上做出變革,最終會認為是軟件功能不行、是AI弱智。同時AI功能擅長處理結構化數據和明確規則的任務,但在復雜、模糊的業務場景中,仍然需要用戶的經驗和判斷,所以有時候AI并不能解決管理者所有的痛。而最最關鍵的是AI不是“零成本”,開發真正實用的AI功能需要軟件公司投入大量的成本,且AI技術更新換代很快,軟件公司為此還需要承擔技術風險,而這一切最終都需要企業用戶來買單,并不是所有的企業能夠承擔的起高昂的產品費用。在企業軟件熱火朝天宣傳AI、引進AI技術與其產品結合的同時,老楊認為很多軟件公司比較容易忽視的一個關鍵問題就是:企業用戶的能力。所以不管是在當前還是在以后軟件公司都會面臨如下問題:1.高質量的數據:如果企業原來的數據存在錯誤、不完整或者格式不統一等問題,那么即使軟件具有了AI的功能,也可能無法得到準確的結果。就好比用一堆爛材料蓋房子,再好的工匠也很難蓋出堅固的房子。2.員工接受問題:在大部分員工眼里認為應用AI技術及功能就是為了淘汰,所以會抵觸,這在一定程度上會影響工作效率和軟件的推廣使用。3.行業適配性:不同行業的企業管理需求差異很大,有些行業的業務流程非常特殊和復雜,現有的技術可能無法完全滿足其個性化需求。比如,金融行業對風險控制和合規性要求極高,制造業對生產流程管理要求嚴格,這些特殊需求可能需要企業管理軟件進行深度定制開發,而不僅僅是依靠通用的技術接口就能解決。但深度定制開發又涉及成本、流程與管理變革,最終又會進入無解的死循環里。所以從以上我們不難看出,AI技術為企業軟件行業帶來了新的機遇和挑戰。但AI不是萬能藥,它的價值取決于企業如何應用。如果只是為了趕潮流,那AI充其量就是個“花瓶”;但如果能真正解決用戶痛點,它就能成為企業軟件的“核心競爭力”。面對市場競爭和經濟環境的變化,企業軟件需要深度整合AI技術,提升智能化、個性化和數據驅動能力,同時通過完善的服務體系為客戶創造更大價值。只有那些真正以客戶為中心、深耕技術和服務的企業,才能在AI浪潮中立于不敗之地。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除
-
25
03/25
從互聯網到AI,「大廠」跌落神壇
當前AI發展現狀,缺少用戶全生命周期價值的討論。關于AI能否誕生出下一個超級應用的討論,一直是行業里最熱門的話題。這個話題的本質,是在現有技術框架下尋找最接近AGI的商業化形態。當前ChatGPT的1億用戶規模已接近超級應用門檻,但日均使用時長不足20分鐘的現狀,暴露了工具屬性與粘性需求的矛盾,也折射出AI行業的集體困惑。市面上各類AI應用早已超2000款,從A16z等投資機構的分析來看,當前主流產品集中在AI陪伴、ChatBot、智能客服、圖片視頻生成等領域——當用戶打開手機應用商店時,看到的仍是千篇一律的“AI助手”和“創作工具”,市場始終缺乏一款真正的國民級產品。這一現象的背后,是互聯網與AI兩波技術浪潮的根本性差異。超級應用的背后往往是超級大廠,但從全球范圍來看,大部分AI初創企業熬不過五年生存期。以國內市場為例,據統計,過去三年里,累計超過20萬家AI企業因各種原因退出市場,即使有的能在短時間內成為新晉獨角獸,但一個鮮被關注的現象也同時浮現:盡管這些公司估值飆升、融資不斷,但至今沒有一家能被稱為“大廠”。相比互聯網時代,阿里用“平臺+流量”征服電商,騰訊以“社交+內容”建立帝國,字節跳動靠“算法+推薦”重構信息分發——標準化產品、網絡效應、邊際成本趨零的黃金三角,支撐起超級公司的誕生。而AI時代的技術邏輯正在顛覆這一切:模型訓練成本與場景復雜度正相關、技術復用率低、數據價值呈長尾分布。組織基因的沖突更為尖銳。某大廠AI實驗室采取“賽馬機制”,多個團隊產出的同質化客服系統,最終因無法適配客戶私有化部署全部夭折。這種“大中臺”模式在AI領域的水土不服,折射出更深層的矛盾:當技術價值從通用性轉向場景特異性,傳統的中心化組織架構與AI所需的敏捷響應機制產生根本性沖突。當我們將視角拉遠,會發現這場產業變局的三個核心矛盾:產品邏輯從“用戶連接”轉向“場景滲透”、組織架構從中心化轉向“細胞化”、技術估值體系從“規模溢價”轉向“場景乘數”。這些差異在冥冥之中,或許注定了AI時代難以復刻互聯網的造神神話。當前的AI公司,還沒有真正意義上的“大廠”“大廠”一詞誕生于互聯網時代,核心特征是龐大的員工規模與生態化布局。以騰訊為例,成立五年時總員工數量達到2000,截止目前人數已經超過11萬人;字節跳動更是以年均萬人規模的增速,十年內就達到12萬員工的體量。傳統互聯網大廠通過“產品矩陣+流量生態”模式,將用戶、數據、服務深度綁定,形成自我循環的商業閉環,同時也帶來了大量的就業崗位。就拿電商行業來說,在供給、支付、物流、信用體系加持下,成就了萬億級標準化市場,如今最有代表性的阿里,員工總數已經逼近20萬。某種程度上,人數、崗位的增長,能夠反映出一家互聯網公司的市場規模和業務進展的成熟程度。但縱觀AI領域,目前國內外大部分的玩家,仍以小于千人的創業團隊為主,明星公司如DeepSeek,目前的總人數僅為160人。即使是OpenAI,成立近十年,員工總數也只有2000左右,其中近90%為技術人員,業務仍集中于模型訓練與垂直場景應用,遠低于傳統互聯網大廠的人口增速。AI公司的“技術密集型”結構,與互聯網時代的“人力密集型”模式形成鮮明對比,某種程度上,意味著行業尚未形成可復制的規模化增長路徑。前段時間,有媒體稱,當下AI領域高薪招人成了普遍現象,近一年AI技術崗位中,30%的年薪超過50萬元。類比早年傳統互聯網行業的繁榮,誕生了一批以程序員為代表的城市中產,于是有人推斷,AI也在催生這樣的盛況。但現實中準確的來說,這場AI領域的高薪招聘熱潮,仍然是由互聯網大廠主導。阿里2025年春招開放的3000個實習生崗位中,近50%與AI相關。字節除了廣挖行業專家,張一鳴甚至親自牽頭挖掘各路人才。眾所周知,在最早一批的AI搶跑過程中,大廠幾乎落后了一拍,在技術、產品、商業模式上都沒能主動帶來先發性的突破。隨著大廠補齊短板,創業公司當中,有技術實力的陸續被兼并,有價值的業務、技術和人才最終又回流到了互聯網大廠。后者有資源、有足夠的現金流來支持長期的研究,并能夠在產品側同質化極其嚴重的情況下,憑借綜合優勢后來居上。但需要注意的是,這并不意味著互聯網大廠變成了“AI大廠”,事實上,AI仍只是他們生態內的一個組成部分,負責這部分業務的團隊,大多是在原有基礎上,進行擴充或將隊伍拆分的更加細致。作為對比,不同于互聯網公司的大躍進式招聘,那些一開始走向行業潮頭的新興公司,反而顯示出不斷縮編的跡象。自去年開始,包括MiniMax、月之暗面、零一萬物、智譜在內的AI公司接連傳出裁員消息,當年從大廠出走的技術骨干也陸續出現回流跡象。倒閉8萬家新公司從哪來,到哪去?來看一組數據。自ChatGPT發布到去年8月,國內有近8萬家新注冊的AI公司處于注銷、吊銷或停業異常狀態,占同期新注冊AI企業總量的約9%,也就意味著,由大模型掀起的AI浪潮下,不到三年里興起的創業公司接近90萬家。這些企業從哪來?ChatGPT通過大模型+人類反饋強化學習的技術路徑,實現了自然語言處理的質變,兩個月內用戶破億的商業成功,為國內企業提供了可復制的技術路線參考。資本市場將ChatGPT視為“AI的iPhone時刻”,當年A股市場單月概念股漲幅過半,融資額同比激增數倍。這種財富效應一度點燃了三類玩家:互聯網巨頭通過發布“中國版ChatGPT”搶占輿論制高點;傳統科技企業加速向AI轉型;初創公司紛紛快速成立。有投資人指出,國內資本的投資偏好,使得輕資產、易包裝的初創公司更容易獲得融資。另一方面,伴隨AI被地方列為重點產業并搶灘布局,給出了前所未有的扶持力度,像北京、上海的AI園區提供免費算力、稅收減免,甚至直接給企業“發錢”。當技術、資本和政策的紅利同時出現時,市場往往會陷入虛假繁榮。如果將行業泡沫歸咎于垃圾公司的短期風口套現,那么活下來的優質企業中,又是什么限制了他們的進一步生長?對于這個問題,最容易想到的原因是“缺人”。此前有研究人員表示,國內AI人才總缺口數百萬,一些一線城市的人才需求與當地高校之間存在相差十倍的缺口。今年各家公司春招甚至都開出了百萬年薪招攬畢業生,這些崗位大多為算法工程師、數據科學家、模型架構師等核心技術崗,還有一些與AI相關的業務崗,如AI產品經理、AI硬件工程師等。然而,據行業資深從業者透露,當前AI領域的人才爭奪戰呈現明顯的“戰略囤積”特征——企業意識到人才是核心資源儲備。現實情況中,大部分的AI企業存在“人才到位但效能滯后”的人才空轉現象,技術團隊與業務部門的協同效率不足,導致人均產出甚至要低于互聯網企業。外界對此的解讀分為兩方面。一是企業未能建立起與AI技術相匹配的組織架構和業務閉環,以阿里的電商業務為例,內部并不是所有人都是代碼專家或市場精英,還有大量分布在供應鏈管理、客戶運營、風險控制的支撐性崗位,起到維持商業模式運轉的作用。相比互聯網緊密連接商業世界,能跨越時空解決問題,對實體商業沖擊巨大,改變了人們的生活和消費方式。AI在某種程度上是與商業世界脫鉤的,除了優化部分工作流,在實際應用中的程度相當有限。“衡量一款產品成功與否,一定要看它在用戶全生命周期上發揮的價值,但AI還遠未達到這一要求。”業內人士分析,根本原因一方面在于商業化的路徑不清晰,另一方面在于技術本身的局限性,遠沒有互聯網那么大的影響力。另一個觀點則認為,當下的AI,或許還并不需要那么多的人。人們對AGI的期待,本質是希望AI能突破單一任務限制,具備人類級別的跨領域推理能力。這種愿景推動了大模型技術的爆發式發展。行業追逐的“超級應用”,以及所謂的“大廠”和相關產業鏈路,是在現有技術框架下尋找最接近AGI的商業化形態。但當前技術仍處于“弱AI”階段,大模型存在幻覺、邏輯推理缺陷等問題,距離真正的AGI仍有鴻溝。意味著,AI還要經歷漫長的技術驗證,才有可能跳出高度聚焦于模型訓練或單一場景應用的業務,這一時期,AI呈現出的本質是"智力密度"的比拼,而非互聯網賽道人力規模的較量。更深層的挑戰,在于AI創業公司后期經營過程中的組織缺陷。尤其是國內企業,普遍存在“研究”與“研發”的認知錯位,在高層領導與投資人的push下,科研團隊的時間精力,往往被迫用來應付短期的KPI,而非真正的前沿探索。這種現象在高頻考核體系下尤為突出,算法團隊不得不用有限資源追求更具性價比的短期效果,導致技術迭代陷入“內卷式優化”。因此也就不難理解,DeepSeek創始人梁文鋒多次婉拒騰訊、阿里等大公司投資,將量化基金收益全部投入AI研發,在他看來,比起盲目去擴張團隊,當AGI實現路徑仍不明朗時,與其做垂類和應用尋求變現,更明智的選擇是找到真正合適的人才繼續深入研究。AI需不需要再造大廠?AI這個概念自誕生之初,最大的想象力來源于對人的替代上。前段時間的Manus就是典型的例子,作為一款通用型Agent產品,上線首周便經歷從狂熱追捧到輿論反轉的一波三折,它的突破性體現在產品形態的創新,能夠接管日常的一部分實際工作,這讓人們似乎看到了AGI的一些縮影。但在技術專家看來,Manus的底層技術并不復雜,如果市面上同時上線了多款類似的產品,用戶怎么選擇,將最大限度取決于大模型的精準性,即對人工的真實替代程度。對于企業來說,AI的價值同樣體現在“人工替代”,并一度作為企業降本增效的不二法則。就連一些AI公司也已經將數據標注的工作交給Agent工具,這揭示了AI時代的人才配置邏輯:關鍵崗位需要頂尖專家,基礎崗位應通過技術替代實現人力優化。回到核心話題,AI究竟需不需要大廠?這個問題其實是在討論,AI公司究竟要不要成為騰訊、阿里那樣樹大根深且涉獵縱深的巨型企業,以及有沒有可能孵化出類似微信、淘寶這樣的超級應用。AI技術的落地高度依賴數據、算力和人才,阿里、騰訊、字節等憑借長期積累的海量數據、強大的算力基礎設施以及頂尖人才團隊,在模型訓練和場景落地中占據優勢。在這一背景下,創業公司往往因資源受限難以直面競爭,但部分專注于細分場景的中小公司,可以提供各種垂類應用,通過單點突破實現商業化。大廠的優勢不僅在于技術,更在于業務生態的協同性,騰訊依托微信生態推動商業化發展,阿里通過電商場景優化推薦算法,然而AI產品卻呈現出與以往互聯網截然不同的發展路徑,用戶規模紅利體現得不明顯。當互聯網大廠將電商、教育等業務線的精兵強將調往AI部門時,會發現這些互聯網時代的戰斗單元在AI戰場水土不服。傳統業務部門習慣的“數據驅動決策”與AI團隊的“模型迭代思維”存在本質沖突,前者依賴用戶行為數據優化體驗,后者需要高質量標注數據訓練模型。拿字節CEO梁汝波今年全員會上的描述來說,豆包沒顯出“越多人用越好用”的互聯網產品特性。相比互聯網產品依靠用戶數據進行優化,當下AI產品大多以生成類工具為主,用戶提問數據對于模型優化的好處十分有限。一款擁有幾億甚至幾十億MAU的AI產品,商業價值或許遠不如微信;而一家出色的AI企業,也并不意味著一定會成為阿里、騰訊那樣的規模大廠。根本的原因,和上一輪互聯網浪潮相比,用戶規模的增長往往能帶來顯著的經濟效益,這一輪AI浪潮最鮮明的特征是,盡管有大量資本投入,但還未找到穩定的盈利模式,并且呈現出“C端起量,B端買單”的局面。在2025年的AI產業圖譜中,技術縱深正在取代用戶規模成為核心競爭力。微軟研究院的研究表明,具備跨領域推理能力的AI系統,其價值創造效率將呈現非線性增長。但實現這一目標需要的不是用戶規模,而是高質量的多模態數據和持續的算法創新。換句話說,當技術走過驗證期后,AI或許才能開始討論用戶全生命周期的話題。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
25
03/10
記賬App都這么多了,為啥還有程序員想寫?
真別卷了最近世超發現一個現象。就是問大家點外賣、聽歌用什么App,答案往往就在那幾個里面選。可一旦問到“記賬用什么App”,世超敢打賭,不一樣的回答會超過10種。有人會說錢跡,有人會說鯊魚記賬,可能也有人會說iCost、Cookie等等。之所以會出現這樣的情況,原因并不難猜——一是市面上記賬App實在是太多了,請看圖簡單感受下。。。圖源七麥。二呢,這么多App還沒出現一家或兩家獨大的情況。去年有人在v2ex發了個帖子,讓大伙兒推薦一款記賬軟件。結果世超在53條評論里,看到了13款記賬App的名字。類似的情況,也出現在三年前的一個帖子里。看到這也許有差友會問,為啥市面上會有這么多記賬軟件?一句話概括就是:記賬軟件是獨立開發者的helloworld。只要在互聯網上稍微搜索下,你就會發現很多記賬軟件,其實并不是由一家公司從0做到1的。比如錢跡的作者就是一個叫李唐的程序員,他在北京找工作的那段時間,給自己寫了一個記賬App。后來找到工作后,就用業余時間開發和維護。最后又辭職,全職開發錢跡。比如Cush記賬,是由一個叫Shasha的開發者和小伙伴一起制作的。還有Cookie,也是由一個叫wanbo的獨立開發者維護。那為什么程序員做獨立開發者,要選擇做記賬App呢?最主要的原因,還是記賬的市場太大了。首先,記賬有著天然的需求。它可以讓你清楚財務狀況,培養理財規劃。什么錢該花什么錢不該花,心里都有數。其次,我們這些年金錢出入的方式越來越復雜了。像付錢方式,除了支付寶和微信,很多平臺也能直接從銀行卡扣錢。除了付款,我們還會遇到轉賬,搶紅包,取現,報銷等各種情況。這種情況下,支付寶、微信或者某一手機系統的自動記賬功能,就很難滿足我們的記賬需求。所以越來越多人開始下載專門的記賬App。根據易觀千帆2020年整理的數據,記賬理財應用的活躍用戶在2700萬到3000萬之間徘徊。也許你會說需求大的應用多了去,這些開發者為啥就盯著一個記賬呢?世超問了一個10年大廠程序員Z,他沒有一點猶豫,回復了四個字——容易開發。Z說如果他做一個記賬App,幾天就能出一個demo。要在iOS平臺開發,那更省事,App可以直接借助蘋果的同步功能實現數據同步,不需要自己額外搞后臺服務。這點世超也認可。因為做起來簡單,大公司的技術優勢就沒有了,你請一支團隊能做出來,請一個人也能做出來。所以程序員們跑到這條賽道上,不怕和大公司競爭。簡單是其一,其二是變現手段成熟。這類軟件的盈利方式,基本已經成型了:基本功能免費,高級功能付費。從付費用戶那賺錢,從免費用戶那賺宣傳和口碑。比如世超在用的iCost,它的基礎記賬功能都是免費的,像存錢、報銷、退款、標簽這些都需要會員的。和我解釋完之后,Z也跟我提了一嘴,其實不光是記賬,還有待辦、日歷,這三類App都是大家青睞的創業方向,俗稱獨立開發者三件套。它們都屬于“編程effort不大,但是整體產品收益比較高”的產品,大家自然會做。但世超看到這里,還有一點不能理解。開發一款App,誰不想賺點錢?那賺錢的話,去一條全新賽道,去找一個未被發掘,還不存在競爭的藍海市場不是更簡單嗎?非要在這幾條賽道上擠嗎?我把這個問題,拋給了一位推出好幾款開源App的獨立開發者艾洛。艾洛說,因為這類軟件是高度個性化的。每個人記賬,寫日記,他都有不一樣的需求和偏好。所以即便是市場很卷了,但還是有很多程序員覺得“就這App也能大賣?”“我上我也行啊”“關鍵他也沒滿足我的需求啊”。抱著這種想法,很多人認為自己能做出更好的,更符合用戶需求的軟件來。當然了,也不排除不少程序員,是抱著練手的心態來的。想著不管寫這個軟件有沒有未來,但大家都在寫這個,我也試試唄,還能看出自身的不足。所以這三件套,到底是推薦做還是不推薦呢?大廠程序員Z覺得,如果自己做獨立開發者,估計也會拿三件套練練手。艾洛則說其實自己也想過做。不過他是一個會給自己潑冷水的人。“這個分類太爛大街了,算了吧”,“寫出來也不一定能火,那不是白費腦細胞了嗎”。去年在即刻上,獨立開發者Kenny也分享了一段自己的想法。他不反對開發者做記賬、日記、Todo這類產品,但他反對做毫無特色的。比如只是換個皮膚,其它功能幾乎和現有產品一樣。我認為Kenny說法挺對,我也覺得艾洛那個潑冷水的想法沒啥毛病。因為這類軟件,真卷到頭了。早在幾年前,記賬軟件們就開始往別的地方卷了。比如叨叨記賬可以設置一個虛擬聊天對象,記賬的同時也能跟這個對象對話。記賬城市把記賬變成了一個游戲,記一次賬就會建造你的城市。大家之所以這么開發,是因為在記賬功能上已經沒有可卷的余地了。世超在用的記賬App,里面的“退款”、“報銷”、“多幣種”這些功能,很多記賬App也能做到。之前有一款記賬軟件,我用了4年,但我依然能無痛切換到一款新的軟件,就是因為功能都大差不差。我覺得,獨立開發者的編程能力不是最重要的,最重要的是他的產品設計和思維。前段時間一個沒有編程基礎的人,借助AI寫了一個“小貓補光燈”,它可以顯示不同顏色,用于拍照補光。結果它登上了AppStore付費榜第一。所以獨立開發者的三件套,拿來練手可以,想賺錢的話,你需要確保自己有一個殺手锏的想法。不然真可能有點浪費時間了。。。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
25
03/10
OpenAI爬蟲瘋狂“偷”數據,7人團隊十年心血網站一夜崩了,CEO:太離譜才察覺
“這基本上是一次DDoS攻擊。”幾天前,烏克蘭一家專注于人體3D模型的網站Trilegangers突然崩了,這讓整個團隊以及老板都有些措手不及。起初,該公司CEOOleksandrTomchuk只是收到一則警報,進而發現公司的電子商務網站已完全癱瘓了。一經排查,殊不知,該團隊發現,罪魁禍首竟然是——OpenAI此前研發的一款機器人GPTbot。7人花了十余年時間構建的網站,差一點毀于一旦據悉,Trilegangers是一個銷售3D掃描數據的網站,這家擁有七名員工的公司花了十多年時間,建立了所謂的網絡上最大的“人體數字替身”數據庫,即從真實人體模型掃描而來的3D圖像文件。Triplegangers提供從手、頭發、皮膚到完整身體模型的3D對象文件和照片,一應俱全。其處理的數據涵蓋多個類別,如“臉部”、“全身”、“帶姿勢的全身”、“全身情侶”、“手部”、“手部雕像”等,網站展示的內容正是其業務核心所在。具體來看,以“臉部”數據為例,這一類別中有1509人的數據,每個人注冊了大約20種不同的面部表情。在其他類別中,每個產品至少有三張圖像,因此總數據據說有數十萬個點。這一點也得到CEOOleksandrTomchuk的證實,其表示,“我們有超過65000種產品,每種產品都有一頁內容介紹,每頁至少有三張照片。”Trilegangers所做的業務就是面向3D藝術家、視頻游戲開發者,以及任何需要數字化再現真實人類特征的人群銷售這些數據。然而,OleksandrTomchuk稱,不久前OpenAIGPTBot發送了“數萬”個服務器請求,試圖下載全部內容,數十萬張照片及其詳細描述。這有一種,但凡Trilegangers有的,OpenAI都要的感覺,可是這些內容實則為付費產品。“OpenAI使用600個IP來抓取數據,我們仍在分析上周的日志,也許更多,”該團隊在談到機器人試圖訪問其網站的IP地址時說道。“他們的爬蟲程序正在摧毀我們的網站!”OleksandrTomchuk說,“這基本上是一次DDoS攻擊。”那么GPTbot究竟是什么?不難回憶起來,GPTbot是OpenAI在2023年8月推出的一款網絡爬蟲機器人,用于抓取互聯網數據,為訓練和改進大模型(如ChatGPT)提供素材。它會自動訪問公開可用的網站,收集文本數據來增強模型能力。OpenAI此前表示,GPTBot會嚴格遵守任何付費墻的規則,不會抓取需要付費的信息,并且也不會收集能追蹤到個人身份的數據。即遵循網站的robots.txt文件中明確標示的規則。如果網站配置了禁止GPTBot抓取的標簽,它理論上會停止訪問該網站。而robots.txt是一個用于網站管理的文本文件,它告訴搜索引擎爬蟲(如Googlebot、Bingbot或GPTBot)哪些網頁可以或不可以被抓取。這是一種被廣泛接受的網絡標準,稱為機器人排除協議(RobotsExclusionProtocol,REP)。簡單來看,如果你不想讓GPTBot訪問你網站的任何內容,可以將以下代碼添加到目錄中robots.txt里面:User-agent:GPTBotDisallow:/如果你想要允許訪問網站上的某些內容(例如特定目錄或文件),可以用以下代碼對robots.txt進行以下更改:User-agent:GPTBotAllow:/directory-1/Disallow:/directory-2/除此之外,OpenAI還公布了OpenAI使用的爬蟲IP地址,也可以根據IP地址來拒絕訪問。OpenAI公開了以上這些方式,并聲稱會遵守規則,顯得誠意滿滿。然而,令人無奈的是,一切的前提是得正確配置好“robots.txt”文件,才可以盡可能地避免被爬蟲。這一次Trilegangers就落到了“robots.txt”的坑中。雖然其在官網“使用條款”的第5條行為準則中清清楚楚地寫著:未經TG明確事先書面同意,不得使用任何機器人、爬蟲、網站搜索/檢索應用程序或其他手動或自動設備來檢索、索引、抓取、挖掘數據或以其他方式收集網站內容,也不得復制或繞過網站的導航結構或展示方式。盡管有上述限制,在遵守我們網站根目錄中robots.txt文件中發布的任何指示的前提下,TG授予公共搜索引擎的運營者權限,允許其使用爬蟲從我們的網站復制材料,但僅限于為創建這些材料的公開可用、可搜索索引的唯一目的(且僅限必要范圍內),不得緩存或存檔這些材料。TG保留隨時和不經通知撤銷此權限的權利,無論是一般性撤銷還是針對特定情況。未經TG許可,禁止執行以下行為:1.將本網站上展示的任何內容或圖像用于人工智能或機器學習(“AI/ML”)研究或研究;2.提取、復制、分發或向任何第三方提供本網站展示的任何內容或圖像,用于AI/ML算法的訓練、測試或開發;3.參與任何涉及利用本網站內容或圖像的AI/ML相關活動,包括但不限于數據集編制、模式識別、神經網絡訓練或任何形式的計算分析。任何試圖在未經TG有效許可的情況下將本網站內容或圖像用于AI/ML目的的行為,均被視為違反本網站條款及我們的供應條款與條件,可能導致法律訴訟,并尋求適用法律下的一切補救措施。但如今看來,僅憑這一點的聲明毫無作用,GPTBot還是爬取到了其網站的內容,還讓網站整個宕機了。對此,據Techcrunch報道,此次Trilegangers并沒有正確使用robot.txt,其中的標簽沒有明確告訴OpenAI的機器人GPTBot不要爬取該網站內容。這就意味著OpenAI和其他公司就會認為他們可以隨心所欲地抓取數據。更令人氣憤的是,即使Trilegangers告訴了GPTBot不要抓取自家網站的內容,誰能料到,OpenAI還有ChatGPT-User和OAI-SearchBot機器人用來做爬蟲工具。還值得注意的是,即使更新了網站的robots.txt,也不要掉以輕心,因為OpenAI的系統可能需要大約24小時才能才能識別更新的robot.txt文件。https://platform.openai.com/docs/bots正所謂爬蟲的工具千千萬,企業有時根本防不勝防。“如果爬取的數據少一點,或許都發現不了”就像這一次,如果不是OpenAI的GPTBot爬取的數據過于龐大,也許Trilegangers可能還發現不了。Tomchuk在接受外媒Techcrunch采訪時表示,「如果爬蟲更加“溫和”地抓取,他可能永遠都不會發現。」“這令人害怕,因為這些公司似乎鉆了一個漏洞,聲稱‘你可以通過更新帶有我們標簽的robots.txt文件選擇退出抓取’,”Tomchuk說,但這實際上把責任推給了網站所有者,讓他們必須了解如何屏蔽這些爬蟲。更可怕的是,Tomchuk稱他們連GPTBot究竟是從何時開始抓取的都不知道,更不要說OpenAI具體抓取了哪些內容。這也讓Tomchuk有些擔心,“我們的業務對權利要求非常嚴格,因為我們掃描的是實際的人體,按照歐洲的GDPR等法律,他們不能隨便拿網絡上的任何照片使用。”事件發生后,Triplegangers的網站不僅因OpenAI的爬蟲被迫下線,CEOTomchuk還預計將收到一份因爬蟲導致的高CPU消耗和大量下載活動而產生的高額AWS賬單。同時,Tomchuk稱他也沒找到可以聯系OpenAI的方法,也無法讓他們刪除這些素材。為此,Tomchuk無奈之下選擇用Trilegangers官方Twitter賬號發了一條致OpenAl、Microsoft、Meta、Google和其他使用爬蟲程序的公司的官方聲明:除用于搜索目的的頁面索引外,嚴禁在我們的網站上使用爬蟲程序。未經有效許可,產禁將我們網站上的任何公開內容用于AI或ML應用程序。截至目前,Triplegangers配置好了正確的robots.txt文件,并創建了一個Cloudflare賬戶,用于阻止GPTBot以及他發現的其他爬蟲,例如Barkrowler(一個SEO爬蟲)和Bytespider(TikTok的爬蟲)。引發爭議的數據爬取Triplegangers的經歷引發了廣泛關注,其公開此事后,不少其他網站運營者紛紛表示也曾遭遇類似情況。markerz:我的其中一個網站曾被Meta的AI爬蟲Meta-ExternalAgent完全摧毀。這個爬蟲似乎有些“天真”,沒有像GoogleBot那樣進行性能回退(performanceback-off)。它不斷地重復請求內容,直到我的服務器崩潰,然后短暫停止一分鐘,再次發起更多請求。我的解決方法是添加了一條Cloudflare規則,直接屏蔽該User-Agent的請求。我還為鏈接增加了更多nofollow規則,并更新了robots.txt文件,但這些規則僅僅是建議,某些爬蟲似乎會忽略它們。Cloudflare還有一個功能可以屏蔽已知的AI爬蟲,甚至懷疑是AI爬蟲的請求:https://blog.cloudflare.com/declaring-your-aindependence-block-ai-bots-scrapers-and-crawlers-with-a-single-click/。盡管我不喜歡Cloudflare的集中化,但這個功能確實非常方便。griomnib:我從事網站開發已經數十年,同時也從事過爬取、索引和分析數百萬個網站的工作。只需遵循一個黃金法則:永遠不要以比你希望別人對待你的網站更激進的方式加載其他網站。這并不難做到,但這些AI公司使用的爬蟲既低效又令人厭惡。作為一個網站所有者,這種行為讓我覺得他們對網絡的基本禮儀毫無尊重。而作為一名從事分布式數據采集的工程師,我更是被這些爬蟲的糟糕和低效深深冒犯了。至此,Tomchuk也分享了他想把這一經歷公開的原因,他希望其他小型在線企業了解,發現AI爬蟲是否在抓取網站的版權內容的唯一方法就是主動檢查日志。他并不是唯一一個受爬蟲“侵害”的人,也絕非最后一個。Tomchuk警告道:“大多數網站甚至不知道自己被這些爬蟲抓取了。現在我們不得不每天監控日志活動,以發現這些爬蟲。”本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!