我們報道了微軟在Build 2023開發者大會發布的Windows Copilot——深度集成在Windows 11人工智能助手。
至此,Copilot已經出現在了微軟幾乎所有重要產品之中,包括輔助編程的Github Copilot、輔助辦公的Microsoft 365 Copilot、輔助客戶溝通的Viva?Copilot、輔助業務流程的Dynamic 365 Copilot等等。
微軟比那些宣告自己AI first、All in AI的公司還要更進一步,選擇All in Copilot,即全面轉向人工智能輔助技術。
我們來到了轉折點
看到這里,相信有相當一部分不那么關心AI技術的讀者還不太了解,“Copilot”到底是什么。
“Copilot”一詞源自飛行術語,意思是副駕駛員(Co-pilot)。在飛機上,副駕駛員是協助主駕駛員操作飛機的人,通常當主駕駛員需要休息或處理其他任務時,副駕駛員就會接管控制權,二者共同負責飛機的安全飛行。
對照這個定義,我們就不難理解:每個使用計算機程序的人都是“駕駛員”,AI則是輔助我們航行的“副駕駛”。
舉個例子,當你準備沉下心來辦公,你就可以在Windows 11調出Copilot,把你的需求敲進去:
Windows Copilot會建議你打開專注模式,并把系統界面調整成更沉浸的暗色模型。
這時候你還想聽一點音樂,再敲入需求:
Windows Copilot會根據你喜歡的音樂類型,在Spotify等音樂軟件上播放對應的歌單。
聽起來我們像是又回到了命令行界面時代,通過一個輸入框實現所有的計算機操作。但不同的是,你不再需要花時間去學習和理解編程這門專屬于計算機的語言,你只要用人類的自然語言把你的需求拋給它,它就能幫你解決。
Windows Copilot還可以幫你解決很多問題,例如當你收到一份冗長到讀不下去的文件,你可以直接把它從桌面拖到Copilot上,讓AI幫你總結這份文檔,實現“量子速讀”。
你還可以讓它幫你重寫或者解釋文檔的內容,提高工作的效率。簡單來說,Copilot不能完全取代你的工作,但它能幫你節約很多不必要的重復性勞動,從而節約你在“數字瑣事”上花費的時間。
這也是微軟對于Copilot的定義:一種使用自然語言處理技術或大語言模型(如GPT-4),幫助人們完成復雜或認知任務的應用程序或組件。
從撥號上網年代一路走來的朋友可能就察覺到了一些關鍵要素:
操作系統+助手,等等,這不就是Windows 97時代的Clippy和Windows Phone時代的Cortana嗎?。?/p>
沒錯,Clippy、Cortana和Copilot(微軟是不是對C開頭的單詞有執念?)在定位上確實存在一定的重合,你甚至可以把它們看作同一款產品在不同交互界面時代的三種形態。
Clippy:圖形交互界面的系統助手,其設計初衷是提供了一個平易近人、友好的界面,以簡化復雜的操作任務。然而,由于Clippy需要通過一個彈窗進行交互,它總會不合時宜地彈出來,導致用戶在使用時失焦。
Cortana:語音交互界面的系統助手,對標Siri和Google助手,定位個人數字助手。但受限于功能局限,Cortana能做的事情很有限,即便微軟盡可能地把Cortana推向Windows之外的更多平臺,也很難吸引用戶使用。
Windows Copilot:自然語言交互時代的AI助手,它深植于系統之中,又不局限于系統,它可以集成于各種程序和應用中,并且能夠理解用戶的需求并提供幫助,在功能性、靈活性和集成度方面遠超Clippy和Cortana。
從技術發展的路線來看,你會發現Copilot與Cortana的路徑類似但方向截然不同。
2014年,Cortana作為Windows Phone 8.1的默認語音助手首次亮相,提供語音搜索、日程管理和個性化建議等功能,標志著微軟正式進入語音助手市場,與蘋果和Google競爭。
隨后,Cortana隨Windows 10操作系統一同推出,拓展到PC和平板電腦之上,集成了更多的系統功能,為更多人熟知。
在接下來的時間,微軟把Cortana塞進了包括Microsoft 365套件、Teams等更多的產品之中,希望能獲取更多的用戶。
但到了2021年,微軟決定停止Cortana大部分服務,退出這場語音助手大戰。
Cortana的失敗不僅是因為其市占率一直上不去,還因為語音助手功能本身很難再翻起太大的浪花:10年前的語音助手能幫你寫郵件、查天氣,10年后它仍然只能做這些基礎型的工作,用戶的感知并不強。
直到ChatGPT的出現,語音AI助手給人留下的“愚蠢”刻板印象才被打破。
ChatGPT能夠通過自然語言理解人們的需求,幫助人們完成一些需要高智能的任務,雖然GPT模型時而會出現生成錯誤的答案,但已經解決了AI助手長期以來的痛點——語義理解。
這是一個關鍵的轉折點,微軟迅速地把大語言模型技術與其產品結合起來,丟出了一個又一個讓人瞠目結舌的技術Demo:用聊天的方式在Bing搜索、用幾句需求做出個精美的PPT、讓Edge瀏覽器一鍵總結網頁內容……
很快,Copilot將無處不在,AI將無處不在,我們與計算機交互的固有邏輯開始出現裂縫,一個新的交互邏輯準備破殼而出,重新定義新一代的計算機和互聯網。
比爾·蓋茨在AI爆發后給出了他的判斷。
也就是說,側邊欄AI助手將會成為一個新的常態,你的語言會變成像鼠標點擊、手指觸碰一樣具有“魔力”的新交互方式。
只不過,如果你只是把Copilot看作是一個新時代的AI助手,那你就太小看微軟的野心了。
全新的軟件形式
前面我們說到,微軟為旗下的很多產品都接入了Copilot,讓Bing、Edge、Office煥發出新的活力。
更重要的是,這些散落在不同軟件的Copilot彼此之間并非獨立,而是相互打通的。
這里我們要引入一個很重要的概念——插件集。
你可以把這些基于大語言模型的Copilot理解成Chrome瀏覽器(當然,這是一個非常不恰當的比喻),而插件就是瀏覽器上面的擴展程序,有了第三方的插件,Copilot就能實現很多不同的功能。
此前,我們曾詳細介紹過ChatGPT的插件集體驗,有了這些第三方插件,ChatGPT可以實現訂餐、查航班、解答數理化難題等等功能。
現在,這些插件同樣可以應用在Bing、Edge、Office甚至Windows之中,因為這些產品都采用了同樣的開放插件標準。
簡單來說,開發者只要開發一次插件,就能應用在微軟的一系列Copilot之中,這給開發者和用戶都帶來了極大的靈活度。
還是拿實際應用舉例。
很快,你可以在Bing調用Zillow插件(租房信息查詢),然后直接向Bing提問,“用XX預算在X地租房有什么房源推薦?”。Bing就能直接給出對應的房源信息。
或者你可以在Edge瀏覽器上讓AI幫你總結食譜,然后調用Instacart插件,一鍵購買你缺少的食材。
這是一種全新的信息獲取方式,它跳過了從搜索引擎到服務商網站、再到具體信息的過程,直接提取了你最需要的內容,然后以平鋪直敘的方式呈現給你。
Copilot+插件,或許會改變我們使用網絡獲取服務的方式。
另一方面,在我們最熟悉的Office套件上,也能夠使用插件。
例如當你想用Word起草一份法律合同,但是你并不熟悉當地的法律,你就可以調用Thomson Reuters、Westlaw等法律插件來幫你起草和修改具體的內容。
插件集的出現豐富了大語言模型的可能性,而一個共同的插件標準又讓插件集的作用變得最大化,這就是微軟正在構建的Copilot技術堆棧,最終共同拼成了微軟眼中Copilot最理想的形態:
不僅是一種新的程序,不僅是一種新的用戶界面,還是一個新的平臺。
正如前面所說,大語言模型的出現賦予了軟件前所未有的易用性和可操作性,“AI助手化”會成為軟件設計的新常態。
像Adobe等廠商都已經開始在自家的軟件加入AI功能,越來越多的開發者會考慮為自己的產品設計“Copilot”。
微軟瞄準的正是這么一個尚處于萌芽時期的新機會,它想要利用自己在桌面系統和辦公軟件超高占有率的優勢,搶先建立起這個全新的平臺,領先一眾對手。
微軟CTO Kevin Scott在Build大會上誠摯地向開發者們介紹了這個宏大的愿景,他引用了比爾·蓋茨的一段話:
Kevin Scott認為像GPT-4這樣的基礎模型很強大,非常強大,但它并不能做所有的事,這需要更多開發者將這樣的技術應用到相對應的程序之中,把大語言模型作為構建程序的一部分,AI才能創造出全新的用戶體驗。
這是一種全新的程序開發方式。Kevin Scott拋出了一個觀點:
當下,AI正在以不可思議的速度重塑著人們對科技、對世界的認知,它不僅改變了我們處理數據的方式,也在重新定義我們與機器的交互方式,甚至是我們理解和解決問題的方式。
大語言模型的崛起,突破了傳統的程序設計框架,AI開始能理解我們的語言,預測我們的需求,甚至理解我們的情感,用數據和算法的力量解決了以前我們難以想象的問題。
值得敬畏的是,面對這樣一場全新的科技巨變,48歲的微軟依然走在技術變革的最前沿。
來源:虎嗅
文章轉載于其他網絡,如有侵權請聯系我們及時刪除!