深圳市特普科電子設(shè)備有限公司
聯(lián)系方式:135 1032 1270 (張)
郵 箱:3120537959@qq.com
地 址:深圳市寶安區(qū)福海街道塘尾社區(qū)荔園路142號(hào)翰宇灣區(qū)創(chuàng)新港4號(hào)樓二層
日前,彭博社知名記者M(jìn)ark Gurman表示,Apple Intelligence的首批功能并不令人滿(mǎn)意,而更令人印象深刻的功能將在之后推出。他指出,目前蘋(píng)果公司內(nèi)部員工認(rèn)為,與谷歌、OpenAI和Meta的最新產(chǎn)品相比,蘋(píng)果的人工智能仍然遠(yuǎn)遠(yuǎn)落后。至少到目前為止,其生成式AI技術(shù)落后于行業(yè)領(lǐng)先者兩年多。
Mark Gurman稱(chēng),在蘋(píng)果網(wǎng)站上的iPad mini營(yíng)銷(xiāo)中,該公司重點(diǎn)介紹了四項(xiàng)功能,其中三項(xiàng)要到12月至3月之間才會(huì)推出。
蘋(píng)果最新的AI功能
在今年的蘋(píng)果全球開(kāi)發(fā)者大會(huì)上,Apple Intelligence的亮相引起了廣泛的關(guān)注。在6月10日,蘋(píng)果公司宣布,個(gè)人智能化系統(tǒng)Apple Intelligence將為iPhone、iPad和Mac引入強(qiáng)大的生成式模型,為人工智能隱私樹(shù)立了新標(biāo)準(zhǔn),它能夠理解個(gè)人背景,從而提供有用且相關(guān)的資訊。
根據(jù)蘋(píng)果官方新聞稿,Apple Intelligence深度集成于iOS 18、iPadOS 18和macOS Sequoia中,充分運(yùn)用Apple芯片對(duì)語(yǔ)言和圖像的理解與創(chuàng)作能力,可做出多種跨App操作,同時(shí)結(jié)合個(gè)人場(chǎng)景,為用戶(hù)簡(jiǎn)化和加快日常任務(wù)流程。
按照蘋(píng)果公司的設(shè)想,Apple Intelligence會(huì)帶來(lái)多個(gè)創(chuàng)新功能。在iOS 18、iPadOS 18和macOS Sequoia中會(huì)新增一個(gè)新的工具——Writing Tools。作為一款智能化的書(shū)寫(xiě)工具,Writing Tools能夠?yàn)橛脩?hù)帶來(lái)很多創(chuàng)新體驗(yàn)。比如,它可以幫助用戶(hù)校對(duì)文本,包括單詞選擇和句子的格式;可以重寫(xiě)當(dāng)前的內(nèi)容,而不改變用戶(hù)的本意;可以對(duì)文本進(jìn)行總結(jié),用戶(hù)可以將這些結(jié)論作為關(guān)鍵點(diǎn)匯總,或者繪制成表格,這些摘要可以在郵件和信息應(yīng)用中找到。
Apple Intelligence對(duì)Siri進(jìn)行了全面的重構(gòu),使其具有更深的學(xué)習(xí)能力和更靈活的交互方式。Mark Gurman此前在報(bào)道中透露,Siri將能夠分析用戶(hù)的習(xí)慣、偏好,并提供個(gè)性化的建議。Siri里面也會(huì)加入一些新的工具,比如ImagePlayground、Genmoji等。這些工具均旨在提升用戶(hù)創(chuàng)作趣味,以及社交互動(dòng)的豐富度。
蘋(píng)果官方對(duì)于ImagePlayground也會(huì)倍加推崇,認(rèn)為其將為用戶(hù)提供樂(lè)趣無(wú)窮的圖像創(chuàng)作功能,幫助用戶(hù)用全新方式進(jìn)行交流和表達(dá)自我。ImagePlayground被內(nèi)置在多款A(yù)pp中,借助這款工具,用戶(hù)可以在數(shù)秒間創(chuàng)作出有趣的圖像,且有動(dòng)畫(huà)、插畫(huà)、手繪三種樣式可以選擇。用戶(hù)還可以將使用ImagePlayground創(chuàng)作的趣味圖像發(fā)送給朋友,甚至還會(huì)看到基于當(dāng)前對(duì)話生成的個(gè)性化創(chuàng)意推薦。
當(dāng)然,Apple Intelligence對(duì)于Siri的改變遠(yuǎn)不止于此。Siri還將有能力在各類(lèi)Apple及第三方App中完成數(shù)百種新操作,且對(duì)于用戶(hù)指令的執(zhí)行更加準(zhǔn)確,并具有個(gè)性定制的屬性。參考蘋(píng)果官方給出的示例,用戶(hù)只需說(shuō)出“從我的閱讀列表里調(diào)出那篇關(guān)于蟬的文章”,或者“把周六那天的燒烤照片發(fā)給Malia”,Siri便會(huì)執(zhí)行。
Apple Intelligence背后據(jù)悉擁有兩套模型。本地模型是一個(gè)參數(shù)規(guī)模為3B的語(yǔ)言模型,測(cè)試得分高于Mistral-7B或Gemma-7B等市場(chǎng)上的7B模型;云上模型則是蘋(píng)果在云端服務(wù)器部署的更大規(guī)模的大模型,云端大模型能夠支持100k的詞匯大小,而終端模型支持的是49k的詞匯大小。
對(duì)于蘋(píng)果公司而言,更顯AI戰(zhàn)略有重大改變的行為是,蘋(píng)果公司將會(huì)在全平臺(tái)中集成ChatGPT,用戶(hù)利用Siri可以直接調(diào)用ChatGPT被集成的功能,如圖像生成、文檔理解等。用戶(hù)也可以在Writing Tools等工具中使用ChatGPT的特殊功能,協(xié)助用戶(hù)在自己的主題下生成需要的內(nèi)容。
對(duì)于蘋(píng)果Apple Intelligence的功能,用戶(hù)肯定是十分期待,不過(guò)何時(shí)更新,還不太確定。Mark Gurman此前稱(chēng),Siri的新特性預(yù)計(jì)將在iOS18.3系統(tǒng)中現(xiàn)身,這一時(shí)間點(diǎn)比之前設(shè)想的iOS18.4版本提前。不過(guò),最近有用戶(hù)在推特上發(fā)文稱(chēng),已經(jīng)在蘋(píng)果下一版系統(tǒng)要更新的代碼中出現(xiàn)對(duì)集成ChatGPT的描述,預(yù)計(jì)即將發(fā)布的 iOS 18.2 Beta中就會(huì)出現(xiàn)支持ChatGPT的Siri和iPhone 16的視覺(jué)智能。
蘋(píng)果的AI創(chuàng)新挑戰(zhàn)
雖然看起來(lái)蘋(píng)果的AI創(chuàng)新還不錯(cuò),且部分更新比預(yù)期的提前了,不過(guò)蘋(píng)果內(nèi)部員工對(duì)于該公司的AI水平并不滿(mǎn)意。確實(shí),深究蘋(píng)果即將推出的AI應(yīng)用,并沒(méi)有出現(xiàn)行業(yè)創(chuàng)新引領(lǐng)的功能,都是別人已經(jīng)展示過(guò)的AI應(yīng)用。
蘋(píng)果公司的內(nèi)部測(cè)試顯示,與蘋(píng)果的Siri相比,ChatGPT的準(zhǔn)確率要高出大約25%,并且能夠回答的問(wèn)題也多出約30%。因此,不少蘋(píng)果技術(shù)人員認(rèn)為,該公司的AI技術(shù)水平相較于最前沿的AI技術(shù),落后了至少2年的時(shí)間。
為什么作為全球科技巨頭的蘋(píng)果,在關(guān)鍵的AI技術(shù)上落后了呢。目前來(lái)看,有兩大重要的原因。其一是蘋(píng)果的創(chuàng)新思維,過(guò)去很多年,蘋(píng)果一直在以硬件創(chuàng)新為主導(dǎo),尤其是在智能手機(jī)方面,iPhone的創(chuàng)新能力讓全球科技人致敬。實(shí)際上,這些年蘋(píng)果一直在踐行創(chuàng)始人喬布斯的信念,那就是打造一個(gè)端到端的硬件全家桶,引領(lǐng)全球消費(fèi)電子硬件產(chǎn)品的發(fā)展。
也就是在近幾年,蘋(píng)果在硬件創(chuàng)新方面開(kāi)始乏力,設(shè)備全新外觀、更強(qiáng)大的處理器、更強(qiáng)大的攝像頭、新材料等蘋(píng)果賴(lài)以成名的硬件創(chuàng)新方式,近兩年的表現(xiàn)很難讓人信服,因而產(chǎn)業(yè)界才開(kāi)始更加關(guān)注蘋(píng)果的AI技術(shù)創(chuàng)新。但蘋(píng)果顯然仍在經(jīng)歷硬件創(chuàng)新引領(lǐng)轉(zhuǎn)變?yōu)檐浖?chuàng)新引領(lǐng)的陣痛。
原因之二是蘋(píng)果公司對(duì)于數(shù)據(jù)的保護(hù)態(tài)度,也就是蘋(píng)果的隱私政策限制了蘋(píng)果的AI創(chuàng)新。數(shù)據(jù)是AI技術(shù)發(fā)展的基礎(chǔ),沒(méi)有數(shù)據(jù)的支持,再先進(jìn)的算法和算力也無(wú)法發(fā)揮作用。要打造強(qiáng)大的AI模型,需要三項(xiàng)數(shù)據(jù)支撐:是高質(zhì)量的數(shù)據(jù)集,能夠顯著提高AI大模型的精度與可解釋性,并減少訓(xùn)練時(shí)長(zhǎng);第二是數(shù)據(jù)多樣性,有助于模型更好地理解和捕捉不同的概念、語(yǔ)義和語(yǔ)法結(jié)構(gòu),從而提高其泛化能力;第三是大規(guī)模數(shù)據(jù)集,更大數(shù)據(jù)集通常意味著能夠提供更豐富的信息供AI學(xué)習(xí),減少擬合信息的輸出,特別是對(duì)于深度學(xué)習(xí)模型而言,龐大的數(shù)據(jù)量是提高其性能的關(guān)鍵。
然而,保護(hù)隱私是蘋(píng)果公司的金字招牌,這就導(dǎo)致蘋(píng)果公司很難從其龐大的用戶(hù)群里中間獲取到大量的、有用的數(shù)據(jù),因此到今天仍有相當(dāng)一部分的Siri的答案來(lái)自人工撰寫(xiě),這和ChatGPT生成差距明顯。
生成式AI的下一步
隨著蘋(píng)果公司在全平臺(tái)集成ChatGPT,蘋(píng)果產(chǎn)品體現(xiàn)出來(lái)的AI能力并不會(huì)是弱項(xiàng),因?yàn)镺penAI就是全球的AI公司。那么,后續(xù)蘋(píng)果自己的AI技術(shù)還有希望趕超嗎?我們先看一下生成式AI后續(xù)的趨勢(shì)。
首先是強(qiáng)化學(xué)習(xí)和生成的融合。強(qiáng)化學(xué)習(xí)是一種通過(guò)與環(huán)境交互學(xué)習(xí)更優(yōu)行為策略的機(jī)器學(xué)習(xí)方法,而生成式AI則是一種通過(guò)學(xué)習(xí)數(shù)據(jù)分布來(lái)生成新數(shù)據(jù)的技術(shù)。通過(guò)在生成式AI生成的過(guò)程中引入強(qiáng)化學(xué)習(xí),可以增強(qiáng)圖像生成和編輯、自然語(yǔ)言生成、視頻生成、音頻生成等方面的能力。不過(guò),相較于完全推理生成,加入強(qiáng)化生成可能會(huì)帶來(lái)生成答案的延遲,但結(jié)果質(zhì)量會(huì)更高。
其次是跨模態(tài)生成能力提升,跨模態(tài)是指處理來(lái)自不同感官通道或表現(xiàn)形式的信息的能力,例如文本、圖像、音頻、視頻等??缒B(tài)理解與生成技術(shù)的目的在于建立不同模態(tài)信息之間的橋梁,實(shí)現(xiàn)它們之間的轉(zhuǎn)換和交互。這種能力提升的意義在于,它能夠突破單一模態(tài)的局限性,充分利用多模態(tài)信息的互補(bǔ)性,提高信息處理的準(zhǔn)確性和豐富性。
第三是深度個(gè)性化生成,目前生成式AI 大多是基于大規(guī)模數(shù)據(jù)集的訓(xùn)練,生成結(jié)果缺乏個(gè)性化和定制化,隨著算法的更新以及用戶(hù)數(shù)據(jù)的進(jìn)一步收集,可以讓模型生成更加趨向于個(gè)人定制。
此外還有減少模型幻覺(jué)、提升模型創(chuàng)造力等。不過(guò),在這些趨勢(shì)里,有兩個(gè)關(guān)鍵的因素,一個(gè)是算法,還有一個(gè)是數(shù)據(jù)。我們相信蘋(píng)果軟件算法團(tuán)隊(duì)的能力,但是蘋(píng)果如果難以解決數(shù)據(jù)難題,那么其AI技術(shù)恐怕難以追上對(duì)手。
結(jié)語(yǔ)
Apple Intelligence讓蘋(píng)果的AI似乎又沒(méi)有那么落后了,但其中一部分功勞要?dú)w功于OpenAI公司的ChatGPT,蘋(píng)果自己的AI技術(shù)正如其員工所言,仍至少落后兩年。生成式AI下一步的趨勢(shì)已經(jīng)明朗,但蘋(píng)果自身的障礙仍在,目前來(lái)看除了引入外援,蘋(píng)果很難靠自己引領(lǐng)AI創(chuàng)新了
135-1032-1270
聯(lián)系人:張先生
郵 箱:3120537959@qq.com
地 址:深圳市寶安區(qū)福海街道塘尾社區(qū)荔園路142號(hào)翰宇灣區(qū)創(chuàng)新港4號(hào)樓二層