
第一營地——數(shù)據(jù)即新石油
歷經(jīng)25年時間,型失投資數(shù)萬億美元的敗問IT基礎(chǔ)設(shè)施建設(shè)[尤其在企業(yè)資源計劃(ERP)與客戶關(guān)系管理(CRM)系統(tǒng)等領(lǐng)域],讓全球企業(yè)置身于數(shù)據(jù)的題出海洋之中。
然而,個環(huán)我們反復(fù)聽到的型失一個問題是,企業(yè)數(shù)據(jù)難以轉(zhuǎn)化為具有可操作性的敗問洞見。基于我們的題出實踐經(jīng)驗,企業(yè)在數(shù)據(jù)價值轉(zhuǎn)化過程中,個環(huán)普遍存在三大認(rèn)知誤區(qū)。型失
在每年開展的敗問AI與數(shù)據(jù)科學(xué)咨詢項目中,我們總會遇到這樣一類企業(yè)領(lǐng)導(dǎo)者:他們擁有海量數(shù)據(jù),題出聽說AI可將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值,個環(huán)便要求啟動“探寶式”項目,型失以“看看能不能行得通”。敗問
對此,題出我們會引導(dǎo)客戶聚焦核心業(yè)務(wù)痛點:哪些問題讓他們徹夜難眠?最希望改變的2~3個關(guān)鍵點是什么?如果無法明確這些問題,我們通常會推遲項目,待厘清業(yè)務(wù)場景、找到關(guān)鍵問題之后再推進。
第二類企業(yè)領(lǐng)導(dǎo)者低估了數(shù)據(jù)治理中存在的組織政治因素。他們并不擁有關(guān)鍵數(shù)據(jù),也沒有足夠的權(quán)力或影響力去說服其他利益相關(guān)方共享數(shù)據(jù)。這類項目往往難以產(chǎn)生令人滿意的成果。
相比之下,那些能夠充分利用機器學(xué)習(xí)挖掘多個變量交叉影響的項目,比如對員工流失率的預(yù)測,更具價值。盡管如此,這類項目仍然值得嘗試,因為它們能幫助企業(yè)突破學(xué)習(xí)曲線的起點(大本營),朝著第一、第二營地邁進。雖說距離登頂尚遠,但這是必經(jīng)之路。
第三種情況更加微妙,但也很常見。領(lǐng)導(dǎo)者并不像第一種情況那樣毫無頭緒,他們清楚要解決何種業(yè)務(wù)問題,也知道要開展何種AI分析,但他們忽略了對關(guān)鍵輸入、預(yù)測變量或輸出、結(jié)果變量所必需的變化的理解,而正是這些變化使分析成為可能。
數(shù)據(jù)工程實為一項艱苦的工作。過去10年間,我們在紐約大學(xué)和明尼蘇達大學(xué)雙城分校培養(yǎng)了數(shù)百名數(shù)據(jù)分析專業(yè)人才,發(fā)現(xiàn)數(shù)據(jù)工程是他們最不愿涉足的領(lǐng)域。然而,我們對過去10年中橫跨20多個行業(yè)的250多個數(shù)據(jù)科學(xué)項目的分析表明,數(shù)據(jù)工程的工作量約占數(shù)據(jù)科學(xué)項目總工作量的70%。其工作主要涉及對臟數(shù)據(jù)進行查詢、清洗、格式化和處理,以將其轉(zhuǎn)換為干凈、可用的數(shù)據(jù)集——這正是企業(yè)數(shù)據(jù)科學(xué)之旅的大本營。
在攀登珠穆朗瑪峰的征途中,最危險的路段之一是穿越昆布冰瀑。由于海拔相對較低,且冰川不斷移動,隨時都有可能出現(xiàn)巨大的裂縫,給登山者帶來極大的生命威脅。
這一情形,恰似企業(yè)從數(shù)據(jù)混沌(大本營)走向初步秩序(第一營地)的過程。企業(yè)在大本營開展的所有規(guī)劃和準(zhǔn)備工作,最終將對其能否成功登頂產(chǎn)生決定性影響。

第二營地:充分利用AI的“四大支柱”
如果企業(yè)已經(jīng)成功收集到必要的數(shù)據(jù)和工具,順利抵達大本營,甚至第一營地,那就意味著它具備了向AI巔峰快速挺進的條件。此時,企業(yè)已準(zhǔn)備好運用描述性、預(yù)測性、因果性與規(guī)范性分析四大支柱所支撐的應(yīng)用場景。
然而,根據(jù)我們的實際經(jīng)驗,企業(yè)和政府在推進AI項目時,往往會遇到兩大難題:
一是他們不知道從何入手;二是他們被市場上的AI相關(guān)的夸張宣傳干擾,難以制定清晰的推進路徑。描述性和預(yù)測性分析是AI在現(xiàn)代商業(yè)領(lǐng)域的核心應(yīng)用,分別利用無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)來為企業(yè)提供數(shù)據(jù)洞察。這些分析方法構(gòu)成了機器學(xué)習(xí)(即弱AI)的技術(shù)基礎(chǔ),并被廣泛應(yīng)用于各行各業(yè)。
因此,AI是一項廣泛適用于日常生活的通用技術(shù),絕非簡單地交給IT部門處理的普通任務(wù)。
機器學(xué)習(xí)通常被視作引領(lǐng)第四次工業(yè)革命的關(guān)鍵技術(shù),其重要性與前三次工業(yè)革命中的蒸汽機、電力和計算機等量齊觀。要想理解機器學(xué)習(xí)的通用性,只需關(guān)注不同行業(yè)的公司如何邁出AI轉(zhuǎn)型的第一步——他們最先摘取的是哪些“低垂的果實”。
選擇AI轉(zhuǎn)型的切入點,這一過程更像一門藝術(shù)而非科學(xué),需要業(yè)務(wù)主管與數(shù)據(jù)科學(xué)家反復(fù)磋商。對于那些擁有多年IT系統(tǒng)積累的海量數(shù)據(jù),卻不知從何下手的傳統(tǒng)企業(yè)而言,描述性和預(yù)測性機器學(xué)習(xí)是最佳的起點。
從旅游業(yè)用客戶分群優(yōu)化營銷策略,到服務(wù)業(yè)用員工流失分析輔助HR決策,我們的實戰(zhàn)案例證明,這兩類機器學(xué)習(xí)已成為新時代的“通用技術(shù)”。
接下來,面對日益復(fù)雜的商業(yè)環(huán)境,企業(yè)需要借助因果分析來應(yīng)對挑戰(zhàn)。這種方法依賴于實驗與學(xué)習(xí)文化,鼓勵企業(yè)采用科學(xué)實驗的方法來探索因果關(guān)系。其核心目的在于,幫助企業(yè)領(lǐng)導(dǎo)者和管理者基于科學(xué)原理理解因和果之間的內(nèi)在聯(lián)系。
這種方法在學(xué)術(shù)界早已廣泛應(yīng)用,并且一直用于高風(fēng)險決策場景(如制藥公司決定是否推出新藥)。如今,因果分析正被廣泛應(yīng)用于各類商業(yè)決策,也是“產(chǎn)品思維”驅(qū)動的軟件化數(shù)字化轉(zhuǎn)型的重要基石。
許多企業(yè)已經(jīng)在不同程度上采用因果推理方法(行業(yè)內(nèi)通常稱之為“A/B測試”),來決定應(yīng)該投放哪種廣告、推出哪些功能、設(shè)置何種激勵機制,以引導(dǎo)用戶采取特定行為。
需要明確的是,正如我們之前所討論的,雖然描述性和預(yù)測性機器學(xué)習(xí)具有極高的商業(yè)價值和社會價值,但它們的本質(zhì)仍然基于相關(guān)性,而非因果性。
這些方法大致可以歸為兩種類型: 一是模式挖掘,即發(fā)現(xiàn)數(shù)據(jù)中的有趣關(guān)聯(lián)或異常點; 二是相關(guān)性映射,即將輸入變量與輸出變量關(guān)聯(lián)起來,以進行預(yù)測或打分。
然而,兩者都不能證明因果關(guān)系?;煜嚓P(guān)性和因果性,是大多數(shù)職場人士常犯的關(guān)鍵錯誤,甚至許多受過數(shù)據(jù)科學(xué)和分析訓(xùn)練的專業(yè)人士也難以避免。
同樣需要強調(diào)的是,使用因果分析方法(如公認(rèn)的“黃金標(biāo)準(zhǔn)”雙盲隨機對照試驗),在道德層面或智力層面,并不優(yōu)于使用具有高度相關(guān)性的預(yù)測性深度學(xué)習(xí)模型。
例如,如果一個深度學(xué)習(xí)模型在檢測早產(chǎn)兒視網(wǎng)膜疾病方面,能夠比經(jīng)驗更為豐富的眼科專家團隊更為準(zhǔn)確,那么它就是一種有效的工具。因果分析與預(yù)測性分析只是針對不同挑戰(zhàn)所采用的不同工具,并無優(yōu)劣之分。
此外,這兩種方法在執(zhí)行過程中,所涉及的數(shù)據(jù)分析生命周期也完全不同,從數(shù)據(jù)工程、分析方法,到結(jié)果解讀與溝通方式,都存在顯著差異。因此,我們的目標(biāo)在于幫助企業(yè)領(lǐng)導(dǎo)者理解這些方法的核心邏輯,以便他們能夠根據(jù)實際問題,選擇最適合的分析方法。
舉例來說,本書的一位作者曾受邀為一家大型醫(yī)療設(shè)備制造商的商業(yè)洞察團隊提供咨詢服務(wù),協(xié)助其快速增長的業(yè)務(wù)部門厘清一個問題: 公司在舉辦醫(yī)生學(xué)術(shù)會議和行業(yè)活動方面投入的時間、資金與精力,與醫(yī)生最終開具該公司設(shè)備處方的概率之間,究竟存在怎樣的關(guān)聯(lián)?
這本質(zhì)上是一個典型的ROI問題,數(shù)十年來始終困擾著營銷從業(yè)者。近年來,隨著量化手段的不斷進步,看似有更多數(shù)據(jù)可以追蹤不同營銷活動的效果,許多企業(yè)認(rèn)為能夠直接建立起營銷投入與業(yè)務(wù)成果之間的聯(lián)系。
然而,這種認(rèn)知可能只是一種錯覺,其中存在諸多陷阱,而真正的答案在于能否正確使用因果分析。
該業(yè)務(wù)部門的總裁提出了一個關(guān)鍵問題:“我們?nèi)绾沃?,如果沒有舉辦這些學(xué)術(shù)會議,醫(yī)生是否仍然會開具這些處方?或者說,可能只有一半的處方會被開出?換句話說,我們是否在學(xué)術(shù)會議方面投入過多,而在其他營銷渠道上投入不足?”在數(shù)據(jù)科學(xué)的術(shù)語中,這位總裁實際上是在追問反事實推斷(counterfactual)。
最后,我們來討論規(guī)范性分析。在這一階段,企業(yè)能夠?qū)⑷祟愔腔叟c機器智能進行最佳結(jié)合,充分發(fā)揮各自優(yōu)勢,同時減少其局限性。規(guī)范性分析建立在描述性分析、預(yù)測性分析和因果分析的基礎(chǔ)之上,并在此基礎(chǔ)之上進行優(yōu)化。這種狀態(tài)難以實現(xiàn),且在現(xiàn)實中較為少見,但無疑是值得追求的目標(biāo)。

第三營地:借助深度學(xué)習(xí)、強化學(xué)習(xí)與生成式AI應(yīng)對復(fù)雜用例與數(shù)據(jù)難題
當(dāng)企業(yè)在處理常規(guī)的數(shù)值型或表格型數(shù)據(jù)以及開發(fā)相關(guān)應(yīng)用場景方面越發(fā)得心應(yīng)手后,便可以拓寬視野,嘗試從更豐富也更具非結(jié)構(gòu)化特性的數(shù)據(jù),如圖像、音頻、視頻和自然語言中挖掘商業(yè)價值。
在本書中,我們已經(jīng)詳細(xì)討論了深度學(xué)習(xí)、強化學(xué)習(xí)以及生成式AI在這方面的應(yīng)用。例如,我們的一位客戶需要對某分析咨詢公司提出的方案進行評估,該方案稱可以基于音頻數(shù)據(jù)高精度預(yù)測客戶流失率。
然而,客戶面臨的主要難題在于:如何在不共享私人通話數(shù)據(jù)的情況下,快速評估該模型的可行性? 因為共享這些音頻數(shù)據(jù)需要歷經(jīng)多個法律審批流程,周期較長。
我們給出的解決方案是,利用生成式AI創(chuàng)建具有相同統(tǒng)計特性的合成數(shù)據(jù)集,使用這些數(shù)據(jù)來評估該供應(yīng)商的模型,同時還對另外兩家競爭對手的方案一并進行評估,而整個過程中無須泄露任何真實的私人數(shù)據(jù)。
再比如,一家公司希望檢測放射影像中的特定病理模式,但該企業(yè)自身擁有的訓(xùn)練數(shù)據(jù)極其有限。通常情況下,這種情況會成為深度學(xué)習(xí)模型的一大瓶頸,因為像卷積神經(jīng)網(wǎng)絡(luò)(CNN)這類模型,一般需要大量訓(xùn)練數(shù)據(jù)才能呈現(xiàn)良好的效果。
對此,我們建議該企業(yè)采用遷移學(xué)習(xí)的方法:借助現(xiàn)有的大規(guī)模開源模型,直接繼承其中95%的預(yù)訓(xùn)練參數(shù),僅對模型的最后幾層進行針對性微調(diào),用有限的數(shù)據(jù)集進行訓(xùn)練。這樣,即便在數(shù)據(jù)量受限的情況下,該企業(yè)仍能獲得高精度的放射影像分析模型。

第四營地:攀登AI價值高峰,構(gòu)建強效領(lǐng)導(dǎo)力與組織協(xié)同體系
四號營地位于珠穆朗瑪峰與洛子峰之間的南坳隘口。此處的地貌特征與前后路段截然不同。強勁的側(cè)風(fēng)從北部的西藏高原一路直貫?zāi)喜康哪岵礌柪ゲ嫉貐^(qū),即使在海拔26000英尺的高處,也難有積雪堆積。
這恰似企業(yè)試圖從依賴直覺、經(jīng)驗與主觀判斷的傳統(tǒng)決策模式,向數(shù)據(jù)驅(qū)動、測試-學(xué)習(xí)文化轉(zhuǎn)型時所面臨的“險峻地帶”。從四號營地向珠穆朗瑪峰之巔所邁出的每一步都愈發(fā)艱難。
1978年,奧地利登山家萊茵霍爾德·梅斯納爾與彼得·哈貝勒首次實現(xiàn)無氧登頂,梅斯納爾如此描述瀕臨極限時的感受:“在精神超脫的狀態(tài)下,我仿佛脫離了肉身與視覺,化作漂浮在云霧與峰巒之上、孤獨喘息的一葉肺?!?/p>
然而,他們的這一壯舉堪稱史詩級的突破,如同英國運動員羅杰·班尼斯特打破四分鐘一英里的紀(jì)錄,為后來者開辟了一條曾被視為不可逾越的道路。
在企業(yè)邁向AI之巔的旅程中,所面臨的“南坳級”挑戰(zhàn)主要體現(xiàn)為在組織內(nèi)部培育AI領(lǐng)導(dǎo)力,以及管理AI增強決策所引發(fā)的文化變革。
舉例來說,通過實驗來進行決策,讓許多企業(yè)管理者感到望而生畏,越來越多的研究也表明,這種“實驗規(guī)避”現(xiàn)象普遍存在。4然而,當(dāng)微軟摒棄了“高薪人士的意見”模式,轉(zhuǎn)而采用“A/B測試”時,所有為此付出的努力都是值得的。
任何極具挑戰(zhàn)性的事務(wù),都需要來自領(lǐng)導(dǎo)層的有力推動。
企業(yè)領(lǐng)導(dǎo)者必須深諳第一章中所提及的“AI之屋”的各個要素,熟悉不同類型AI的應(yīng)用場景,并有意識地培養(yǎng)管理團隊對AI潛力的認(rèn)知。這能夠幫助組織積蓄實力,確保優(yōu)先事項與整體戰(zhàn)略保持一致。隨后,要為項目融資,聘用主管和執(zhí)行人員,并組建由業(yè)務(wù)領(lǐng)袖、數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師組成的團隊,力求在AI領(lǐng)域取得早期成果。

構(gòu)建AI人才戰(zhàn)略至關(guān)重要
如果說具有遠見卓識的首席執(zhí)行官是大本營的指揮者,前瞻性的董事會擔(dān)任向?qū)?,那么最終實現(xiàn)登頂?shù)年P(guān)鍵,則在于一支由登山者和夏爾巴人(Sherpas)組成的團隊,他們團結(jié)協(xié)作,共攀高峰。
夏爾巴人來自尼泊爾昆布地區(qū),他們肩負(fù)著勘探路線、架設(shè)安全繩以及承擔(dān)物資運輸?shù)戎厝巍T谖覀兛磥?,他們才是助力登頂?shù)恼嬲⑿邸?/p>
在非科技企業(yè)中,從部門領(lǐng)導(dǎo)到副總裁級別的知識型員工,正面臨著巨大的變革,我們將其稱為“混亂的中間層”。
隨著AI將更多認(rèn)知性工作自動化,人們不禁深思: 銀行是否還需要人工審貸員? 還是說,通過學(xué)習(xí)過去數(shù)十萬個案例(無論好壞)的專業(yè)知識和智慧而訓(xùn)練的算法,能更好地滿足銀行的需求?
企業(yè)需要招聘具有問題定義和翻譯能力的“中層管理者”,他們的核心能力在于確定要解決的問題,明確值得投資的項目。如果一家公司擁有理解“為什么”的強大領(lǐng)導(dǎo)層,以及善于識別機會、確定“是什么”的跨職能中層管理人員,那么就奠定了AI優(yōu)先型企業(yè)的基石。
然而,如果沒有一支實干家的隊伍,即那些擅長運用最先進的AI、機器學(xué)習(xí)和高級分析技術(shù),在各個行業(yè)和職能領(lǐng)域提供創(chuàng)造性解決方案的夏爾巴人(登山中真正的英雄),這幅圖景便是不完整的。
作為全球頂尖商業(yè)分析碩士項目的前任(拉維)和現(xiàn)任(艾寧德亞)主任,我們在培養(yǎng)優(yōu)秀AI人才方面擁有第一手經(jīng)驗:
●第一,要求人才具備高度的商業(yè)敏銳度,能夠區(qū)分資產(chǎn)負(fù)債表和損益表;
●第二,擁有頂級的數(shù)據(jù)工程能力,因為在高級分析項目中,70%的時間都用于清洗、聚合、整合和處理數(shù)據(jù);
●第三,需要深入理解AI分析的四大支柱:描述性分析、預(yù)測性分析、因果分析、規(guī)范性分析;
●第四,具備豐富的實踐經(jīng)驗,能夠向企業(yè)不同層級的利益相關(guān)者清晰傳達AI分析的價值。與許多新的數(shù)據(jù)科學(xué)研究生項目不同,我們的項目并不是對大學(xué)已開設(shè)課程進行“新瓶裝舊酒”式的簡單包裝,而是基于我們提出的“AI之屋”框架,并深度結(jié)合企業(yè)高管的觀點和參與,著重培養(yǎng)解決現(xiàn)實問題的分析轉(zhuǎn)化力、數(shù)據(jù)敘事力以及數(shù)據(jù)倫理實踐力。
在探討AI時代的人才戰(zhàn)略時,我們必須直面一個嚴(yán)峻現(xiàn)實:當(dāng)前在AI及科學(xué)、技術(shù)、工程、數(shù)學(xué)領(lǐng)域(STEM)中,女性、有色人種以及其他少數(shù)族裔的代表性嚴(yán)重不足。我們必須制定積極的策略,使AI優(yōu)先戰(zhàn)略與多樣性、公平性、包容性等現(xiàn)代企業(yè)核心價值觀深度協(xié)同。
特別聲明:以上內(nèi)容僅代表作者本人的觀點或立場,不代表新浪財經(jīng)頭條的觀點或立場。如因作品內(nèi)容、版權(quán)或其他問題需要與新浪財經(jīng)頭條聯(lián)系的,請于上述內(nèi)容發(fā)布后的30天內(nèi)進行。