我最近的咨詢客戶是一家出版公司,正嘗試以各種方式將內(nèi)容數(shù)字化及脈絡(luò)化。我知道該公司有某些競(jìng)爭(zhēng)者已和IBM的華生研究中心(Watson)簽約,便問了他們幾位高層,為什么不和華生研究中心簽約?該公司表示:「我們覺得人工智能(AI)軟件正在迅速大眾商品化,應(yīng)該能用低得多的成本自己組合出需要的功能?!箮孜灰姸嘧R(shí)廣的經(jīng)理也提到,他們預(yù)計(jì)公司會(huì)采用來自不同供應(yīng)商、開放原始碼的認(rèn)知軟件(cognitive software)。他們考慮采用的開放原始碼軟件供應(yīng)商可不是小公司,而是Google、臉書(Facebook)、微軟、亞馬遜和雅虎等大公司。
聽到該公司的策略,我起初有些訝異。能夠思考的機(jī)器,已經(jīng)變得這么便宜又容易取得了嗎?認(rèn)知軟件市場(chǎng)還是個(gè)相對(duì)新的市場(chǎng),居然就已經(jīng)大眾商品化了嗎?廠商還正在努力開發(fā)奇特的深度學(xué)習(xí)(deep learning)功能和機(jī)器學(xué)習(xí)軟件,為什么愿意免費(fèi)提供?而如果IBM推出的軟件不能明顯優(yōu)于免費(fèi)軟件,怎么能預(yù)估華生研究中心將有100億美元的營(yíng)收?
首先談?wù)勅斯ぶ悄艽蟊娚唐坊囊恍┛赡茉颍ㄖ辽僭谀壳皝碚f,人工智能比較適當(dāng)?shù)拿Q或許是「認(rèn)知科技」)。今天所有軟件的重大趨勢(shì)是走向「微服務(wù)」,也就是對(duì)資料執(zhí)行一小組功能,再回報(bào)結(jié)果。通常的形式就是應(yīng)用程式介面(application program interface,API)。但這些軟件較小型,因此比那些較大規(guī)模的軟件更難說服使用者或組織付費(fèi)。這些軟件的規(guī)模小而且模組化,可供多位軟件開發(fā)人員用來設(shè)計(jì)軟件,因此應(yīng)用程式介面常常會(huì)進(jìn)入開放原始碼的程式庫(kù)。
在過去十年左右,認(rèn)知軟件領(lǐng)域的情形正是如此。現(xiàn)在已有許多開放原始碼程式庫(kù),提供各種常見認(rèn)知功能的演算法,像是神經(jīng)網(wǎng)路、深度學(xué)習(xí)(就像是更強(qiáng)大的神經(jīng)網(wǎng)路)、語(yǔ)音剖析(parsing)及辨識(shí)、影像辨識(shí)等等。某些程式庫(kù)開放已久,但像是Google、微軟、臉書和亞馬遜則是到最近一、兩年才免費(fèi)開放。一般的存取方式是透過供應(yīng)商的云端系統(tǒng)(供應(yīng)商至少可借此賺點(diǎn)錢),或是透過像Github這樣的程式網(wǎng)站。如果有很多公司和程式設(shè)計(jì)師使用某個(gè)特定供應(yīng)商的開放原始碼認(rèn)知工具,就很有可能:1. 讓這套軟件成為標(biāo)準(zhǔn);2. 這套軟件很容易整合到同一個(gè)供應(yīng)商的其他產(chǎn)品中。
就連IBM的華生研究中心也是往這個(gè)方向邁進(jìn),至少某個(gè)程度上是如此。雖然軟件并非免費(fèi)(打那么多廣告,總是需要成本),但現(xiàn)在已經(jīng)推出一組應(yīng)用程式介面,可執(zhí)行許多不同認(rèn)知功能,包括影像分析、情緒分析,以及原始的問答功能。我計(jì)算華生研究中心「華生開發(fā)者云端」服務(wù)(Watson Developer Cloud)的目錄,發(fā)現(xiàn)可以取得約20種應(yīng)用程式介面,而這個(gè)數(shù)字不斷變動(dòng),因?yàn)榭赡軙?huì)有新增的應(yīng)用程式介面、取消實(shí)驗(yàn)性質(zhì)的應(yīng)用程式介面,或者合并相關(guān)的應(yīng)用程式介面。認(rèn)知工具大眾商品化的速度很快,因此,如果華生研究中心有部分應(yīng)用程式介面在不久之后成為開放原始碼程式,實(shí)在也不值得訝異。
另一項(xiàng)推動(dòng)大眾商品化的因素,則是發(fā)展出各種對(duì)話機(jī)器人(bot),或許也可稱為「智能人類介面」。對(duì)話機(jī)器人(有時(shí)候使用全稱「chatbot」)是一種小型應(yīng)用程式,能讓人透過文字或語(yǔ)音輸入,與程式對(duì)話。要執(zhí)行這種功能,需要先將語(yǔ)音轉(zhuǎn)為文字、剖析那些文字、并且要能理解大量詞匯。聽來困難,但許多曾推出開放原始碼人工智能軟件的公司,現(xiàn)在也已提供對(duì)話機(jī)器人,可與它們自己的程式和和幾乎其他所有程式溝通。對(duì)話機(jī)器人很快就會(huì)無所不在;現(xiàn)在甚至已經(jīng)有一些開放原始碼程式庫(kù)了。而且,因?yàn)閷?duì)話機(jī)器人只是介面(就像是我們打字或按滑鼠,但更簡(jiǎn)單),大概不會(huì)有人愿意為此付出高價(jià)。
這一切代表的是:想賣認(rèn)知軟件賺大錢,大概會(huì)相當(dāng)困難。但當(dāng)然,如果公司內(nèi)部沒有一整組資料科學(xué)家,就會(huì)需要大量這類的外部服務(wù)。很多公司也會(huì)需要相關(guān)諮詢服務(wù),設(shè)法了解該在本身的哪些業(yè)務(wù)里應(yīng)用這些工具。我認(rèn)為,未來應(yīng)該會(huì)出現(xiàn)高度客制化的人工智能「解決方案」,這些方案十分精細(xì)、完全量身打造,因此不可能透過開放原始碼來取得,例如能夠辨識(shí)偽鈔的影像分析系統(tǒng)。
但大致來說,這類型的軟件應(yīng)該會(huì)有很多,而且是免費(fèi)的。如果你的公司知道這些軟件的用處、用法,也知道如何整合到自己的業(yè)務(wù)里,前途就一片光明。但如果你的公司打算賣這種軟件,前途可能就相當(dāng)堪慮。