人工智障 2:你所看到的AI和智能無關(guān)(中)

Part 3

人類對話的本質(zhì):思維


??對話的最終目的是為了同步思維?

你是一位30出頭的職場人士,每天上午9點半,都要過辦公樓的旋轉(zhuǎn)門,進大堂的,然后刷工牌進電梯,去到28樓,你的辦公室。今天是1月6日,平淡無奇的一天。你剛進電梯,電梯里只有你一個人,正要關(guān)門的時候,有一個人匆忙擠進來。

進來的快遞小哥,他進電梯時看到只有你們兩人,就說了一聲“你好”,然后又低頭找樓層按鈕了。

你很自然的回復(fù):“你好”,然后目光轉(zhuǎn)向一邊。

兩邊都沒什么話好講——實際上,是對話雙方認為彼此沒有什么情況需要同步的。

人們用語言來對話,其最終的目的是為了讓雙方對當(dāng)前場景模型(Situation model)保持同步。(大家先了解到這個概念就夠了。更感興趣的,詳情請見?Toward a neural basis of interactive alignment in conversation)。

The interactive-alignment model (based on Pickering and Garrod,?2004)

上圖中,A和B兩人之間發(fā)展出來所有對話,都是為了讓紅框中的兩個“Situation model” 保持同步。Situation model 在這里可以簡單理解為對事件的各方面的理解,包括Context。

不少做對話系統(tǒng)的朋友會認為Context是僅指“對話中的上下文”,我想要指出的是,除此以外,Context還應(yīng)該包含了對話發(fā)生時人們所處的場景。這個場景模型涵蓋了對話那一刻,除了明文以外的所有已被感知的信息。 比如對話發(fā)生時的天氣情況,只要被人感知到了,也會被放入Context中,并影響對話內(nèi)容的發(fā)展。

A: “你對這個事情怎么看?”?

B: “這天看著要下雨了,咱們進去說吧”——盡管本來對話內(nèi)容并沒有涉及到天氣。

對同一件事情,不同的人在腦海里構(gòu)建的場景模型是不一樣的。 (想要了解更多,可以看?Situation models in language comprehension and memory. Zwaan, R. A., & Radvansky, G. A. (1998).?)

所以,如果匆忙進電梯來的是你的項目老板,而且假設(shè)他和你(多半都是他啦)都很關(guān)注最近的新項目進展,那么你們要開展的對話就很多了。

在電梯里,你跟他打招呼:“張總,早!”, 他會回你 “早啊,對了昨天那個…”

不待他問完,優(yōu)秀如你就能猜到“張總” 大概后面要聊的內(nèi)容是關(guān)于新項目的,這是因為你認為張總對這個“新項目”的理解和你不同,有同步的必要。甚至,你可以通過昨天他不在辦公室,大概漏掉了這個項目的哪些部分,來推理你這個時候應(yīng)該回復(fù)他關(guān)于這個項目的具體什么方面的問題。

“昨天你不在,別擔(dān)心,客戶那邊都處理好了。打款的事情也溝通好了,30天之內(nèi)搞定?!?——你看,不待張總問完,你都能很棒的回答上。這多虧了你對他的模型的判斷是正確的。

一旦你對對方的情景模型判斷失誤,那么可能完全“沒打中點上”。

“我知道,昨天晚上我回了趟公司,小李跟我說過了。我是要說昨天晚上我回來辦公室的時候,你怎么沒有在加班呀?小王,你這樣下去可不行啊…”

所以,人們在進行對話的過程中,并不是僅靠對方上一句話說了什么(對話中明文所包含的信息)就來決定回復(fù)什么。而這和當(dāng)前的對話系統(tǒng)的回復(fù)機制非常不同。

?對話是思想從高維度向低維的投影?

我們假設(shè),在另一個平行宇宙里,還是你到了辦公樓。

今天還是1月6日,但2年前的今天,你與交往了5年的女友分手了,之后一直對她念念不忘,也沒有交往新人。

你和往日一樣,進電梯的,剛要關(guān)門的時候,匆忙進來的一個人,要關(guān)的門又打開了。就是你2年前分手的那位前女友。她進門時看到只有你們兩,她抬頭看了一下你,然后又低頭找樓層電梯了,這時她說:“你好”。

請問你這時腦袋里是不是有很多信息洶涌而過?這時該回答什么?是不是類似“一時不知道該如何開口”的感覺?

這個感覺來自(你認為)你和她之間的情景模型有太多的不同(分手2年了),甚至你都無法判斷缺少哪些信息。有太多的信息想要同步了,卻被貧瘠的語言困住了。

在信息豐富的程度上,語言是貧瘠的,而思想則要豐富很多?“Language is sketchy, thought is rich” (New perspectives on language and thought,Lila Gleitman,?The Oxford Handbook of Thinking and Reasoning;更多相關(guān)討論請看, Fisher & Gleitman, 2002; Papafragou, 2007)

有人做了一個比喻:語言和思維的豐富程度相比,是冰山的一角。我認為遠遠不止如此:對話是思想在低維的投影

如果是冰山,你還可以從水面上露出來的部分反推水下大概還有多大。屬于維度相同,但是量不同。但是語言的問題在,只用聽到文字信息,來反推講話的人的思想,失真的情況會非常嚴重。


為了方便理解這個維度差異,在這兒用3D和2D來舉例:思維是高維度(立體3D的形狀),對話是低維度(2D的平面上的陰影)。如果咱們要從平面上的陰影的形狀,來反推,上面懸著的是什么物體,就很困難了。兩個陰影的形狀一模一樣,但是上面的3D物體,可能完全不同。

對于語言而言,陰影就像是兩個 “你好”在字面上是一模一樣的,但是思想里的內(nèi)容卻完全不同。在見面的那一瞬間,這個差異是非常大的:

你在想(圓柱):一年多不見了,她還好么?

前女友在想(球):這個人好眼熟,好像認識…


?挑戰(zhàn):用低維表達高維?

要用語言來描述思維有多困難?這就好比,當(dāng)你試圖給另一位不在現(xiàn)場的朋友,解釋一件剛剛發(fā)生過的事情的時候,你可以做到哪種程度的還原呢?

試試用語言來描述你今天的早晨是怎么過的。

當(dāng)你用文字完整描述后,我一定能找到一個事物或者某個具體的細節(jié),它在你文字描述以外,但是卻確實存在在你今天早晨那個時空里。


Source:The Challenger


比如,你可能會跟朋友提到,早飯吃了一碗面;但你一定不會具體去描述面里一共有哪些調(diào)料。傳遞信息時,缺少了這些細節(jié)(信息),會讓聽眾聽到那碗面時,在腦海里呈現(xiàn)的一定不是你早上吃的“那碗面”的樣子。

這就好比讓你用平面上(2D)陰影的樣子,來反推3D的形狀。你能做的,只是盡可能的增加描述的視角,盡可能給聽眾提供不同的2D的素材,來盡量還原3D的效果。

為了解釋腦中“語言”和“思想”之間的關(guān)系(與讀者的情景模型進行同步),我畫了上面那張對比圖,來幫助傳遞信息。如果要直接用文字來精確描述,還要盡量保全信息不丟失,那么我不得不用多得多的文字來描述細節(jié)。(比如上面的描述中,尚未提及陰影的面積的具體大小、顏色等等細節(jié))。

這還只是對客觀事物的描述。當(dāng)人在試圖描述更情緒化的主觀感受時,則更難用具體的文字來表達。?

比如,當(dāng)你看到Angelina Jordan這樣的小女生,卻能唱出I put a spell on you這樣的歌的時候,請嘗試用語言精確描述你的主觀感受。是不是很難?能講出來話,都是類似“鵝妹子嚶”這類的?這些文字能代表你腦中的感受的多少部分?1%?

希望此時,你能更理解所謂 “語言是貧瘠的,而思維則要豐富很多”。

那么,既然語言在傳遞信息時丟失了那么多信息,人們?yōu)槭裁蠢斫馄饋?,好像沒有遇到太大的問題?

?為什么人們的對話是輕松的?

假設(shè)有一種方式,可以把此刻你腦中的感受,以完全不失真的效果傳遞給另一個人。這種信息的傳遞和上面用文字進行描述相比,豐富程度會有多大差異?

可惜,我們沒有這種工具。我們最主要的交流工具,就是語言,靠著對話,來試圖讓對方了解自己的處境。

那么,既然語言這么不精準(zhǔn),又充滿邏輯上的漏洞,信息量又不夠,那么人怎么能理解,還以此為基礎(chǔ),建立起來了整個文明?

比如,在一個餐廳里,當(dāng)服務(wù)員說 “火腿三明治要買單了”,我們都能知道這和“20號桌要買單了”指代的是同樣的事情 (Nuberg,1978)。是什么讓字面上那么大差異的表達,也能有效傳遞信息?

人能通過對話,有效理解語言,靠的是解讀能力——更具體的點,靠的是對話雙方的共識和基于共識的推理能力。

當(dāng)人接收到低維的語言之后,會結(jié)合引用常識、自身的世界模型(后詳),來重新構(gòu)建一個思維中的模型,對應(yīng)這個語言所代表的含義。這并不是什么新觀點,大家熟悉的開復(fù)老師,在1991年在蘋果搞語音識別的時候,就在采訪里科普,“人類利用常識來幫助理解語音”。

當(dāng)對話的雙方認為對一件事情的理解是一樣的,或者非常接近的時候,他們就不用再講。需要溝通的,是那些(彼此認為)不一樣的部分。

當(dāng)你聽到“蘋果”兩個字的時候,你過去建立過的蘋果這個模型的各個維度,就被引用出來,包括可能是綠或紅色的、味道的甜、大概拳頭大小等等。如果你聽到對方說“藍色的蘋果”時,這和你過去建立的關(guān)于蘋果的模型不同(顏色)。思維就會產(chǎn)生一個提醒,促使你想要去同步或者更新這個模型,“蘋果為什么是藍色的?”

還記得,在Part 2 里我們提到的那個測試指代關(guān)系的Winograd Schema Challenge么?這個測試的名字是根據(jù)Terry Winograd的一個例子而來的。

“議員們拒絕給抗議者頒發(fā)許可證,因為他們 [害怕/提倡] 暴力?!?/p>

當(dāng) [害怕] 出現(xiàn)在句子當(dāng)中的時候,“他們”指的應(yīng)該是議員們;當(dāng)[提倡]出現(xiàn)在句子當(dāng)中的時候,“他們”則指的是“抗議者”。

1. 人們能夠根據(jù)具體情況,作出判斷,是因為根據(jù)常識做出了推理,“議員害怕暴力;抗議者提倡暴力?!?/p>

2. 說這句話的人,認為這個常識對于聽眾應(yīng)該是共識,就直接把它省略掉了。

同理,之前(Part 2)我們舉例時提到的那個常識 (“四川火鍋是辣的;日料不是辣的”),也在表達中被省略掉了。常識(往往也是大多數(shù)人的共識)的總量是不計其數(shù),而且總體上還會隨著人類社會發(fā)展的演進而不斷新增。

例子1,如果你的世界模型里已經(jīng)包含了“華農(nóng)兄弟” (你看過并了解他們的故事),你會發(fā)現(xiàn)我在Part 2最開始的例子,藏了一個梗(做成叫花雞)。但因為“華農(nóng)兄弟”并不是大多數(shù)人都知道的常識,而是我與特定人群的共識,所以你看到這句話時,獲得的信息就比其人多。而不了解這個梗的人,看到那里時就不會接收到這個額外的信息,反而會覺得這個表達好像有點點奇怪。

例子2,創(chuàng)投圈的朋友應(yīng)該都有聽說過 Elevator pitch,就是30秒,把你要做什么事情講清楚。通常的案例諸如:“我們是餐飲界的Uber”,或者說“我們是辦公室版的Airbnb”。這個典型結(jié)構(gòu)是“XX版的YY”,要讓這句話起到效果,前提條件是XX和YY兩個概念在發(fā)生對話之前,已經(jīng)納入到聽眾的模型里面去了。如果我給別人說,我是“對話智能行業(yè)的麥肯錫”,要能讓對方理解,對方就得既了解對話智能是什么,又了解麥肯錫是什么。

基于世界模型的推理?

場景模型是基于某一次對話的,對話不同,場景模型也不同;而世界模型則是基于一個人的,相對而言長期不變。

對世界的感知,包括聲音、視覺、嗅覺、觸覺等感官反饋,有助于人們對世界建立起一個物理上的認識。對常識的理解,包括各種現(xiàn)象和規(guī)律的感知,在幫助人們生成一個更完整的模型:世界模型。

無論精準(zhǔn)、或者對錯,每一個人的世界模型都不完全一樣,有可能是觀察到的信息不同,也有可能是推理能力不一樣。世界模型影響的是人的思維本身,繼而影響思維在低維的投影:對話。

讓我們從一個例子開始:假設(shè)現(xiàn)在咱們一起來做一個不那么智障的助理。我們希望這個助理能夠推薦餐廳酒吧什么的,來應(yīng)付下面這樣的需求:


當(dāng)用戶說:“我想喝點東西”的時候,系統(tǒng)該怎么回答這句話?經(jīng)過Part 2,我相信大家都了解,我們可以把它訓(xùn)練成為一個意圖“找喝東西的店”,然后把周圍的店檢索出來,然后回復(fù)這句話給他:“在你附近找到這些選擇”。

恭喜,咱們已經(jīng)達到Siri的水平啦!

但是,剛剛我們開頭就說了,要做不那么智障的助理。這個“喝東西的店”是奶茶點還是咖啡店?還是全部都給他?

嗯,這就涉及到了推理。我們來手動模擬一個。假設(shè)我們有用戶的Profile數(shù)據(jù),把這個用上:如果他的偏好中最愛的飲品是咖啡,就給他推薦咖啡店。?

這樣一來,我們就可以更“個性化”的給他回復(fù)了:“在你附近找到這些咖啡店”。

這個時候,咱們的AI已經(jīng)達到了不少“智能系統(tǒng)”最喜歡鼓吹的個性化概念——“千人千面”啦!

然后我們來看這個概念有多蠢。

一個人喜歡喝咖啡,那么他一輩子的任意時候就都要喝咖啡么?人是怎么處理這個問題的呢?如果用戶是在下午1點這么問,這么回他還好;如果是在晚上11點呢?我們還要給他推薦咖啡店么?還是應(yīng)該給他推薦一個酒吧?

或者,除此之外,如果今天是他的生日,那么我們是不是該給他點不同的東西?或者,今天是圣誕節(jié),該不該給他推薦熱巧克力?

你看,時間是一個維度,在這個維度上的不同值都在影響給用戶回復(fù)什么不同的話。?

時間和用戶的Profile不同的是:

1. 時間這個維度上的值有無限多;

2. 每個刻度還都不一樣。比如雖然生日是同一個日期,但是過生日的次數(shù)卻不重復(fù);


除了時間這個維度以外,還有空間。

于是我們把空間這個維度疊加(到時間)上去。你會發(fā)現(xiàn),如果用戶在周末的家里問這個問題(可能想叫奶茶外賣到家?),和他在上班時間的辦公室里問這個問題(可能想出去走走換換思路),咱們給他的回復(fù)也應(yīng)該不同。

光是時空這兩個維度,就有無窮多的組合,用"if then"的邏輯也沒法全部手動寫完。我們造機器人的工具,到這個需求,就開始捉襟見肘了。

何況時間和空間,只是世界模型當(dāng)中最顯而易見的兩個維度。還有更多的,更抽象的維度存在,并且直接影響與用戶的對話。比如,人物之間的關(guān)系;人物的經(jīng)歷;天氣的變化;人和地理位置的關(guān)系(是經(jīng)常來出差、是當(dāng)?shù)赝林?、是第一次來旅游)等等等等。咱們聊到這里,感覺還在聊對話系統(tǒng)么?是不是感覺有點像在聊推薦系統(tǒng)?

要想效果更好,這些維度的因素都要疊加在一起進行因果推理,然后把結(jié)果給用戶。

至此,影響人們對話的,光是信息(還不含推理)至少就有這三部分:明文(含上下文)+ 場景模型(Context)+ 世界模型。

普通人都能毫不費力地完成這個工作。但是深度學(xué)習(xí)只能處理基于明文的信息。對于場景模型和世界模型的感知、生成、基于模型的推理,深度學(xué)習(xí)統(tǒng)統(tǒng)無能為力。

這就是為什么現(xiàn)在炙手可熱的深度學(xué)習(xí)無法實現(xiàn)真正的智能(AGI)的本質(zhì)原因:不能進行因果推理。

根據(jù)世界模型進行推理的效果,不僅僅體現(xiàn)上在對話上,還能應(yīng)用在所有現(xiàn)在成為AI的項目上,比如自動駕駛。

經(jīng)過大量訓(xùn)練的自動駕駛汽車,在遇到偶發(fā)狀況時,就沒有足夠的訓(xùn)練素材了。比如,突然出現(xiàn)在路上的嬰兒車和突然滾到路上的垃圾桶,都會被視為障礙物,但是剎不住車的情況下,一定要撞一個的時候,撞哪一個?

又比如,對侯世達(Douglas Hofstardler )而言,“駕駛”意味著當(dāng)要趕著去一個地方的時候,要選擇超速還是不超速;要從堵車的高速下來,還是在高速上慢慢跟著車流走...這些決策都是駕駛的一部分。他說:“世界上各方面的事情都在影響著“駕駛”這件事的本質(zhì)?”。

?人腦有兩套系統(tǒng):系統(tǒng)1?系統(tǒng)2?

關(guān)于 “系統(tǒng)1和系統(tǒng)2”的詳情,請閱讀 Thinking, Fast and Slow, by Daniel Kahneman,一本非常好的書,對人的認知工作是如何展開的進行了深入的分析。在這兒,我給還不了解的朋友介紹一下,以輔助本文前后的觀點。

心理學(xué)家認為,人思考和認知工作分成了兩個系統(tǒng)來處理:

系統(tǒng)1是快思考:無意識、快速、不怎么費腦力、無需推理

系統(tǒng)2是慢思考:需要調(diào)動注意力、過程更慢、費腦力、需要推理

系統(tǒng)1先上,遇到搞不定的事情,系統(tǒng)2會出面解決。

系統(tǒng)1做的事情包括: 判斷兩個物體的遠近、追溯聲音的來源、完形填空 ( "我愛北京天安? ? ?" )等等。

順帶一提,下象棋的時候,一眼看出這是一步好棋,這個行為也是系統(tǒng)1實現(xiàn)的——前提是你是一位優(yōu)秀的玩家。

對于中國學(xué)生而言,你突然問他:“7乘以7”,他會不假思索的說:“49!”這是系統(tǒng)1在工作,因為我們在小學(xué)都會背99乘法表。這個49并非來自計算結(jié)果,而是背下來的(反復(fù)重復(fù))。

相應(yīng)的,如果你問:“3287 x 2234等于多少?”,這個時候人就需要調(diào)用世界模型中的乘法規(guī)則,加以應(yīng)用(計算)。這就是系統(tǒng)2的工作。

另外,在系統(tǒng)1所設(shè)定的世界里,貓不會像狗一樣汪汪叫。若事物違反了系統(tǒng)1所設(shè)定的世界模型,系統(tǒng)2也會被激活。


在語言方面,Yoshua Bengio 認為系統(tǒng)1不做與語言有關(guān)的工作;系統(tǒng)2才負責(zé)語言工作。對于深度學(xué)習(xí)而言,它更適合去完成系統(tǒng)1的工作,實際上它根本沒有系統(tǒng)2的功能。

關(guān)于這兩個系統(tǒng),值得一提的是,人是可以通過訓(xùn)練,把部分系統(tǒng)2才能做的事情,變成系統(tǒng)1來完成的。比如中國學(xué)生得經(jīng)過“痛苦的記憶過程”才能熟練掌握99乘法表,而不是隨著出生到長大的自然經(jīng)驗,慢慢學(xué)會的。

但是這里有2個有意思的特征:

1. 變成系統(tǒng)1來處理問題的時候,可以節(jié)約能量。人們偏向相信自己的經(jīng)驗,是因為腦力對能量的消耗很大,這是一個節(jié)能的做法。

2. 變成系統(tǒng)1的時候,會犧牲辯證能力,因為系統(tǒng)1對于邏輯相關(guān)的問題一無所知。“我做這個事情已經(jīng)幾十年了”這種經(jīng)驗主義思維就是典型案例。

想想自己長期積累的案例是如何在影響自己做判斷的?

?單靠深度學(xué)習(xí)搞不定語言,現(xiàn)在不行,將來也不行?

在人工智能行業(yè)里,你經(jīng)常會聽到有人這么說 “盡管當(dāng)前技術(shù)還實現(xiàn)不了理想中的人工智能,但是技術(shù)是會不斷演進的,隨著數(shù)據(jù)積累的越來越多,終將會實現(xiàn)讓人滿意的人工智能?!?/p>

如果這個說法,是指寄希望于僅靠深度學(xué)習(xí),不斷積累數(shù)據(jù)量,就能翻盤——那就大錯特錯了。

無論你怎么優(yōu)化“馬車”的核心技術(shù)(比如更壯、更多的馬),都無法以此造出汽車(下圖右)。?

對于大眾而言,技術(shù)的可演進性,是以宏觀的視角看人類和技術(shù)的關(guān)系。但是發(fā)動機的演化和馬車的關(guān)鍵技術(shù)沒有半點關(guān)系。

深度學(xué)習(xí)領(lǐng)域的3大牛,都認為單靠深度學(xué)習(xí)這條路(不能最終通向AGI)。感興趣的朋友可以沿著這個方向去研究:?

Geoffrey Hinton的懷疑:“我的觀點是都扔掉重來吧”

Yoshua Bengio的觀點:“如果你對于這個每天都在接觸的世界,有一個好的因果模型,你甚至可以對不熟悉的情況進行抽象。這很關(guān)鍵......機器不能,因為機器沒有這些因果模型。我們可以手工制作這些模型,但是這遠不足夠。我們需要能發(fā)現(xiàn)因果模型的機器。”

Yann LeCun的觀點:“A learning predictive world model is what we’re missing today, and in my opinion is the biggest obstacle to significant progress in AI.”

至于深度學(xué)習(xí)在將來真正的智能上扮演的角色,在這兒我引用Gary Marcus的說法:“I don’t think that deep learning won’t play a role in natural understanding, only that deep learning can’t succeed on its own.”


?解釋人工智障產(chǎn)品?

現(xiàn)在,我們了解了人們對話的本質(zhì)是思維的交換,而遠不只是明文上的識別和基于識別的回復(fù)。而當(dāng)前的人工智能產(chǎn)品則完全無法實現(xiàn)這個效果。那么當(dāng)用戶帶著人類的世界模型和推理能力來跟機器,用自然語言交互時,就很容易看到破綻。

Sophia是一個技術(shù)上的騙局(凡是鼓吹Sophia是真AI的,要么是不懂,要么是忽悠);

現(xiàn)在的AI,都不會有真正的智能(推理能力什么的不存在的,包括Alpha go在內(nèi));

只要是深度學(xué)習(xí)還是主流,就不用擔(dān)心AI統(tǒng)治人類;

對話產(chǎn)品感覺用起來智障,都是因為想跳過思維,直接模擬對話(而現(xiàn)在也只能這樣);

“用的越多,數(shù)據(jù)越多,智能會越強,產(chǎn)品就會越好,使用就會越多”——對于任務(wù)類對話產(chǎn)品,這是一個看上去很酷,實際上不靠譜的觀點;

一個AI agent,能對話多少輪,毫無意義;

to C的助理產(chǎn)品做不好,是因為解決不了“如何獲得用戶的世界模型數(shù)據(jù),并加以利用”這個問題;

to B的對話智能公司為何很難規(guī)?;??(因為場景模型是手動生成的)

先有智能,后有語言:要做到真正意義上的自然語言對話,至少要實現(xiàn)基于常識和世界模型的推理能力。而這一點如果能實現(xiàn),那么我們作為人類,就可能真的需要開始擔(dān)心前文提到的智能了。

不要用NLP評價一個對話智能產(chǎn)品:年底了,有些媒體開始出各種AI公司榜單,其中有不少把做對話的公司分在NLP下面。這就好比,不要用觸摸屏來衡量一款智能手機。在這兒我不是說觸摸屏或者NLP不重要(Essential),反而因為太重要了,這個環(huán)節(jié)成為了每一家的標(biāo)配,以至于在這方面基本已經(jīng)做到頭了,差異不過1%。

對于一個對話類產(chǎn)品而言,NLU盡管重要,但只應(yīng)占個整體配件的5-10%左右。更進一步來說,甚至意圖識別和實體提取的部分用大廠的,產(chǎn)品間差異也遠小于對話管理部分的差距。真正決定產(chǎn)品的是剩下的90%的系統(tǒng)。

到此,是不是有一種絕望的感覺?這些學(xué)界和行業(yè)的大牛都沒有解決方案,或者說連有把握的思路都沒有。是不是做對話智能這類的產(chǎn)品就沒戲了?上限就是這樣了么?

不是。對于一項技術(shù)而言,可能確實觸底了;但是對于應(yīng)用和產(chǎn)品設(shè)計而言,并不是由一個技術(shù)決定的,而是很多技術(shù)的結(jié)合,這里還有很大的空間。

作為產(chǎn)品經(jīng)理,讓我來換一個角度。我們來研究一下,既然手中的工具是這些,我們能用他們來做點什么?



關(guān)于作者

作者Mingke,正在從事對話智能方面的創(chuàng)業(yè),為世界一百強企業(yè)提供對話智能應(yīng)用的咨詢和解決方案。上次《為什么現(xiàn)在的人工智能助理都像人工智障》一文發(fā)出來之后,認識結(jié)交了不少行業(yè)內(nèi)的朋友。希望這次,把過去一段時間的思考與大家分享,能給行業(yè)內(nèi)的新老朋友們一些啟發(fā),有興趣溝通和碰撞的也歡迎與我聯(lián)系。

歡迎行業(yè)里的新老朋友勾搭吐槽,微信:mingke27 (請注明稱呼+所在機構(gòu))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容