爆火的ChatGPT,先顛覆誰?

新上線的ChatGPT迅速成為了現象級的AI應用。它代表了AI技術怎樣的飛躍進步?它的出現又將顛覆現有的哪些應用?本文以ChatGPT實際使用案例詳細分析了這款應用的技術路線,以及它在資訊搜尋可能引發的顛覆性影響。希望能給你帶來啟發。

爆火的ChatGPT,先顛覆誰?

這兩天,新上線的ChatGPT實在是太火了!首富馬斯克一馬當先,帶著大家玩得不亦樂乎,看起來,人工智慧的奇點就要到來了!沒玩過的朋友,我也不多作介紹了,自行搜尋即可。

爆火的ChatGPT,先顛覆誰?

作為一名二手人工智慧從業者,好多人催我寫寫,人類是不是懸了?當然,人家原始碼我沒地看去,看了沒人給講也是一頭霧水,外面那些資訊,我看也半真半假。

所以,咱們也不講什麼技術框架,就從實際的使用案例來看看,這款現象級的AI應用,採用的是什麼樣的技術路線,能顛覆現有的哪些應用。

篇幅有限,今天只聊以下幾個問題:

這次的ChatGPT,為啥一下子這麼猛? 這傢伙準備先顛覆誰,是搜尋引擎麼? AI關底的圖靈測試,馬上要被KO了麼?

一、ChatGPT這次為啥這麼猛?

與其前一代相比,ChatGPT的效果太驚豔了!大家體會最深的一點,是機器人說的“像人話”了。這個像人話,有兩層意思,首先是對一些知識性內容的回答準確率大大提升,這個例子就太多了,咱們隨便貼兩條:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

您看這專業程度,至少比問我靠譜!它反映了什麼技術進展呢?

自然語言處理的大模型,一直有個問題:如果完全無監督訓練,無法甄別語料的真假和質量;這次ChatGPT從回答質量上有質變,應該是對某些高質量內容做了加權,採用了類似有監督訓練的方法。從結果上來看,是相當成功的。

最讓我感到驚訝的,是ChatGPT這次在倫理方面給出了諸多令人稱讚的限制,不用說,這肯定也得有點監督。除了大家熟悉的“未來預測類問題不作答”以外,下面這兩個例子的對比,也相當出彩:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

除了內容,ChatGPT回答的條理性和語言流暢度也特別好。基本上會把各方面的資訊綜合成一二三點的模板,頗有點領導講話的派頭。因此,我認為在語言生成的結構上,也應該是特意選擇了一些高質量的嚴肅帖子,同樣採用某種程度的有監督學習。

所以您也能看出來,它說話老是脖子衝南臉衝北的老幹體,一點兒也不像在論壇裡混出來的語言風格。

後來有訊息說,ChatGPT這回採用了強化學習的方案,而強化的具體做法,就是找幾個人盯著結果標註,這本質上跟有監督意思也差不多。

二、ChatGPT將首先顛覆誰?

那麼,ChatGPT是不是能夠如很多人所期盼的那樣,成為搜尋引擎的殺手呢?

熟悉搜尋的朋友應該瞭解,搜尋查詢分為兩類:資訊型搜尋(Informational search)和瀏覽型搜尋(Navigational search),咱們分別來看看。

資訊型搜尋,就是要找某個具體的資訊或知識,要求當然就是準確、清晰。從清晰性來說,ChatGPT給的這種結構性呈現,比傳統搜尋引擎強多了!可是從準確性來說,坦率地說,目前還差點兒,經常會有些似是而非回答,關鍵是——人家還倍兒自信:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

特別是中間那個,給我氣樂了:要這麼找富婆,恐怕活不過正月十五!

再來說說瀏覽型搜尋,說白了就是使用者給個關鍵詞用搜搜引擎幫忙逛街呢,這時候不要求資訊每條都準確,但是全面性和實時性很重要。

拿實時性來說,這個模型目前還是做不到準實時更新的,並且可能因為訓練成本相當高,目前其資訊的橫截面,應該還停留在去年的《紐約時報》。

從語言相關的資訊覆蓋度來看,ChatGPT說只有英文語料,中文的問答都是透過機器翻譯轉換成英文進行的。這一點也透過實測得到了驗證,如果要用到只有中文語料中才有的背景知識,它基本上回答得是驢唇不對馬嘴的:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

所以,總結一下:我認為ChatGPT對於搜尋引擎來說,肯定算是一個重要對手了。只不過,由於用單條回答替代了資訊羅列,對準確性的挑戰相當大,目前還是任重道遠;另外,現有的技術棧看起來還不能支援準實時的資訊索引,這對其實用性限制非常大。

(順便說一下,關於秦明夜走瓦礫場的事兒,普遍認為是被宋江所害,然而金聖嘆認為,是花榮出的主意。)

然而,目前的ChatGPT,替代維基百科、Stackoverflow這種非實時專業資訊社群,前景十分光明。這不,Stackoverflow應該已經感到了寒意,開始禁止上傳ChatGPT生成的內容了。

爆火的ChatGPT,先顛覆誰?

當然,對那些情緒性、非專業性的圖文社交網路,比如微博、Twitter,這麼個說話人五人六、又不知疲倦的機器人,很可能給整個社群內容生態帶來鉅變,那就不是顛覆了,有可能直接就給幹挺了!

三、圖靈測試要被通關了麼?

最後,再說說圖靈測試的事兒。

ChatGPT一出,有群眾驚呼:圖靈測試要被終結了!我的看法是,這恐怕還是大大言過其實了。

圖靈測試的標準,其實遠超普通人的想象。要想讓計算機聊一會不露餡兒,關鍵並不在於寫程式碼、問攻略這些專業問題,而在於人類看起來非常淺近的一些日常聊天。

會聊的人,聊一兩句對方就現原形了。比方說,我問ChatGPT的這兩個問題,您看看它怎麼回答的:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

前一個問題,正常的人類回答多半是:“你為啥會關心1。25億這個奇怪的數啊?”

後一個問題,正常的人類回答應該是:“這事兒哪能提醒領導,多尷尬呀!”

看到這兩個問題的回答,我知道,雖然ChatGPT在理解和表達上已經取得了長足的進步,但是一些核心的困難點還是如常,並不容易解決。

當然,也沒必要要求人工智慧一定要透過圖靈測試,即使通過不了,它潛在的商業應用場景也很多了。只是,客觀地說,在目前的技術棧和方法體系下,透過圖靈測試,短期內我認為還看不見希望。

毫無疑問,ChatGPT是人機自然語言互動的一個重要里程碑,並且已經具備了在非實時、專業性知識領域替代原有社群和垂直搜尋的巨大潛力。

當然,客觀地說,就目前的狀態而言,如果說它就能替代搜尋引擎,甚至透過圖靈測試,那無疑是過於樂觀了。

大家不要誤會,我可並不是唱衰ChatGPT!恰恰相反,我覺得這玩意應該早點商用,隨著大量使用者反饋的累積,質量的提高很可能一日千里,適用的場景也越來越多。只是,就像咱們一開始分析的,如果在大規模的使用者反饋中甄別高質量語料,實行有監督的模型進化,可能還真是個挑戰!

當然,作為一個老碼畜,看到ChatGPT寫的哪些程式,我是為很多碼農朋友的未來捏一把汗的。怎麼樣,你的後脊樑發涼了嗎?