爆火的ChatGPT，先顛覆誰？

新上線的ChatGPT迅速成為了現象級的AI應用。它代表了AI技術怎樣的飛躍進步？它的出現又將顛覆現有的哪些應用？本文以ChatGPT實際使用案例詳細分析了這款應用的技術路線，以及它在資訊搜尋可能引發的顛覆性影響。希望能給你帶來啟發。

這兩天，新上線的ChatGPT實在是太火了！首富馬斯克一馬當先，帶著大家玩得不亦樂乎，看起來，人工智慧的奇點就要到來了！沒玩過的朋友，我也不多作介紹了，自行搜尋即可。

作為一名二手人工智慧從業者，好多人催我寫寫，人類是不是懸了？當然，人家原始碼我沒地看去，看了沒人給講也是一頭霧水，外面那些資訊，我看也半真半假。

所以，咱們也不講什麼技術框架，就從實際的使用案例來看看，這款現象級的AI應用，採用的是什麼樣的技術路線，能顛覆現有的哪些應用。

篇幅有限，今天只聊以下幾個問題：

這次的ChatGPT，為啥一下子這麼猛？這傢伙準備先顛覆誰，是搜尋引擎麼？ AI關底的圖靈測試，馬上要被KO了麼？

一、ChatGPT這次為啥這麼猛？

與其前一代相比，ChatGPT的效果太驚豔了！大家體會最深的一點，是機器人說的“像人話”了。這個像人話，有兩層意思，首先是對一些知識性內容的回答準確率大大提升，這個例子就太多了，咱們隨便貼兩條：

您看這專業程度，至少比問我靠譜！它反映了什麼技術進展呢？

自然語言處理的大模型，一直有個問題：如果完全無監督訓練，無法甄別語料的真假和質量；這次ChatGPT從回答質量上有質變，應該是對某些高質量內容做了加權，採用了類似有監督訓練的方法。從結果上來看，是相當成功的。

最讓我感到驚訝的，是ChatGPT這次在倫理方面給出了諸多令人稱讚的限制，不用說，這肯定也得有點監督。除了大家熟悉的“未來預測類問題不作答”以外，下面這兩個例子的對比，也相當出彩：

除了內容，ChatGPT回答的條理性和語言流暢度也特別好。基本上會把各方面的資訊綜合成一二三點的模板，頗有點領導講話的派頭。因此，我認為在語言生成的結構上，也應該是特意選擇了一些高質量的嚴肅帖子，同樣採用某種程度的有監督學習。

所以您也能看出來，它說話老是脖子衝南臉衝北的老幹體，一點兒也不像在論壇裡混出來的語言風格。

後來有訊息說，ChatGPT這回採用了強化學習的方案，而強化的具體做法，就是找幾個人盯著結果標註，這本質上跟有監督意思也差不多。

二、ChatGPT將首先顛覆誰？

那麼，ChatGPT是不是能夠如很多人所期盼的那樣，成為搜尋引擎的殺手呢？

熟悉搜尋的朋友應該瞭解，搜尋查詢分為兩類：資訊型搜尋（Informational search）和瀏覽型搜尋（Navigational search），咱們分別來看看。

資訊型搜尋，就是要找某個具體的資訊或知識，要求當然就是準確、清晰。從清晰性來說，ChatGPT給的這種結構性呈現，比傳統搜尋引擎強多了！可是從準確性來說，坦率地說，目前還差點兒，經常會有些似是而非回答，關鍵是——人家還倍兒自信：

特別是中間那個，給我氣樂了：要這麼找富婆，恐怕活不過正月十五！

再來說說瀏覽型搜尋，說白了就是使用者給個關鍵詞用搜搜引擎幫忙逛街呢，這時候不要求資訊每條都準確，但是全面性和實時性很重要。

拿實時性來說，這個模型目前還是做不到準實時更新的，並且可能因為訓練成本相當高，目前其資訊的橫截面，應該還停留在去年的《紐約時報》。

從語言相關的資訊覆蓋度來看，ChatGPT說只有英文語料，中文的問答都是透過機器翻譯轉換成英文進行的。這一點也透過實測得到了驗證，如果要用到只有中文語料中才有的背景知識，它基本上回答得是驢唇不對馬嘴的：

所以，總結一下：我認為ChatGPT對於搜尋引擎來說，肯定算是一個重要對手了。只不過，由於用單條回答替代了資訊羅列，對準確性的挑戰相當大，目前還是任重道遠；另外，現有的技術棧看起來還不能支援準實時的資訊索引，這對其實用性限制非常大。

（順便說一下，關於秦明夜走瓦礫場的事兒，普遍認為是被宋江所害，然而金聖嘆認為，是花榮出的主意。）

然而，目前的ChatGPT，替代維基百科、Stackoverflow這種非實時專業資訊社群，前景十分光明。這不，Stackoverflow應該已經感到了寒意，開始禁止上傳ChatGPT生成的內容了。

當然，對那些情緒性、非專業性的圖文社交網路，比如微博、Twitter，這麼個說話人五人六、又不知疲倦的機器人，很可能給整個社群內容生態帶來鉅變，那就不是顛覆了，有可能直接就給幹挺了！

三、圖靈測試要被通關了麼？

最後，再說說圖靈測試的事兒。

ChatGPT一出，有群眾驚呼：圖靈測試要被終結了！我的看法是，這恐怕還是大大言過其實了。

圖靈測試的標準，其實遠超普通人的想象。要想讓計算機聊一會不露餡兒，關鍵並不在於寫程式碼、問攻略這些專業問題，而在於人類看起來非常淺近的一些日常聊天。

會聊的人，聊一兩句對方就現原形了。比方說，我問ChatGPT的這兩個問題，您看看它怎麼回答的：

前一個問題，正常的人類回答多半是：“你為啥會關心1。25億這個奇怪的數啊？”

後一個問題，正常的人類回答應該是：“這事兒哪能提醒領導，多尷尬呀！”

看到這兩個問題的回答，我知道，雖然ChatGPT在理解和表達上已經取得了長足的進步，但是一些核心的困難點還是如常，並不容易解決。

當然，也沒必要要求人工智慧一定要透過圖靈測試，即使通過不了，它潛在的商業應用場景也很多了。只是，客觀地說，在目前的技術棧和方法體系下，透過圖靈測試，短期內我認為還看不見希望。

毫無疑問，ChatGPT是人機自然語言互動的一個重要里程碑，並且已經具備了在非實時、專業性知識領域替代原有社群和垂直搜尋的巨大潛力。

當然，客觀地說，就目前的狀態而言，如果說它就能替代搜尋引擎，甚至透過圖靈測試，那無疑是過於樂觀了。

大家不要誤會，我可並不是唱衰ChatGPT！恰恰相反，我覺得這玩意應該早點商用，隨著大量使用者反饋的累積，質量的提高很可能一日千里，適用的場景也越來越多。只是，就像咱們一開始分析的，如果在大規模的使用者反饋中甄別高質量語料，實行有監督的模型進化，可能還真是個挑戰！

當然，作為一個老碼畜，看到ChatGPT寫的哪些程式，我是為很多碼農朋友的未來捏一把汗的。怎麼樣，你的後脊樑發涼了嗎？