【Everest. 議事之峰】ChatGPT到底是甚麼?

你有沒有聽説過 ChatGPT?這個由微軟部份控制的 OpenAI 研究所開發的「人工智能」最近成為了科技新聞頭條,重引發各工種會否被機器取代的討論。但它到底是什麼,它又能夠怎樣提升人類的工作效率甚至取代人類呢?本文為你一一道來。

ChatGPT 的運作原理?

ChatGPT 跟人類的文字對答自然流利、恍如神技,它能夠寫詩改正編程錯誤、輔助大學課堂探討哲學、甚至以「1940 年代(美國)幫派電影對白的風格」解釋電腦演算法的複雜度。但歸根究底它只是一個語言模型(language model)。粗略來説ChatGPT 拿到輸入文字後,它會輸出統計學上接下來最「應該」出現的文字,就是這麼簡單。

慢着!根據統計學無腦輸出的句子,為什麼可以跟人類説話一樣自然通暢呢?以下總結自 OpenAI 研究所的介紹,是 ChatGPT 「成型」的過程。

首先,研究員們透過一套人類對話紀錄,微調了上一年面世的 GPT 3.5 語言模型。這樣做是因為 GPT 3.5 作為多用途通用的語言模型表現不俗,畢竟它的訓練數據包含了維基百科、至少數十萬本書籍以及多年的「全」互聯網紀錄;但它依然不擅長專門應付有來有往的擬人對話,估需要微調。換言之,讓 GPT 3.5謹記從海量文字提煉出的語感的同時、學會按照對話的上一節輸出下一節。

第二步,GPT 3.5 微調過後,研究人員要求它按照文字提示生成多個回覆,並人手標籤了回覆的質素,當中有好有壞。這些標籤數據被用來訓練獎勵模型 reward model,也就是一個用來評價 GPT 3.5 輸出質素的「小」人工智能。質素越好,獎勵越大。

最後,研究人員放手讓 GPT 3.5 不斷生成新的文字、並按照獎勵模型自動調整輸出,直到回覆拿到的獎勵見頂;ChatGPT 就這樣成型了。

總括來説,本來就有一個滿腹墨水、擅長延續句子和段落的人工智能 GPT 3.5;教會它像人那樣説話後,我們就得到了 ChatGPT。

現時有哪些使用場景(不)適用 ChatGPT?

截至二月二十八日,公眾唯一使用 ChatGPT 的方法是向 OpenAI 研究所提出申請,所有跟 ChatGPT的文字互動都會成為進一步訓練它的素材。畢竟 ChatGPT將會成為微軟 Office 辦公軟件和 Bing 搜索引擎舉足輕重的一部份,微軟自然不介意透過公眾零成本的幫忙去改進它。

但上述的使用模式讓商業公司卻步,畢竟誰都不想拱手轉讓機密給潛在的競爭對手。 筆者作為美國科技行業一員,聽聞有些已經在使用微軟雲端服務的公司希望架設自己的專用版本,並將它加入到雲端服務合約內,以確保 ChatGPT 像熟悉的其他服務同樣保密。其他公司就索性先禁止員工訪問 ChatGPT 的網站、以後再作打算。

今年三月一日,OpenAI 宣佈開放付費使用 ChatGPT,每生成 750 英文字大約收費 0.002 美金(0.016港幣),收費用家跟 ChatGPT 的互動不留紀錄。這樣的使用模式不單便宜,還對商業應用非常友好。

除卻泄密的顧慮,ChatGPT 已經在幫助數據科學家和軟件工程師起草源代碼、節省了他們 尋找並借鑑其他人例子所需的時間。根據《華爾街日報》報道,網絡課程平台Coursera 的CEO 正在使用 ChatGPT 起草電郵;一家開發煙霧探測器的澳洲小型企業發現, ChatGPT 生成的技術方案跟自己花時間收集訊息後得出的結論大同小異,以後可能不再需要分配有限的人力去搜索資料。

類似的例子多不勝數,共通點是使用 ChatGPT 搜索並總結複雜而不常用的訊息,又或者把它當作一個善解人意又滿腹墨水的寫作夥伴。這些都是常見的白領或秘書工作職責,現在某程度上可以被機器取代。

ChatGPT 説話頭頭是道,但它真的可信嗎?

《華爾街日報》説得對:ChatGPT 的確好使好用,但前提是用家對感興趣的領域有深刻的認識。

畢竟,ChatGPT的訓練過程並沒有為任何具體的提問欽定回覆,例如「2+2 等於什麼?」就應該回答「4」之類。ChatGPT 是透過跟人類訓練員和自己不斷的互動、加上從海量文字提煉出來的語感,學會生成讓人類覺得滿意的字句。但語言能力爆燈的它從來沒有學會「常識」。

承上例子:如果 ChatGPT 回答 「2+2 = 4」,那不是因為它懂得算數,而是因為這是人類文字紀錄中最常見的答案。正如眾多美國網友們發現, ChatGPT 回答簡單數學問題時會經常犯錯,正正顯示了它作為語言模型而非擬人通用智能的本質。

換言之,ChatGPT 擅長頭頭是道地胡言亂語。科技人員常用的論壇 Stack Overflow 索性暫時禁止了使用 ChatGPT 覆 post,因為太多人「9up 當秘笈」——他們用 ChatGPT 回答其他人的編程問題以換取論壇福利,但回覆內容細看下錯漏百出,嚴重影響討論質量。

如果缺乏感興趣領域的常識儲備,用 ChatGPT 來搜索資訊時要謹慎!

ChatGPT 是 Generative AI 潮流的一部份

ChatGPT 最近搶盡科技新聞風頭,但它只是近兩年生成式人工智能 Generative AI潮流的一部份。所謂的 Generative AI 可以根據文字提示生成多媒體內容,當中以文字和圖片的相關技術最為成熟;例如《科學狗》這篇文章可愛的封面圖片,就是按照 “” 的文字由 DALLE 生成的。

隨着 Generative AI 面世,公眾、法律和倫理又一次受到科技發明的衝擊:不但有些工種更容易被取代了, 騙子更已經開始利用 ChatGPT 扮作擅長聊天的網戀對象;多個藝術家要狀告 generative AI 開發者,因為眾多用家付費利用相關工具生成他風格的作品,而他卻一分錢沒有收到 …

議論紛紛之際,ChatGPT 以至Generative AI 在來年會怎樣改變工作和創作模式,讓我們拭目以待。

作者 Facebook 專頁

議事之峰

美國矽谷打工仔|香港製造,四海為家|Physics PhD, Computer Science MS|

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *