【Brian AI】AI 時代的新職業:Prompt Engineer 提示工程師究竟是甚麼?

人工智能的概念已被大眾所知。然而,過去許多模型往往都不是一般用家能直接使用的。隨著去年 11 月 ChatGPT 的公佈以及繪圖軟件 (DALL・E, micmic 等)的興起,普羅大眾現已可以簡單地使用強大的人工智慧模型。許多人認為傳統行業即將被 AI 取代,如記者、律師、程式編寫員都察覺到它的威脅。然而,從積極的角度看, AI 的出現也創造了很多新的職業機會。本文將介紹一個新興職業:提示工程師 (Prompt Engineer)  。儘管職業名稱是「工程師」,但入行卻不需要掌握數學和編程知識,相反需要出色的文字和溝通能力。

甚麼是提示工程師?

今天我會用 DALL・E 這個圖片生成AI作示範。它的用法十分簡單,只需要打出一段文字, AI  就會根據文字內容自動生成圖片。 例如,如果我想請 AI 設計一張科學狗的頭像圖片,我可以輸入「science 99」,AI 就會在下方產生四張圖片供您選擇。以下是其中一張:

你看到後會滿頭問號, 因為這幅圖片和我們的想像有很大分別。這是因為我們輸入的文字很短,沒有提供詳細描述,在這些部份, AI 有很大空間自由發展。 例如 AI 並不知道這個是一個科學資訊網站, 不知道這個網站是在香港的,更加不知道我們以「9」字作為廣東話的同音字來表達「狗」。

如果要生產出切題既圖片,便需要在輸入文字的時候仔細描述。提示工程師的工作便是負責把這段文字寫成 AI 最容易理解的格式,讓 AI 能夠盡量發揮它的潛能。用演奏樂器作為比喻,AI模型就好比一部精心打造的鋼琴,普通人當然可以在上面敲出幾個音符,但要奏出美妙動人的樂章,必須由傑出的演奏家彈奏,而提示工程師就是這位演奏家。標題的圖片便是經過簡單的提示工程出來的結果——在提示中加入  Victoria Harbour, test tubes, microscopecomputer 等字眼,令 AI 更具體明白我們想要的效果。

淺談提示工程

世界各地的研究團隊都會在學術文章發表自己提示工程的研究成果, OpenAI 的 DALL・E 也不例外。我們現在來看看這一片由芬蘭一所著名大學發表的研究報告 [1] 。研究人員用了三個月時間觀察網民使用 AI 的習慣,歸納出一些法則,當中有六大個詞組是很多人都會放在 AI 的指示中:

  • Subjects terms 主體:圖畫的主體,例如一隻小狗
  • Style modifiers 風格:圖畫的風格,例如水彩畫、油畫等
  • Image prompts 圖片:一些範例圖片的網址
  • Quality boosters 質素:增強圖片風格的詞語,例如 “highly detailed, “AWESOME”, “#wow”, “eclectic, “fantastic”, “beautiful”, “epic”, “rendering” 等等
  • Magic terms 魔法詞語:很難解釋為麼有用,但能有效地提高圖片的質素: 例如 “control the soul”, “feel the sound”

此外,報告建議用以下的這一個格式作為範本,描述你想 AI 所畫的圖畫:

[Medium][Subject][Artist(s)][Details][Image repository support]

  • Medium: 畫作的材質,例如油畫,水彩畫等等
  • Subject: 你想畫的主角,例如小狗,電腦等等
  • Artist: 你想模仿的畫家名稱(如有)
  • Details: 其他你想加在畫作中的東西。
  • Image repository support: 著名圖庫的名字,例如 “trending on artstation”

我在設計標題圖片的時候,便加上了 “Japanese Anime style”, “cute, joyful puppy” 的形容詞在 AI 的指示中。其他的部份就要留待讀者們自由發揮了。一個好的提示 (Prompt) 是很寶貴的知識財產,現時已有網站專門給人販賣創作好的提示。

人工智慧創造的科學狗頭像

提示工程的極致,畫出來的畫作甚至乎能贏得大型的藝術比賽 [2] 。下面的這幅畫由 Jason M. Allen 用 Midjourney(另一個人工智能繪圖模型) 來創作,贏了剛剛的 Colorado State Fair 周年藝術比賽。

圖片取自 [2]

甚麼公司會聘請提示工程師?

提示工程師在了解業務的需要之後,把要求以特定的形式輸入至 AI 系統,便能一次過使 AI 製作出高質素的作品。 這樣也有助公司減少成本。以 DALL・E 為例,生成每張圖片的收費是 $0.02 美元,如果由沒有經驗的人使用 AI ,不知道需要浪費多少金錢才能生成出符合業務要求的圖片。 $0.02 美元乍看之下是一個小數目,但是需要 AI 協助的多數都是高重覆性的工作,積少成多之下很容易便成為一筆大數目。

製作 AI 模型的公司都會聘請提示工程師測試他們的系統,畢竟只有他們才能充分發揮 AI 模型的實力。最近 Anthropic 便貼出了一則招聘廣告 [3] ,年薪更可達 25 至 33.5 萬美元(折合約 200 至 260 萬港元)!

未來一些廣告文案的製作公司或設計公司,也可能需要提示工程師的協助,因為他們常常都需要在短時間內生產圖片解釋他們的設計理念。我相信 AI 在我們的工作流程已經變得越來越重要,提示工程師的需求也會越來越大。十年後,當我們看一些不懂提示工程的人,可能感覺就像現在有人告訴我們不懂得 Google 資訊一樣。

References

  1. Oppenlaender, J., 2022, A Taxonomy of Prompt Modifiers for Text-To-Image Generation, arXiv e-print, Retrieved from https://arxiv.org/pdf/2204.13988.pdf
  2. Roose, K., 2022, An A.I.-Generated Picture Won an Art Prize. Artists Aren’t Happy, The New York Times, Retrieved from https://www.nytimes.com/2022/09/02/technology/ai-artificial-intelligence-artists.html
  3. Anthropic, 2023, Prompt Engineer and Librarian, Retrieved from https://jobs.lever.co/Anthropic/e3cde481-d446-460f-b576-93cab67bd1ed

Brian AI

Brian 天文物理學出身,研究窺探宇宙奧秘後頓覺忽略身邊的事物。 決心轉為在人工智能工業發展,致力推動各行業的自動化,為人類帶來更有趣的生活。現時在國際諮詢顧問公司的AI部門擔任總監一職。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *