Gemini 和 Google Ai Studio 是什麼?

Gemini 是由 Google DeepMind 開發的多模態大語言模型家族,是 LaMDA 和 PaLM 2 的進化。DeepMind 前身是位於倫敦的人工智慧公司,於 2014 被 Google 收購,而終於在今年與 Google Brain 團隊整合為 Google DeepMind 共同專注於開發人工智慧。

「Google AI Studio 是免付費的網頁型開發者工具,只要使用 API 金鑰,就能快速建立原型並發布應用程式。到了需要全代管 AI 平台的時候,則可以選擇使用 Vertex AI 對 Gemini 進行自訂設定,可以全權掌控資料,同時利用 Google Cloud 提供的額外功能,來維護企業的安全、保全、隱私、資料管理,並且符合規定。」-節錄至 Taiwan google blog

Vertex AI 主要是給企業用戶使用,而 Google AI Studio 則讓一般開發者可以以瀏覽器使用 Generative AI Gemini API,只要透過 Google 帳號就能登入使用,還可以選擇要使用的模型,包括 Gemini Pro 和 Gemini Pro Vision,Gemini Pro Vision 可以辨識圖像,此服務目前完全免費(免費額度為每分鐘可以輸入 60 個請求)

Google AI Studio 也提供各種 SDK,目前支援 Python、Android(Kotlin)、Node.js、Swift 及JavaScript 等程式語言,可以簡單的取得 SDK 完成 API 串接。

Google Ai Studio

Google Ai Studio 的操作方式

主要 Prompt 類型有三種,可以在左側欄位 Create New 當中作選擇,中間欄位則是主要的 Input & Ai Generate Output,右側欄位比較特別的是「Temperature」,數值範圍為 0-1,代表了語言模型回覆的創意程度。

Google Ai Studio

Gemini Pro Vision 匯入圖片輸出文字

選擇 Gemini Pro Vision 這個模型可以辨識圖片,圖片可以直接貼到 Prompt 輸入框非常方便!貼上後可以針對圖片提出問題,以下以請 Gemini 幫我做網頁的切版,我也將生成的 html & css 實際成果分享在下方。

Google Ai Studio
Google Ai Studio

Google Ai Studio Prompt 三種類型

1. Free Prompt

類似 ChatGPT 自由的輸入 Prompt 內容,比較特別的是可以選擇特定的字詞轉為變數,針對變數輸入不一樣的值,讓 Ai 同時 Generate 不同的結果。

Ex. 請使用 OOO 語言產生一段加總的函式
=> 獲得不同程式語言所撰寫的函式

Google Ai Studio

2. Structured Prompt

可以自行輸入 500 筆 examples 作爲 prompt 樣本,接著輸入真正要的 input,Ai 會試著照你提供的 examples 的結構去 generate output,可以確保取得的回覆是自己所預期的格式,這點倒是完全可以避免 ChatGPT 廢話過多的狀況 XD

Ex. 輸入的 Prompt examples:狗狗的叫聲是汪,貓咪的叫聲是喵
=> Input:鴨 Output:鴨的叫聲是呱呱呱

Google Ai Studio

3. Chat Prompt

最後 Chat Prompt 有點類似主動給 Chatbot 一個人設,也給他回覆的範例,當然範例也可以直接用 Ai Generate,一但給定人設之後,可以在右側欄位輸入問題,看看回覆是否符合給予的人設。覺得這個模式很適合用在 FAQ 的應用場景。

Google Ai Studio

以上就是簡單的 Google Ai Studio 基礎功能分享,大家也趕快去玩玩看
日後若有真的實際運用在專案裡再跟大家分享~~
若有什麼我沒有寫到的運用,也很歡迎大家留言告訴我 😍


💬 參考資料:
隆重推出 Gemini:我們最強大的 AI 模型