前幾天,去 Gemini 玩的時候發現谷歌的 Gem 功能,也就是類似 GPT 的 GPTs 功能更新了。
原來這個東西的能力非常之差,基本就是保存一段提示詞然后給提示詞起個名字的水平。
但是前幾天發現他更新了,現在可以直接幫你生成帶有界面的網頁應用,支持任何圖片或者文檔的輸入,也可以創建網頁輸出結果,而且可以調用所有的谷歌模型,功能相當強大。
![]()
比如我這里就用他創建了一個屏幕使用時間分析工具,上傳你的屏幕使用時間他就會幫你創建一個網頁展示和分析你的屏幕使用時間狀況。
具體包含一個非常漂亮的可視化海報,還有文本分析以及一個基于你屏幕使用時間建議的音頻博客。
![]()
仔細探索了一下發現這個就是將前幾天谷歌發布的類似 N8N 的 Agent 構建工具 Opal 內置到了 Gemini 里面,而且更加易用了,今天大概教一下大家這個如何玩以及 Opal 的進階操作。
首先是入口我們進到 Gemini 里面之后,在側邊欄這里找到“探索Gem”這個選項進去就行。
![]()
進去之后你就看到除了之前的 Gem 界面和設置之外,上面出現了一個全新 Gem 的實驗。
點擊這個“New Gem”就可以進入到新的 Gem 的創建界面。
![]()
進入到創建頁面之后很簡單的一個輸入框,你直接告訴他想要做什么就可以了。
比如我這里讓他基于我上傳的我力量訓練的表格分析我的訓練數據給出對應的報告和建議。
![]()
回車之后他就會開始幫你構建 Gem 應用了,右側會有進度一般很快就能搞定,你就可以在右側測試剛剛生成的 Gem 了。
![]()
這里我要求的是上傳 CSV 文件,但是可以看到新的 Gem 支持的格式非常豐富,包括我們常見文件、youtube視頻、甚至還可以錄制網頁操作視頻和涂鴉。
![]()
我上傳了自己的訓練數據上去測試,可以看到結果相當的詳細,上面是數據看板,中間是各種表格,最下方是對我的訓練建議。
![]()
但這里全是英文,我們還是需要修改一下,這里簡單的修改直接在左側說提示詞就可以,比如我這里讓他將報告結果改為中文,他就開始工作了。
![]()
可以看到這這次的分析結果就全部變成中文了,而且分析的數據相當詳細。
上面是整體的訓練分析,中間是各個部位的數據,接下來是進步的和退步的訓練,最后是個性化數據分析和建議。
![]()
當然你肯定這時候對于結果是有些不滿意的,比如網頁沒有圖片全是字,而且沒有數據可視化看起來非常難以理解等等,你覺得左邊通過提示詞進行修改太煩了。
這時候我們就可以點擊右上角那個“Open Advanced Editor”去到真正的 Opal 界面進行編輯。
![]()
好了,進來之后這個界面看起來是不是很熟悉了,他把用到哪些模型處理數據、生成數據以及輸入、輸出的卡片都給你展示出來了。
![]()
我們講一下這個界面,主要大概是這四個部分組成:
黃色:這里是添加卡片的區域,如果你想要增加工作流中的模型或者輸入項的話可以點擊對應的卡片名稱。
紅色:這里是預覽界面,如果你沒有點擊任何卡片這里就是完整的應用預覽,如果點擊卡片就是卡片預覽。
紫色:這里你依然可以用提示詞對你的應用進行修改,中間的卡片也會同步改變。
綠色:這里是主要的編輯和調整區域,代表著每個數據或者模型處理步驟的卡片,可以進行鏈接。
我這里一般懶得調整卡片設置和鏈接卡片,涉及到模態更改和卡片更改的就會直接在輸入框輸入讓他自己幫我修改工作流。
但是如果是涉及到具體效果的提示詞調整或者模型調整就得點擊卡片在右側進行精細化調整了。
比如這里我就選擇了生成建議這個卡片,之后紅色區域就變成了卡片具體以的設置。
![]()
上面你可以選擇使用什么模型,這里的模型相當詳細,基本可以滿足你的任何信息處理和素材生成要求。
比如文本、音頻、視頻、表格、圖片的輸入處理我們就可以用比較便宜的 Gemini 2.5 Flash 或者直接用頂級的 Gemini 3 Pro 來完成。
圖像輸出的話有只支持文生圖的 Imagen 4 模型,還有支持改圖生圖的 Nano Banana Pro 和 Nano Banana 模型。
視頻生成有 Veo 視頻模型,文本轉語音有 AudioLM 模型,跟離譜的是還有音樂生成模型 Lyria 2。
如果你提示詞跟他說修改他給你把模型選錯了的話,你就可以在這里改回來。
![]()
然后在下方可以調整具體的提示詞,很多時候模型自己寫的提示詞還是有些問題的,你這里可以自己寫,也可以點右側的魔法棒圖標直接跟他說怎么改,這里只會對這里的提示詞生效,不用擔心影響其他地方。
![]()
來看個例子,我前面展示的根據屏幕使用時間生成可視化海報和網頁的案例里面,由于圖片提示詞復雜,他一直寫不好,我就直接在圖片生成卡片里面將提示詞改成我原版的圖片提示詞了,然后效果就對了。
![]()
上面力量分析的卡片比較少,我們直接來看我的屏幕使用時間分析應用的卡片鏈接。
可以看到左側黃色卡片代表輸入,這里就是用戶上傳的屏幕使用時間截圖。
中間部分主要是三個部分素材的生成、屏幕使用時間的文本分析、可視化海報的圖片生成以及口播稿的生成和將口播稿用 AudioLM 生成博客音頻。
最右側的綠色卡片負責將這三部分素材生成一個網頁展示和播放。
![]()
好了具體的創建到這里就差不多了,最后當然是我們的分享功能了。
你可以點擊右上角的 “Share App” 按鈕獲取到應用的分享鏈接,獲得鏈接的用戶直接谷歌登錄就能用,會根據用戶的 Gemini 會員等級扣除他們的模型額度。
![]()
好了今天的 Gemini Gem 和 Opal 教程就到這里結束了。
你可以自己去創建一個玩玩,也可以來玩玩我自己的這個屏幕使用時間分析工具,點擊右上角 Remix 可以直接對我這個應用進行修改和編輯:opal.google/?flow=drive:/1P8cjpYRdou_4DyuBfJU78nrIafcpmdmI&shared&mode=app
谷歌最近在 Gemini 里面的產品整合真的可怕,直接將 AI 實驗室的一堆孵化的產品都整合進來了,NoteBookLM 項目好像也可以直接添加到聊天的上下文里面,只需要將 Gemini 的傻逼交互細節修復一下真就無敵了,不封號、額度高、模型強,我要是 Sam 真慌死了。
如果覺得我的內容對你有幫助的話,可以幫我點個贊或者,也可以轉發給需要的朋友們,感謝。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.