網易首頁 > 網易號 > 正文申請入駐

用Gemini Cli+AI輸入法+Obsidian搭工作流，太絲滑了！

2025-12-10 11:34:25　來源: 蒼何

湖北舉報

分享至

這是蒼何的第 458 篇原創！

大家好，我是愛折騰 Obsidian 的蒼何。

一個月前，我將自己的 Obsidian 工作流分享出來，收到了很多朋友的喜歡。

并因此受到 WPS 邀請去珠海分享了一波 AI 時代的知識管理及 Vibe Coding 實踐。

這一段時間，我又對我的 Obsidian 工作流做了不少的迭代，加了不少的插件，做了不少模板。

同時也在一些流程節點思考用當下比較的 AI 輸入法來融入，并定了一個狠目標：能用嘴噴的地方就不用手。

折騰了一段時間，覺得是時候拿出來和大家做分享了。

先看看我如何結合 Gemini Cli+AI輸入法+Obsidian 來搭工作流，一張制作的信息圖先看看。

先來看一個 Obsidian 中寫作類場景：

再看一個 Obsidian 文件管理和文件格式轉換的常用場景：

當然，遠遠不止這些，這次一共包含以下幾種節點場景優化：

1、用嘴在Obsidian中啟動Gemini Cli
2、查看當前文件夾磁盤占用，并顯示所有Python相關的進程
3、看下當前文件夾有多少張圖片，并做圖片格式轉換
4、視頻格式轉GIF，且控制大小
5、Obsidian寫作：從爆款標題到文案創作到局部優化改寫一整套工作流
7、編程做插件開發場景
8、評論區回復
9、懶人計算器

接下來會依次介紹下各個節點的實踐，會配有視頻演示和我的理解。

文章很干，建議點贊收藏并轉發給需要的朋友，節點中的每個提示詞和 AI 輸入法人設如果需要的話也可評論留言告訴我。

工具選擇

Obsidian 和 Gemini Cli 不用說了，已經是知識管理和內容創作必備的工具了，還不了解的朋友可以翻一翻蒼何之前的文章。

AI 輸入法上，我做了不少的調研和測試，發現世面上目前主要有 2 類 AI 輸入法，一類是基于大模型能力做的實時翻譯，這類主打的是一個低延遲和本地化數據隱私。

但功能層面比較單一，沒有過多的 AI Agent 操作，復雜場景下無法滿足。

另一類就是就是功能更豐富的 AI 輸入法產品，能應對復雜場景，做更多的 Agent 操作。

經對比最終選擇的是智譜 AI 輸入法小凹。

在識別度、復雜場景下的優勢比較明顯，最關鍵的是可以按照不同的場景定制風格輸出，這就很滿足我迭代的需求。

Mac 和 Windows 版本都支持，下載地址：https://autoglm.zhipuai.cn/autotyper

記得用我的邀請碼：R8J5QAD2（注冊咱倆都可獲得積分哈哈哈）

進入后就可以設定詞典和人設，滿足不同場景的需求。

你甚至沒法想象，我只用了 16 分鐘就輸出 2.1 萬詞，而這還只是我用來此次創作的小號。不得不說，AI 輸入法真實提效啊。

你可以看到我設定了很多的風格來滿足我工作流中不同節點的需求。

工具就說到這，直接來看工作流吧。

用嘴啟動Gemini Cli

傳統方式是要在 Obsidian 終端手打敲擊命令：gemini。

這個單詞有時候還容易打錯，每次啟動，其實還蠻費勁。

現在，只需按住 fn，直接說：幫我啟動 gemini。智譜 AI 輸入法小凹（以下簡稱小凹）就能自動執行預設指令。

就很絲滑。

終端監控

打開 Gemini Cli，習慣做的事是看下當前倉庫占用情況，以及當前進程。以前還需要先去查下命令，或者讓 Gemini Cli 自主查找執行命令。多了一步。

現在，只需要對著小凹說：

查看當前文件夾磁盤占用，并顯示所有Python相關的進程

可以看到，小凹自動去查找相關命令并給出了指令，而且速度非?？?。

文件管理

在 Obsidian 中可以存放不同文件格式的文件，一多就變得很麻煩，查找整理非常花時間。

現在只需要 AI 輸入法配合 Gemini Cli 就能很快配合解決。

AI 輸入法負責接收語音輸入，并轉為可執行的指令給到 Gemini Cli 自動執行。

比如這個需求就可以直接對小凹說

看下當前文件夾有多少張圖片，并做圖片格式轉換

特別對于公眾號創作來說，有時候需要將視頻轉為 GIF，但圖片又不能過大（最大 10 M），原先過程非常繁瑣，先要去格式轉換的地方先轉換，再去壓縮。

現在通通不用，直接說：

將demo.mp4視頻轉成GIF格式的,只要前3s,且大小控制在10m以內

小凹直接給到完整的 FFmpeg 命令給到 Gemini Cli 精準執行，完成需求。

Obsidian 寫作

無論是記筆記還是內容創作，在 Obsidian 中都是常見場景。

拿公眾號寫作來說，從標題到文章都可以借助該工作流。

特別是對句子進行局部優化調整以及內容格式（比如轉圖表）、風格化輸出非常有用。

這里其實還有蠻多的場景可以發揮的，不過受限于當前限制，對于公眾號創作，還無法接入圖片，現在還不支持類似工具調用能力。

要是以后支持，別提能有多強，我隨時跟進者，看看啥時候能支持，到時候給大家匯報。

轉小紅書文案

這個其實我還特意開發過一款插件，現在我用新的工作流來做了嘗試，只需要說：

轉成小紅書文案

但目前的轉換，并不能全文做轉換，估計是受限于整個的輸入長度限制吧。

編程做插件開發場景

之前分享過在 Obsidian 中配合 Gemini Cli 做插件開發，非常舒服。

現在有了 AI 輸入法，變得更絲滑了，一些原本需要手動敲擊命令的場景也直接口噴就好了。

評論區回復

我有很大一部分時間是用來回復粉絲留言，但經常時間不夠用，手動敲擊又太慢，導致回復不及時，等過去了好幾天，又都沒回復。

我一度感到很痛苦。

所以讓I輸入法來幫我做一些回復，我覺得挺棒的。

計算器

對于一些簡單的計算場景，腦子又算不明白，然后每次要吭哧吭哧打開計算器，比較麻煩。

現在只需要說一聲，計算結果就出來，隨用隨丟。

非常方便和絲滑。

智譜AI輸入法很好用，我看他們也發布并開源了GLM-ASR系列語音識別模型，而智譜AI輸入法就是基于該模型打造的。

官號上截一張開源的 GLM-ASR-Nano-2512模型，可以看到 1.5B 參數的端側模型，卻取得了當前開源語音識別方向的SOTA表現，這下好了，可以預見將會有更多基于此的AI應用出來了。

說實話，折騰了這么多工具。

我發現最極致的效率，往往是返璞歸真。

沒有復雜的鼠標點擊，沒有繁瑣的窗口切換。

只有一個想法，一句耳語，一個結果。

即使在這個 AI 狂奔的時代。

最珍貴的，依然是你腦海中那一閃而過的火花。

只要那朵火花還在。

我們就永遠年輕，永遠熱淚盈眶。

這一次，換個姿勢。

重新定義你的工作流。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.