這是蒼何的第 458 篇原創!
大家好,我是愛折騰 Obsidian 的蒼何。
一個月前,我將自己的 Obsidian 工作流分享出來,收到了很多朋友的喜歡。
![]()
并因此受到 WPS 邀請去珠海分享了一波 AI 時代的知識管理及 Vibe Coding 實踐。
![]()
這一段時間,我又對我的 Obsidian 工作流做了不少的迭代,加了不少的插件,做了不少模板。
同時也在一些流程節點思考用當下比較的 AI 輸入法來融入,并定了一個狠目標:能用嘴噴的地方就不用手。
折騰了一段時間,覺得是時候拿出來和大家做分享了。
先看看我如何結合 Gemini Cli+AI輸入法+Obsidian 來搭工作流,一張制作的信息圖先看看。
![]()
先來看一個 Obsidian 中寫作類場景:
再看一個 Obsidian 文件管理和文件格式轉換的常用場景:
當然,遠遠不止這些,這次一共包含以下幾種節點場景優化:
1、用嘴在Obsidian中啟動Gemini Cli
2、查看當前文件夾磁盤占用,并顯示所有Python相關的進程
3、看下當前文件夾有多少張圖片,并做圖片格式轉換
4、視頻格式轉GIF,且控制大小
5、Obsidian寫作:從爆款標題到文案創作到局部優化改寫一整套工作流
7、編程做插件開發場景
8、評論區回復
9、懶人計算器接下來會依次介紹下各個節點的實踐,會配有視頻演示和我的理解。
文章很干,建議點贊收藏并轉發給需要的朋友,節點中的每個提示詞和 AI 輸入法人設如果需要的話也可評論留言告訴我。工具選擇
Obsidian 和 Gemini Cli 不用說了,已經是知識管理和內容創作必備的工具了,還不了解的朋友可以翻一翻蒼何之前的文章。
AI 輸入法上,我做了不少的調研和測試,發現世面上目前主要有 2 類 AI 輸入法,一類是基于大模型能力做的實時翻譯,這類主打的是一個低延遲和本地化數據隱私。
但功能層面比較單一,沒有過多的 AI Agent 操作,復雜場景下無法滿足。
另一類就是就是功能更豐富的 AI 輸入法產品,能應對復雜場景,做更多的 Agent 操作。
經對比最終選擇的是智譜 AI 輸入法小凹。
![]()
在識別度、復雜場景下的優勢比較明顯,最關鍵的是可以按照不同的場景定制風格輸出,這就很滿足我迭代的需求。
Mac 和 Windows 版本都支持,下載地址:https://autoglm.zhipuai.cn/autotyper
![]()
記得用我的邀請碼:R8J5QAD2(注冊咱倆都可獲得積分哈哈哈)
進入后就可以設定詞典和人設,滿足不同場景的需求。
![]()
你甚至沒法想象,我只用了 16 分鐘就輸出 2.1 萬詞,而這還只是我用來此次創作的小號。不得不說,AI 輸入法真實提效啊。
你可以看到我設定了很多的風格來滿足我工作流中不同節點的需求。
![]()
工具就說到這,直接來看工作流吧。
用嘴啟動Gemini Cli
傳統方式是要在 Obsidian 終端手打敲擊命令:gemini。
這個單詞有時候還容易打錯,每次啟動,其實還蠻費勁。
現在,只需按住 fn,直接說:幫我啟動 gemini。智譜 AI 輸入法小凹(以下簡稱小凹)就能自動執行預設指令。
就很絲滑。
終端監控
打開 Gemini Cli,習慣做的事是看下當前倉庫占用情況,以及當前進程。以前還需要先去查下命令,或者讓 Gemini Cli 自主查找執行命令。多了一步。
現在,只需要對著小凹說:
查看當前文件夾磁盤占用,并顯示所有Python相關的進程
可以看到,小凹自動去查找相關命令并給出了指令,而且速度非常快。
文件管理
在 Obsidian 中可以存放不同文件格式的文件,一多就變得很麻煩,查找整理非常花時間。
現在只需要 AI 輸入法配合 Gemini Cli 就能很快配合解決。
AI 輸入法負責接收語音輸入,并轉為可執行的指令給到 Gemini Cli 自動執行。
比如這個需求就可以直接對小凹說
看下當前文件夾有多少張圖片,并做圖片格式轉換
特別對于公眾號創作來說,有時候需要將視頻轉為 GIF,但圖片又不能過大(最大 10 M),原先過程非常繁瑣,先要去格式轉換的地方先轉換,再去壓縮。
現在通通不用,直接說:
將demo.mp4視頻轉成GIF格式的,只要前3s,且大小控制在10m以內
小凹直接給到完整的 FFmpeg 命令給到 Gemini Cli 精準執行,完成需求。
Obsidian 寫作
無論是記筆記還是內容創作,在 Obsidian 中都是常見場景。
拿公眾號寫作來說,從標題到文章都可以借助該工作流。
特別是對句子進行局部優化調整以及內容格式(比如轉圖表)、風格化輸出非常有用。
這里其實還有蠻多的場景可以發揮的,不過受限于當前限制,對于公眾號創作,還無法接入圖片,現在還不支持類似工具調用能力。
要是以后支持,別提能有多強,我隨時跟進者,看看啥時候能支持,到時候給大家匯報。
轉小紅書文案
這個其實我還特意開發過一款插件,現在我用新的工作流來做了嘗試,只需要說:
轉成小紅書文案
但目前的轉換,并不能全文做轉換,估計是受限于整個的輸入長度限制吧。
編程做插件開發場景
之前分享過在 Obsidian 中配合 Gemini Cli 做插件開發,非常舒服。
現在有了 AI 輸入法,變得更絲滑了,一些原本需要手動敲擊命令的場景也直接口噴就好了。
![]()
評論區回復
我有很大一部分時間是用來回復粉絲留言,但經常時間不夠用,手動敲擊又太慢,導致回復不及時,等過去了好幾天,又都沒回復。
我一度感到很痛苦。
所以讓I輸入法來幫我做一些回復,我覺得挺棒的。
計算器
對于一些簡單的計算場景,腦子又算不明白,然后每次要吭哧吭哧打開計算器,比較麻煩。
現在只需要說一聲,計算結果就出來,隨用隨丟。
非常方便和絲滑。
智譜AI輸入法很好用,我看他們也發布并開源了GLM-ASR系列語音識別模型,而智譜AI輸入法就是基于該模型打造的。
官號上截一張開源的 GLM-ASR-Nano-2512模型,可以看到 1.5B 參數的端側模型,卻取得了當前開源語音識別方向的SOTA表現,這下好了,可以預見將會有更多基于此的AI應用出來了。
![]()
說實話,折騰了這么多工具。
我發現最極致的效率,往往是返璞歸真。
沒有復雜的鼠標點擊,沒有繁瑣的窗口切換。
只有一個想法,一句耳語,一個結果。
即使在這個 AI 狂奔的時代。
最珍貴的,依然是你腦海中那一閃而過的火花。
只要那朵火花還在。
我們就永遠年輕,永遠熱淚盈眶。
這一次,換個姿勢。
重新定義你的工作流。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.