這是蒼何的第 458 篇原創(chuàng)!
大家好,我是愛折騰 Obsidian 的蒼何。
一個月前,我將自己的 Obsidian 工作流分享出來,收到了很多朋友的喜歡。
![]()
并因此受到 WPS 邀請去珠海分享了一波 AI 時代的知識管理及 Vibe Coding 實(shí)踐。
![]()
這一段時間,我又對我的 Obsidian 工作流做了不少的迭代,加了不少的插件,做了不少模板。
同時也在一些流程節(jié)點(diǎn)思考用當(dāng)下比較的 AI 輸入法來融入,并定了一個狠目標(biāo):能用嘴噴的地方就不用手。
折騰了一段時間,覺得是時候拿出來和大家做分享了。
先看看我如何結(jié)合 Gemini Cli+AI輸入法+Obsidian 來搭工作流,一張制作的信息圖先看看。
![]()
先來看一個 Obsidian 中寫作類場景:
再看一個 Obsidian 文件管理和文件格式轉(zhuǎn)換的常用場景:
當(dāng)然,遠(yuǎn)遠(yuǎn)不止這些,這次一共包含以下幾種節(jié)點(diǎn)場景優(yōu)化:
1、用嘴在Obsidian中啟動Gemini Cli
2、查看當(dāng)前文件夾磁盤占用,并顯示所有Python相關(guān)的進(jìn)程
3、看下當(dāng)前文件夾有多少張圖片,并做圖片格式轉(zhuǎn)換
4、視頻格式轉(zhuǎn)GIF,且控制大小
5、Obsidian寫作:從爆款標(biāo)題到文案創(chuàng)作到局部優(yōu)化改寫一整套工作流
7、編程做插件開發(fā)場景
8、評論區(qū)回復(fù)
9、懶人計算器接下來會依次介紹下各個節(jié)點(diǎn)的實(shí)踐,會配有視頻演示和我的理解。
文章很干,建議點(diǎn)贊收藏并轉(zhuǎn)發(fā)給需要的朋友,節(jié)點(diǎn)中的每個提示詞和 AI 輸入法人設(shè)如果需要的話也可評論留言告訴我。工具選擇
Obsidian 和 Gemini Cli 不用說了,已經(jīng)是知識管理和內(nèi)容創(chuàng)作必備的工具了,還不了解的朋友可以翻一翻蒼何之前的文章。
AI 輸入法上,我做了不少的調(diào)研和測試,發(fā)現(xiàn)世面上目前主要有 2 類 AI 輸入法,一類是基于大模型能力做的實(shí)時翻譯,這類主打的是一個低延遲和本地化數(shù)據(jù)隱私。
但功能層面比較單一,沒有過多的 AI Agent 操作,復(fù)雜場景下無法滿足。
另一類就是就是功能更豐富的 AI 輸入法產(chǎn)品,能應(yīng)對復(fù)雜場景,做更多的 Agent 操作。
經(jīng)對比最終選擇的是智譜 AI 輸入法小凹。
![]()
在識別度、復(fù)雜場景下的優(yōu)勢比較明顯,最關(guān)鍵的是可以按照不同的場景定制風(fēng)格輸出,這就很滿足我迭代的需求。
Mac 和 Windows 版本都支持,下載地址:https://autoglm.zhipuai.cn/autotyper
![]()
記得用我的邀請碼:R8J5QAD2(注冊咱倆都可獲得積分哈哈哈)
進(jìn)入后就可以設(shè)定詞典和人設(shè),滿足不同場景的需求。
![]()
你甚至沒法想象,我只用了 16 分鐘就輸出 2.1 萬詞,而這還只是我用來此次創(chuàng)作的小號。不得不說,AI 輸入法真實(shí)提效啊。
你可以看到我設(shè)定了很多的風(fēng)格來滿足我工作流中不同節(jié)點(diǎn)的需求。
![]()
工具就說到這,直接來看工作流吧。
用嘴啟動Gemini Cli
傳統(tǒng)方式是要在 Obsidian 終端手打敲擊命令:gemini。
這個單詞有時候還容易打錯,每次啟動,其實(shí)還蠻費(fèi)勁。
現(xiàn)在,只需按住 fn,直接說:幫我啟動 gemini。智譜 AI 輸入法小凹(以下簡稱小凹)就能自動執(zhí)行預(yù)設(shè)指令。
就很絲滑。
終端監(jiān)控
打開 Gemini Cli,習(xí)慣做的事是看下當(dāng)前倉庫占用情況,以及當(dāng)前進(jìn)程。以前還需要先去查下命令,或者讓 Gemini Cli 自主查找執(zhí)行命令。多了一步。
現(xiàn)在,只需要對著小凹說:
查看當(dāng)前文件夾磁盤占用,并顯示所有Python相關(guān)的進(jìn)程
可以看到,小凹自動去查找相關(guān)命令并給出了指令,而且速度非常快。
文件管理
在 Obsidian 中可以存放不同文件格式的文件,一多就變得很麻煩,查找整理非常花時間。
現(xiàn)在只需要 AI 輸入法配合 Gemini Cli 就能很快配合解決。
AI 輸入法負(fù)責(zé)接收語音輸入,并轉(zhuǎn)為可執(zhí)行的指令給到 Gemini Cli 自動執(zhí)行。
比如這個需求就可以直接對小凹說
看下當(dāng)前文件夾有多少張圖片,并做圖片格式轉(zhuǎn)換
特別對于公眾號創(chuàng)作來說,有時候需要將視頻轉(zhuǎn)為 GIF,但圖片又不能過大(最大 10 M),原先過程非常繁瑣,先要去格式轉(zhuǎn)換的地方先轉(zhuǎn)換,再去壓縮。
現(xiàn)在通通不用,直接說:
將demo.mp4視頻轉(zhuǎn)成GIF格式的,只要前3s,且大小控制在10m以內(nèi)
小凹直接給到完整的 FFmpeg 命令給到 Gemini Cli 精準(zhǔn)執(zhí)行,完成需求。
Obsidian 寫作
無論是記筆記還是內(nèi)容創(chuàng)作,在 Obsidian 中都是常見場景。
拿公眾號寫作來說,從標(biāo)題到文章都可以借助該工作流。
特別是對句子進(jìn)行局部優(yōu)化調(diào)整以及內(nèi)容格式(比如轉(zhuǎn)圖表)、風(fēng)格化輸出非常有用。
這里其實(shí)還有蠻多的場景可以發(fā)揮的,不過受限于當(dāng)前限制,對于公眾號創(chuàng)作,還無法接入圖片,現(xiàn)在還不支持類似工具調(diào)用能力。
要是以后支持,別提能有多強(qiáng),我隨時跟進(jìn)者,看看啥時候能支持,到時候給大家匯報。
轉(zhuǎn)小紅書文案
這個其實(shí)我還特意開發(fā)過一款插件,現(xiàn)在我用新的工作流來做了嘗試,只需要說:
轉(zhuǎn)成小紅書文案
但目前的轉(zhuǎn)換,并不能全文做轉(zhuǎn)換,估計是受限于整個的輸入長度限制吧。
編程做插件開發(fā)場景
之前分享過在 Obsidian 中配合 Gemini Cli 做插件開發(fā),非常舒服。
現(xiàn)在有了 AI 輸入法,變得更絲滑了,一些原本需要手動敲擊命令的場景也直接口噴就好了。
![]()
評論區(qū)回復(fù)
我有很大一部分時間是用來回復(fù)粉絲留言,但經(jīng)常時間不夠用,手動敲擊又太慢,導(dǎo)致回復(fù)不及時,等過去了好幾天,又都沒回復(fù)。
我一度感到很痛苦。
所以讓I輸入法來幫我做一些回復(fù),我覺得挺棒的。
計算器
對于一些簡單的計算場景,腦子又算不明白,然后每次要吭哧吭哧打開計算器,比較麻煩。
現(xiàn)在只需要說一聲,計算結(jié)果就出來,隨用隨丟。
非常方便和絲滑。
智譜AI輸入法很好用,我看他們也發(fā)布并開源了GLM-ASR系列語音識別模型,而智譜AI輸入法就是基于該模型打造的。
官號上截一張開源的 GLM-ASR-Nano-2512模型,可以看到 1.5B 參數(shù)的端側(cè)模型,卻取得了當(dāng)前開源語音識別方向的SOTA表現(xiàn),這下好了,可以預(yù)見將會有更多基于此的AI應(yīng)用出來了。
![]()
說實(shí)話,折騰了這么多工具。
我發(fā)現(xiàn)最極致的效率,往往是返璞歸真。
沒有復(fù)雜的鼠標(biāo)點(diǎn)擊,沒有繁瑣的窗口切換。
只有一個想法,一句耳語,一個結(jié)果。
即使在這個 AI 狂奔的時代。
最珍貴的,依然是你腦海中那一閃而過的火花。
只要那朵火花還在。
我們就永遠(yuǎn)年輕,永遠(yuǎn)熱淚盈眶。
這一次,換個姿勢。
重新定義你的工作流。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.