▍緣起
我在豆瓣的「豆齡」已有 18 年時間。作為國內最著名的書影音記錄網站,豆瓣上記錄了我從中學開始的「文化消費」。近兩年,我時常考慮如何將這些數據本地化,并且和我的其他筆記進行聯動。背后的原因有二:
第一是數據安全性考慮。豆瓣偶有服務不穩定的情況,由于自己之前已經有 Blogbus 等網站的「慘痛教訓」,我不由得擔心萬一有一天發生不測,這些記載著我青春的數據是否也會消失在網絡空間中。給自己的書影音記錄留一個本地備份提上了我的日程。
![]()
第二則是知識管理角度的考慮。在開始使用豆瓣的那個年代,市面上并沒有現在如此先進的各類筆記軟件。我個人對于書影音的各類快評、想法都留在了豆瓣評論中。豆瓣基于條目的系統設計注定了其所有記錄都是分散的。如今我已經基于 Obsidian 建立了我自己的知識庫,兩者之間是否可以進行聯動?
為什么是 Obsidian,為什么是現在?
既然本地備份是自己的優先需求,Obsidian 就成了我的第一選擇——況且我已經在使用它了。然而我卻遇到了兩大難題。
首先,前幾年的 Obsidian 仍然是以 Markdown 基礎語法為主,可視性不足。雖然可以通過 Dataview 的形式搭建自己的數據庫,但對于代碼小白而言,手寫 Query 難度還是有些太高了。(那時候還沒有 AI 呢)
其次,如何將豆瓣十幾年的記錄搬遷到 Obsidian?我暫時還沒有看到成熟且完美的解決方案,Obsidian 自身的插件市場也沒有覆蓋到這個「小眾需求」。市面上雖然有一些豆瓣備份的插件,但只能備份到 HTML 或者 Excel 表格。
備份到 Notion 的小工具倒是不少,但 Notion 畢竟是在線版本,而且我并不偏好 Notion 的塊狀界面。我也嘗試過 Tana,但奈何網絡原因使用不暢,只能將其作為一個隨手記的軟件,不能作為大量筆記的「安身之所」。
難道說我要手工建立幾百個 Markdown 文件?
顯然不用。Obsidian 最新推出的 Base 和 CSV 導入功能終于補上了這最后一塊拼圖。我覺得,是時候將豆瓣無痛導入到 Obsidian 了。
▍第一步:備份豆瓣至 CSV
整體的思路還是曲線救國,將豆瓣備份到一個通用的 CSV 格式文件,然后再通過升級后的 Obsidian Importer 導入到 Obsidian 中并生成數據表(base)。
如果僅僅是將豆瓣備份到 CSV 格式,那市面上可選的工具可就多了,我自己選擇的是一個叫做「豆伴」的 Chrome 插件。本文就不再敘述安裝插件的流程。
在連接到豆瓣賬號后,點擊「新建任務」,可以選定需要備份的范圍。
![]()
選擇備份的范圍
點擊新建后即可啟動備份任務。完成后在瀏覽備份的界面點擊右上角的導出數據,可以將內容導出為 Excel 可以打開的 CSV 格式。
![]()
▍第二步:處理數據
盡管 Obsidian 中也可以處理欄位、添加數據,但對于技術小白而言,Excel 顯然是更方便的操作環境。
用 Excel 打開剛剛生成的 CSV 文件,可以看到書影音已經被分在了不同的 Sheet 中。理論上我們可以將三者放在一張表中進行導入,但方便起見我們還是將其分批導入。
接下來就可以按照自己的需求對于欄位進行一些定制了。比如,我就添加了 Category(類別),Status(狀態)等欄位,并刪除了多余的欄位,以便之后導入 Obsidian 之后的管理。
至于每一列的名字,在這個階段無需特別更改,待之后導入 Obsidian 的時候會統一確認。
例如我給自己設計的 CSV 長這樣:
![]()
題外話:最近這幾本書都還不錯 ^_^
第三步:導入 Obsidian
在源數據準備完畢之后,就可以將其轉化為 Base 了。
如上文提到的,在 Base 功能剛上線的時候我就嘗試過遷移,但最大的問題是:我這幾百條豆瓣記錄,難不成我要自己一個個創建出來?
雖然肯定有批處理的方法,但對于技術苦手來說太難了。Obsidian 在最近的版本中升級了 Importer 這個官方插件的功能,支持了更多種類的數據,尤其是 CSV。這也讓我們的遷移得以實現。
首先記得在設置中激活 Importer 這個插件。點擊 Importer 后,你就能看到所有支持的文件格式。
![]()
基本涵蓋了主流的格式了
我們選定了 CSV 之后,還能設置輸出文件夾(即這些新的 Markdown 文件存放在哪里)。你可以選擇根目錄,也可以指定一個文件夾。
點擊下一步之后,軟件會自動讀取 CSV 文件的表頭,并提供選項來調整映射。這里就需要輸入你希望在 Base 中展現的屬性名字。對于一些你希望放在文件正文中的內容(例如我的評論),就可以把字段放在最下面的正文框中。
![]()
非常簡潔明了的設置界面
點擊繼續后,系統就會在后臺非常迅速地生成所需要的 Markdown 文件,并且將這些文件整合為一個 Base。
有了基礎設施,后續就可以將這些文件與現有的知識庫鏈接,也可以進一步加工(比如我給他們后續打了標簽)。如果需要的話,也可以把其他的書影音記錄如法炮制導入到 Obsidian,成為離線版的豆瓣備份。
基于 Obsidian 的書影音工作流
將書影音的記錄轉移到 Obsidian 了之后,豆瓣對我而言回歸到了它「種草」和「社交」的功能;對于作品的所思所想則更多地留在了專業的筆記軟件里。
對于日常閱讀和小想法的記錄,正如我在之前一篇文章里寫到的,我更傾向于使用「瀑布流」的大綱筆記。因此,我會將閱讀過程中的想法記錄在 Tana 的 Daily Notes 里,并將成熟的思考定期整理到 Obsidian 中歸檔——這也是基于 Markdown 文件的 Obsidian 更適合的場景。
使用 Obsidian 后最大的好處就是能夠發揮它雙向連接和插件的作用,去探尋自己知識網絡中的鏈接。以下幾個場景我覺得頗為實用:
被其他朋友薦書是常有的事。之前我會在豆瓣上標注一句:xxx 的推薦。但我無法直觀地找出某渠道推薦的所有書目。導入到 Obsidian 后,通過 Unlinked mentions 功能就很快將這些記錄串聯在了一起。有些播客節目的 Shownotes 還會列出書單。這時候也能方便的和我收藏的書單進一步鏈接。
![]()
以《邊角聊》播客為例
書與書之間、我的想法之間,甚至書、想法和我的剪藏之間都是可能有聯系的。將他們匯集在一個庫之中,常常會有意想不到的收獲。有時候,我會通過雙向鏈接的形式手動將其連接在一起。
![]()
在評論或書評中采用「雙向鏈接」
還有一些時候,我會通過Smart Connections這個 AI 插件給我提示。它通過對庫中的筆記進行分析,在右側會提示類似的筆記——雖然迄今為止我還沒搞清楚它大模型的匹配邏輯。
![]()
火雞科學家理論能給我匹配到動物、人類學和社會學相關的內容
這些相互鏈接是有規模效益的。當內容越多、質量越高的時候,產生鏈接的可能性也就越高。正因為如此,我也在逐步將其他數據源的信息也匯聚進來。
說不定會有意想不到的事情發生。
https://sspai.com/post/103817?utm_source=wechat&utm_medium=social
作者:Log924
責編:克萊德
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.