标签归档:DEVONthink

纯文本笔记管理的最大漏洞:关键词污染

单一的纯文本文件作为数据存储单元,本质上是个“双字段结构”,即文件名是一个字段,文本内容是一个字段。文件名本质上是个字符串,受到长度限制,一般认为超过 256 个字节会产生潜在风险。

在个人知识管理领域,不超过 256 字节的字符串一般不宜存储重要信息。因此,纯文本笔记(无论是txt格式还是md格式),主要通过文本文件内部“较大的那个字段”存储纯文本信息。

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

以这个纯文本文件为例:

这是个典型的卡片式摘录,存储了一个小的知识点:损益表和利润表的名称变迁。这样的文本内容,看起来没有大问题。但当问题复杂一点的时候,事情就会慢慢起变化。

这个卡片是阅读《以交易为生》这本书的摘记。笔记的内容讲的是心中没有主见、定力的人,到处寻找“救世主”。如果希望这个卡片可以在以后复用,除了通过 Random 函数随机碰撞复现,大抵是需要通过关键字检索的。这个时候,可以把原来的关键字:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013

扩展到:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013
#心态控制
#救世主

如此即可实现在探讨“救世主心态”或交易中的心态控制时,挖掘到这张卡片。事情发展到这里,so far so good。

但是,当另一个研究课题摆在面前时,事情会变得不一样:如果这时候的研究命题是,交易中的技术分析,我用“交易”这个关键字在卡片库中搜索,所有来自《以交易为生》这本书的卡片,由于书名中包含 交易这个关键字,这本书中所有的摘记都会被搜索出。在没有 Devonthink 或者 YARPP 这样的关联计算软件或插件介入时,整个搜索结果会被严重污染。

这一切的根源还是来自于前文的那句话:

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

一个读书笔记卡片,或者叫摘记卡片,包含的信息是不同维度的:

  • 内容,即正文;
  • 出处,包括书名、作者;
  • 摘录的时间点;
  • 对主题的概括,以备“搜索”或“聚合”用
  • 批注

这些不同维度的数据,统统压缩到文本文件的文件内容中,以纯文本形式呈现,将不可避免地产生“关键字污染”。现在的新书书名有很长,作者都有“关键字意识”。比如这本书:

这本书里出现的一切奇闻异事、个人感受、名言警句,都会出现在“印象笔记”和“Evernote”的搜索结果中,而无论彼时彼刻的那张卡片、那条笔记究竟是否与“印象笔记”和“Evernote”有关。

这个问题,通过纯文本文件管理笔记,无法克服。这不取决于是否应用了 Markdown 格式,也不取决于是否自主掌握笔记内容,这是整个知识库的底层技术选型限制的。

目前的公共讨论空间,确实存在这样一种误区:

  • 长期有效的知识管理,一定要自己掌握数据;
  • 而自己掌握数据,一定要通过纯文本文件本地存储。

前一句话没问题,后一句话将所有权归属的问题,误读成了技术选型要用 Markdown、纯文本格式。我个人并不反对以纯文本保存信息。这是种很干净的格式,也是历久弥新的长期有效通用格式。但个人知识库的实质并不在于讲知识(无论是否是卡片形式或者“元素化”的形式)保存在硬盘。

知识库的本质是历久弥新。这个角度看,知识库就是“数字花园”或者“知识花园”,需要播种收获,需要时常翻土。指望着一次性烙进去一个文本文件,就巩固了一个知识点,是一种战略上的懒惰。

在前面《关于笔记的再思考》一文中,提到了一种以 WordPress 为核心的知识管理模式。这种模式完全可以通过只有的域名、租用的服务器、通用的 WordPress 平台以及自动化的网盘(及本地)备份实现“自主掌握全部数据”。而从数据存储格式上看,sql 数据库格式的年龄并不比 txt 文本文件的年龄小很多,而世界上 43% 的网站份额也决定了无论是开源社区还是插件市场,WordPress 都不会比任何一款“笔记软件”或“个人管理软件”差。

在结构化的 WordPress 平台上,Category 分类和 Tag 标签完全可以对内容实现“京东自营购物”似的筛选、过滤、搜索,全文检索数据库也不需要从中文分词的角度做出任何二次开发。很多时候,找出一个,或者是一类内容,甚至不需要通过搜索框。这背后的底层逻辑是,WordPress 是基于 SQL 数据库技术的、多维度、大容量的内容管理(分发)平台。

这才是目前个人知识管理最好的选择,也是解决前文所述的“关键词污染”这个纯文本系统固有缺陷的直接办法。当然,WordPress 的技术门槛比起 Obsidian/LogSeq 是略高一些的。这是另一个话题了。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2340/

关于笔记的再思考

“元素化”与“纯文本文件”是一组不可得兼的矛盾。笔记的数量达到万条级别后,散见的文本文件无法实现有效率的搜索。要么忍受动辄几秒十几秒的耗时,要么将文本库转义为“镜像”,如 Mac 系统的 devonthink,或 Win 系统的各种本地检索软件。总之,磁盘文件夹级别,或者叫目录级别的库管理效率极低,如果考虑到批量添加/删除/替换等操作,还需要掌握复杂的正则表达式,学习成本已经不低于掌握 vim/emacs 了。

以 Obsidian 为代表的编辑器软件在开源社区的加持下,作为编辑器的用户体验很好,但作为“笔记管理系统”,管理性能的上限明显。而以 evernote/印象笔记为代表的数据库软件,建立在类似 sql-lite 等数据库架构,可以保证日常管理的效率,却完全不具备开放性,甚至因为封闭属性,已经产生了负向的用户价值。

什么才是合理的中间道路呢?

——一方面,保持类似纯文本文件管理的普世开放性,起码满足达到不低于现在(24H1)Obsidian 社区规模的条件;

——另一方面,建立在数据库架构上,却不会受限于封闭的文件格式或者吝啬的商业模式(印象笔记是其中的典型),可以由用户进行合理范围内的自定义设置/二度开发。

答案呼之欲出,没错,WordPress——地球上超过三分之一的 web 站市场份额,合理的免费/付费模式,无以伦比的开发者社区,mysql 数据库规范架构。

论功能,笔记软件的搜索、分类、tag 标签、时间戳,甚至双向链接(trackback 机制比近年大火的双向链接早了大概 15-20 年),WordPress 作为 cms 领域的行业标准,都可以实现;

论开放,WordPress 社区的规模和开发水平要远超 Obsidian 社区,主题和插件数量极为丰富;

论稳定,WordPress 每天支撑着这世界上近半网站的运转,稳定性较之个人开发者成果,要高上几个数量级;

论预期寿命,WordPress 更是远超现存任何一款“知识管理软件”,即使 PHP 底层技术式微,也会有无数成型的解决方案,继续维护 WordPress 界面背后的那个数据库。毕竟不同于前端技术三年五载迭代更新,数据库技术几十年来一直保持了主干不变。

作为个人笔记库, WordPress 的弊端也很鲜明。

一是初始门槛相对高。现实的方案,免费的 WordPress 程序要配合域名(在大陆地区还需要完成备案)和主机空间(或 vps 甚至服务器),这两个门槛就隔绝了大量使用者。

二是备份/同步相对复杂。作为在线程序,WordPress 的一键化备份一直是个大生意。技术上备份要分为 WordPress 程序/文件系统,和数据库两个分支分别备份,复杂性远超各类个人知识管理软件。

三是作为在线程序,离线无法使用。这一点类似于早期的 roam research。

四是编辑界面相对简陋,不如 Obsidian/Logseq 等编辑软件用户友好,更不如 VS-Code 功能强大。

好在,这些问题除了问题一属于硬资源约束,其他大都可以解决。

备份同步问题,可以设置相应软件的 SOP 定期同步虚拟主机文件夹,备份全站,并在 Mac/Win 的终端界面写好导出-下载数据库的脚本定期执行。门槛稍高,但并不麻烦。

离线使用问题,可以分为离线读取和离线写入分别处理。“离线读取”角度,可以应用 WordPress 静态化插件生成 HTML 文件夹,在备份同步环节本地化,再套用 devonthink 等软件救急。“离线写入”角度,可以临时将录入内容放在其他地方,恢复网络连接再补录到 WordPress。毕竟在现在的生活中,离线环境大多是飞机高铁等临时性环境,应急从权即可。

编辑界面问题,大可“重器轻用”,大大方方用 Obsidian 等写作“IDE”,在 Obsidian 建立一个文件夹叫“写作台”专门放置临时文件,处理一时写不完的长篇思考,写好输出 HTML 复制到 MarsEdit 等 WordPress 编辑端。零碎闪光、摘录,直接进入 MarsEdit,写好直接发表。这样做的好处是,连带着图床功能也可以沾光 Obsidian,尽量保持 WordPress 不存附件,保持在线内容尽可能存放在数据库。毕竟虚拟主机的可靠性比起阿里云腾讯云等图床服务还是差了不少。

理顺这些逻辑,最后就是形成稳定的 SOP 了。哪怕没有上面这些辨析,仅仅是在微信订阅号写作,也是有 SOP 可以梳理的。“重器轻用”后,复杂的流程,SOP 之后不一定真的复杂;有时,“All-in-one”的方案,由于不断调动外部资源,事实上也并非简单。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2337/

读书五年记

0.无聊事

2014年的最后两天,做了件无聊事。眼看着元旦将至,全年读书49本,就想凑整,凑个50本吧。于是用了一天半抢进度,读了一本三联的小册子《怎样读书》。书很好,笔记整理完收获也很大,只是回头看看,这心态确实无聊。不过开卷有益,读书总是好事。

1.数目字

自2009年12月起,开始做读书的记录,整理统一的读书卡片,已经满五年了。算上09年尾巴的几本书,五年里一共读了268本书, 整理完了其中174本书的笔记。

这个数字不能算多,不能算快。比起一年两三百本的读书人差得远。如同2011年总结时归纳的,慢的原因一是时间不能保证,二是需要敲敲打打记笔记。这样也好,已经适应了。

下半年在读书时间上有进步,除了工作日的早晨和中午有100分钟左右,周末的早晨也开始利用起来,每周又多了几个小时。这是个实实在在的进步。

对比起来,之前看书全靠兴之所至,没有计划,没有笔记,没有清单,随手读,随手放,就显得效率太低了。

2.十本书

总结书单,推荐十本书。

  • 顾准:从理想主义到经验主义

第一推荐。顾准对于彼岸世界的反思与欧洲的保守主义暗合,价值观上主张价值多元,方法论上主张改良主义。我甚至无法对这本书进行概括性的描述,任何概括的尝试都是对顾准的不尊重。很难想象这本书写于资料匮乏的文革时期。

  • Nassim Nicholas Taleb:黑天鹅

这是一本有关世界观的书籍。“黑天鹅”事件有三个特征:稀有性、冲击性和事后的“可预测性”。生活是少数重大事件的累积结果,我们不知道的事比知道的事更有意义。世界是复杂的,历史是模糊的,人们可以看到结果,可以看到自认为是原因的原因,但永远看不到藏在幕后的真实原因。正确的做法是,尽可能多做尝试,还有尽可能把自己暴露在正向黑天鹅事件之下——用一句更常见的表述是,做个有准备的人,等着机会光临。

  • Nassim Nicholas Taleb:反脆弱

风会熄灭蜡烛,却能使火越烧越旺。年轻人要学会利用随机性、不确定性和混沌,要牢记“杀不死我的只会令我更强大”——要成为火,渴望得到风的吹拂,从冲击中受益,在风险、不确定性、随机性、波动性的覆盖下成长壮大——此之谓“反脆弱性(antifragile)”。

  • 朱青生:十九札

这几年,读书的方法论书籍读过几本,如胡适等合辑的《怎样读书》、艾德勒的《如何阅读一本书》,但启发最大的还是朱青生的《十九札》。作者是个美学教授,书中辑录了与学生的一些通信。读罢,读书卡片的“元素化”的概念牢牢树立,受益至今。

  • 王世渝:曾经德隆

王世渝最有名的著作有两本,《曾经德隆》和《中国重组》。后者读来不如前者有收获。德隆倒下十年了,回首这十年的“宏观调控”、“国进民退”、“PE热”,再看当初的唐万新,扼腕不已。

  • 刘慈欣:三体

这是一部小说,很长,有三部。曾经以为只是个“鬼吹灯”似的畅销书,读过才知道,也是启发世界观的读物。想想第一次看完《盗梦空间》、《源代码》的那种启发,《三体》比它们要强上何止十倍。很多时候,我们最大的危险就是不知道自己不知道。列两个书里与主题无关的小段子:

“射手”假说:有一名神枪手,在一个靶子上每隔十厘米打一个洞。设想这个靶子的平面上生活着一种二维智能生物,它们中的科学家在对自己的宇宙进行观察后,发现了一个伟大的定律: “宇宙每隔十厘米,必然会有一个洞。”它们把这个神枪手一时兴起的随意行为,看成了自己宇宙中的铁律。

“农场主假说”:一个农场里有一一群火鸡,农场主每天中午十一点来给它们喂食。火鸡中的一名科学家观察这个现象,一直观察了近一年都没有例外,于是它也发现了自己宇宙中的伟大定律:“每天上午十一点,就有食物降临。”它在感恩节早晨向火鸡们公布了这个定律,但这天上午十一点食物没有降临,农场主进来把它们都捉去杀了。

说实话,当时我是脊背发凉了一会。

  • 木心:文学回忆录

短句为主的笔记合辑,感谢陈丹青为我们保存了木心先生的课。无法用一两句话概括这书。 摘几句话:

《红楼梦》中的诗,如水草。取出水,即不好。放在水中,好看。(274页)

创作的过程太长,艺术是要死的。(328页)

人要临危不乱,临幸福也不乱。(387页)

所谓时髦,就是上当的意思。(766页)

规律背后,有命运在冷笑。(955页)

不是人多就必有天才。蚂蚁再多,不会出个钢琴家。(1045页)

中国的公园,许多人在那里弄气功,抱住树,晃头——那是怕死,没有别的意思。穷凶极恶地怕死。他们心里在想:一个呢,这样可以不死,一个呢,这样不花本钱。(1050页)

生活像什么呢?像上街去买鞋,两双同价的鞋,智者选了好看的,愚者选了难看的。生活像什么呢?晚上上酒吧,智者选了美味的酒,愚者买了烂酒,还喝醉了。(1076页)

所以,这哪里是一本文艺评论呢?

  • Peter L. Bernstein:与天为敌:风险探索传奇

金融有金融史,法律有法律史,这本书是风险管理史。帕斯卡说,上帝存在,或是不存在,我们应该倾向于哪一边?

  • 茅海建:天朝的崩溃:鸦片战争的再研究

茅海建有一个大本事,能够一条野史不引,一句观点不喷,把道理说的扎扎实实。所有的脚注来自于正史旧档,一个个结论无可辩驳。这书是对人教社的历史教材最好的注解。今年在三联书店的楼梯拐角,看到了茅海建注的《我史》,煌煌巨制顺利出版,不禁在心里拜了几拜。

  • Kevin Kelly:失控

KK全名凯文·凯利,有人说他是大师,有人说他是骗子。大师还是骗子我不知道,我只知道骗子写不出这本书。这本书比内容更值得注意的是,其中文译本的引进、翻译、出版的过程,完全是互联网的力量在主导,特别是碎片化的翻译的过程,更是直接呈现了书中的意味。

3.工具控

五年的时间,书没看多少,倒把自己炼成工具控了。按照时间先后,主要的工具有三类:阅读介质笔记软件时间日志

工具1:阅读介质

新兴的阅读介质基本都有了。2010年用iPad比较多,划线标记也容易,就是觉得累眼睛。于是买了Kindle DXG。2011年写读书总结的时候也提到了,文字版的mobi书籍还是要有一个小Kindle才方便,于是买了Kindle3、Kindle4、Kindle5。时至今日,经常是纸质书开两本同时读,小Kindle一个小说,大Kindle一个学术,单摆浮搁,不亦乐乎。

说说各自的优缺点。纸质书是王道,只要买的是正版,阅读的品质基本可以保证,不足是整理笔记时开开合合,实在不老实。Kindle DXG居其次,只要是扫描版的PDF,除了幅面略小,阅读体验与纸质书基本没有差别。薄薄的DXG更轻便,抄笔记也容易。Kindle5基本只用来读小说了,正经的社科书籍如果读mobi/ePub的格式实在不知道正在读的是不是原本,齐全不齐全。iPad基本不用了,太亮,眼睛累。

工欲善其事,必先利其器。都是好东西,都好得很。

工具2:笔记软件

木心曾说:“记,比读书还要紧。”五年里,把现在市面上所有的笔记软件都试用过了——不管是大众化的Evernote印象笔记、Onenote,还是小众的Filemaker、MoinMoin、Confluence,甚至是轻量级的TiddlyWiki、WikidPad。中间几度更换解决方案,庞大的迁移成本练就了熟练的键鼠操作。现在强迫症的病情基本得到了控制,解决方案固定在了Devonthink上。这是一款Mac软件,将“元素化”的原则落到了实处

Devonthink的好处有三:

  • 纯文本存储。一万条笔记就是一万个TXT,加上单独的数据库索引文件,总容量大概也就是10m上下。万一发生意外,Dropbox至少可以找回来TXT的源。如果是Onenote、Evernote,由于是用数据库存储富文本,估计至少是100m以上了。Sqlite的数据库一坏,就没办法了。

  • 元素化存储,后台聚合。Devonthink可以根据分词自动聚合相似内容。在笔记中加几个特定的关键字,就可以实现主动搜索+自动聚合的效果。

  • 可以与Evernote印象笔记相互转换。这样一来即使以后Devonthink出了问题,也有后路。

缺点也很明显:贵。和Omni家的OmniFocus一样贵。可确实物有所值。

工具3:时间日志

2014年6月开始用atimelogger记录时间日志,全面记录是不现实的,只记录三个事情:睡眠、运动和读书。 打开书时,顺手记录一下,看完书,再点一下,这样就可以根据时间日志分析自己的读书时间、速度。现在看书还是慢,连带敲打笔记,大概一小时3万字左右。取到了这个数字,就可以大概估算一本书要读几天。当然,这也要建立在保证每天尽可能多多读书的基础上。

借助时间日志,可以实现一个值得重视的转换:读书的目标不再是要读多少本书,而是要用多少时间读书。只要确保自己保持读书时间上的一致性,一年究竟是50本书还是70本书一点也不重要了。当然,当注意力被集中到第二天是否可以读满100分钟的时候,一年下来阅读量一定也会让人满意的。

4.方法论

一点体会,不成体系,归纳在这里。读书还是应该买正版。即使是读电子书,也仅应是买书支持作者之后求方便的权宜之计。免费下载传播的电子书侵犯了作者版权,这一点应该明确。后面只做技术讨论。

方法论1:并联阅读与分类

读书首先要明确分类。不同的书籍有不同的阅读渠道,也应分配不同的时间和精力。

对于长本事,开眼界的书籍,最好不要看文字电子版,而应以纸质书或扫描版PDF为首。mobi、TXT格式的文本电子书无法保证完整性和准确性,容易因小失大,得不偿失。

对于有配图的书籍,更是应该首选原件和扫描件。极少数由各个领域的粉丝制作的文字版PDF或mobi中会准确放入扫描来的配图。这种电子书确实花费了很多精力,但依然无法确保准确和完整,同样不应该成为首选。

对于小说,则首选文字版本,特别是网上的书友自己制作的mobi格式。与纯文本格式不同,mobi格式是打包的html文件,制作需要用掉不少的人工。这是一个门槛,可以规避掉TXT格式那些粗制滥造的简单汇总。mobi格式和TXT格式最大的好处是可以直接用Kindle标注笔记。Highlight之后的笔记直接存储在Kindle里面,后期整理很方便。如果是纸质书和扫描PDF,则要多一道录入的环节。

有一种情况是最“好”的,也是最坏的——很多mobi格式文件甚至是去掉了版权签名的亚马逊正版电子书,这种情况阅读的体验最好,但毫无疑问这是一种赤裸裸的、无底线的盗版行为。

时间和精力也应有所区别。

早晨的时间适宜读正经的、重要的书籍,特别是一些涉及方法论和认识论的书籍。这类书籍容易引发思考,值得投入大量的精力,一定要用最好的时间。周六的早晨是最好的时间,一来没有工作的干扰,二来心情放松,是读书的黄金时间。工作日中午的午休也适合读这类书籍。尽管精力会稍差,但午休的好处是无人打扰,安安静静,外部环境好。

路上的时间和晚上的时间一般比较零碎,易被打扰,而且精力一般,容易分散,只适合读小说。小说最好用小Kindle,随取随用,单手掌握,零星笔记直接标记,后面再用电脑整理。

开车的时候没办法读,但可以听。曾用有声书的方式听过小说。这种渠道没办法做笔记,渐渐就不听了。

总之,做好了大类别的分类,就可以合理的分配渠道了。明确各个渠道的定位,读书还是以纸质书和扫描PDF为首选,其他渠道只是利用零碎时间的无奈之举。如此,分门别类,定纷止争,自然也就不会浪费大好时光和精力,被小说的代入感牵着鼻子走了。

方法论2:优先级和找时间

每个人都会面对一个问题:没有时间读书。

时间是一种稀缺资源。摆布、调配稀缺资源就是在做价值判断。从这个角度讲,没有时间读书是个伪命题,背后的本质是,“读书不够重要”。

我们总是容易混淆“重要”和“紧急”这组概念。我们在处理办公室工作时总是会高谈阔论“重要、紧急”,言必称“四象限”,可当真到了生活里,常常将“重要”与“紧急”搞混。

重要的事情都是不紧急的。如果把“重要”定义为“打基础,立长远”的事,那么“重要”的事情必然都是“不紧急”的。“紧急”往往产生于外部,或是别人,或是环境。而人之为人,把握自己远比应付外界重要。这么看来,“重要”的事情确实都是“不紧急”的。

不仅仅是读书,生活中任何需要改善的习惯,需要调整的节奏,都是价值观的优先级重构。时间就像海绵里的水,挤一挤总是有的,这是形象的说法。本质上,不断提升一个事情的优先级,自然就可以为此放弃若干杂事。读书如此,睡眠如此,运动健身、陪伴家人也是如此。

读书的优先级高,时间不用找,自然就有了。

读书的优先级低,读书的时间也就永远都不够用了。

方法论3:主题阅读

主题阅读是快速切入崭新领域的好方法。每一个领域就像是一个矿床,主题阅读就是打一次通道,集中所有注意力先后开多个作业面工作。主题阅读最大的好处是在短时间内可以对材料进行相互比较,在对比中获取更多的信息和体会。

自从2010年末集中阅读了林行止的书之后,大大小小共进行了7次主题阅读。2011年8月、9月集中阅读关于德隆的专著是收获最大的一次。横向看完能找到的所有关于德隆的专著后,从财经记者、德隆高管、专栏作家等不同的角度还原了当时的情况,不仅仅了解了事件本身的全貌,也对多个著者的立场有了较为清晰的对比。老话讲,“兼听,还是偏听,是一个问题”。若不是短期内对比着看,单看哪一本都是“偏听”了。

主题阅读在方法论上具有很强的执行性。以平均每周一本书计算,3–5本书籍的小主题大概只需要一个月左右即可读完。用一个月的业余时间,熟悉一个领域,外加积累数百条笔记,这个杠杆算起来还是很划算的。每年不要多,5个主题,5年的时间就可以深入了解20个以上的专题。这些专题之间如果再有关联,又会产生新的“协同效应”,产生新的价值。

从功利的角度看,在阅读的量上去以后,采取这种方法优化阅读,获取知识效率是很高的。

5.无聊话

读书是个观心的过程。读的是书,识的是自己。如叔本华所说,读书就是让别人的思想在自己的脑子里跑马。铁打营盘流水兵,跑来跑去,岿然不动的还是我们自己。

读书的时间长了,慢慢就认识了自己,增长了自信,强化了自律——据说古希腊阿波罗神庙外面有三句话:

  • 认识你自己。
  • 你是。
  • 勿过度。

读书,不正是这三句话么?

6.关联阅读

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/1562/

读书笔记、读书卡片与DEVONthink

对一位科学家来说,整理和组织材料的过程本身,就是一种享受。……从事这一工作时,感到很愉快。这种快感,实际上就是意义本身。——《奇特的一生》

Devonthink

 

出于个人习惯,这些年一直在关注Mac终端上的读书笔记和读书卡片。不动笔墨不读书,读书不留下些书面材料,总觉得有点对不起读书用掉的时间。五六年来,对卡片的载体进行了一轮一轮的探索,目前使用的DEVONthink 2 pro。这个软件,可以很好的满足读书卡片系统的基本需求。

一年前曾写过一篇《用Filemaker Go打造iPad个人读书卡片数据库》,提到了读书卡片系统诸如元素化、本地化、便携性等几个基本要求。实际的使用中,Filemaker数据库暴露出了一个巨大的问题:作为数据库软件,将检索结果聚合在一起然后集中导出很容易,但想要实现快速检索然后集中显示聚合在一起的结果则很难——数据库将“卡片”检索出来,“摞成一摞”,每次只呈现一张。另一个问题是,数据库基于纯文本的存储原则,无法在后续使用中Highlight需要的字句,没办法在“卡片”上标标画画,人与卡片之间仿佛隔了一层玻璃。幸好在Mac上还有DEVONthink,可以满足元素化、本地化、可聚合等基本需求,同时还可以聚合呈现,可以Highlight标注。就目前的使用情况来看,这是一款读书卡片神器。

Devonthink

 

DEVONthink是一款德国人在很多年前编写的软件,中文互联网上对它的讨论还不太多。值得注意的一点是,在英文世界的讨论中,出自各学科研究者的比例非常大。也许这款软件天生就是为了学术研究而诞生的。

Devonthink

 

第一次知道DEVONthink是很偶然的打开了一篇2005年的文章,一个台湾人写的,题目是《從卡片盒到DEVONthink》。那时候还没有使用Mac,看了一眼就略过了。直到后来使用DEVONthink后重新检索到这篇文字,恍然间有了一种踏破铁鞋、柳暗花明的感觉。到目前为止,检索到的最早的讨论DEVONthink的材料是一个老外写于2003年的文章,题目叫《Outboard Brains for OS X》,将DEVONthink比做了“外脑”。绝不是夸张,DEVONthink就是“外脑”。除了收集、存储以外,DEVONthink可以将内容有序组织在一起。如果英文够好,能够用英文写笔记,抄卡片,读文献,DEVONthink甚至可以根据词汇的重叠程度自动分析文章或笔记之间的关联程度,提供“See also”功能,让内容关联最紧密的文章集中显示。这种关联并不是基于“Keywords”,不是基于“Tags”,而是基于文本的内容;这一切都是智能的,不需要人工干预的。当然,由于DEVONthink不能解决中文分词问题,对中文材料只能以句子作为判断单位,效果就差多了。

Devonthink

 

DEVONthink使用的是Mac系统中普遍采用的Library存储方式,有点像iPhoto这类的软件。所有的图片、文字全部存储在一个Library中。这个Library包可以任意移动位置,可以放到移动硬盘,也可以放到Dropbox随时同步。在本质上,Library并不是一个独立的文件,而是一个文件夹。Evernote、Onenote可能面临的存储文件损坏问题,在这里并不存在。内容变化时,Dropbox同步也仅仅同步改变的索引文件和增量的内容,并不会动辄将整个Library通过互联网上上下下的反复上传下载。

有一个老外,自己的主数据库达到了29G,有些担心软件的可靠性。经过咨询DEVONthink的开发者,得到了答案,DEVONthink的单数据库文件数上限是20万,字数(Words)上限是3亿。即使接近了这一上限,也可以通过分拆Library的方式处理。DEVONthink可以同时打开多个数据库操作,很方便。

Devonthink

 

通过运用DEVONthink,很多灵活有效地存储组合得以实现。例如,一个研究者可以将收集到的报纸、书籍截图以内容命名,以出版发行的日期作为Spotlight Comment的注释,存储在DEVONthink中。这样,可以直接按照时间顺序组织、挖掘。就这个应用方法而言,Evernote、Onenote很难实现。DEVONthink的强大功能保证了使用者有充分的空间在软件内进行个性化的“二次开发”。

这是个神奇的软件。仅仅用做收集读书笔记和制作读书卡片,肯定是大材小用了。有兴趣的话,建议以英文关键字在google进行搜索。英语世界中,DEVONthink是个很严肃的研究者软件。

希望DEVONthink可以帮助到越来越多的朋友。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/1260/