标签归档:知识管理

笔记的两个去处

仅有一个笔记库,是无意义的。无论是“全文书库”还是元素化的“一元笔记”,都是无意义的。

笔记就是一堆比特,笔记不产生价值。知识不需要管理,知识只会被学会,只会被应用。学会是第一步,应用是第二步。

知识如果不能进入神经元网络就谈不上被学会,知识如果无法以作品的形式进入社会协作网络,就谈不上被应用。

笔记只有两个去处:一个是进入记忆,一个是生成作品。最终的去处都是一个:进入网络——要么进入社会协作网络,要么进入大脑的神经元网络。

除此之外,笔记没有意义。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2351/

纯文本笔记管理的最大漏洞:关键词污染

单一的纯文本文件作为数据存储单元,本质上是个“双字段结构”,即文件名是一个字段,文本内容是一个字段。文件名本质上是个字符串,受到长度限制,一般认为超过 256 个字节会产生潜在风险。

在个人知识管理领域,不超过 256 字节的字符串一般不宜存储重要信息。因此,纯文本笔记(无论是txt格式还是md格式),主要通过文本文件内部“较大的那个字段”存储纯文本信息。

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

以这个纯文本文件为例:

这是个典型的卡片式摘录,存储了一个小的知识点:损益表和利润表的名称变迁。这样的文本内容,看起来没有大问题。但当问题复杂一点的时候,事情就会慢慢起变化。

这个卡片是阅读《以交易为生》这本书的摘记。笔记的内容讲的是心中没有主见、定力的人,到处寻找“救世主”。如果希望这个卡片可以在以后复用,除了通过 Random 函数随机碰撞复现,大抵是需要通过关键字检索的。这个时候,可以把原来的关键字:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013

扩展到:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013
#心态控制
#救世主

如此即可实现在探讨“救世主心态”或交易中的心态控制时,挖掘到这张卡片。事情发展到这里,so far so good。

但是,当另一个研究课题摆在面前时,事情会变得不一样:如果这时候的研究命题是,交易中的技术分析,我用“交易”这个关键字在卡片库中搜索,所有来自《以交易为生》这本书的卡片,由于书名中包含 交易这个关键字,这本书中所有的摘记都会被搜索出。在没有 Devonthink 或者 YARPP 这样的关联计算软件或插件介入时,整个搜索结果会被严重污染。

这一切的根源还是来自于前文的那句话:

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

一个读书笔记卡片,或者叫摘记卡片,包含的信息是不同维度的:

  • 内容,即正文;
  • 出处,包括书名、作者;
  • 摘录的时间点;
  • 对主题的概括,以备“搜索”或“聚合”用
  • 批注

这些不同维度的数据,统统压缩到文本文件的文件内容中,以纯文本形式呈现,将不可避免地产生“关键字污染”。现在的新书书名有很长,作者都有“关键字意识”。比如这本书:

这本书里出现的一切奇闻异事、个人感受、名言警句,都会出现在“印象笔记”和“Evernote”的搜索结果中,而无论彼时彼刻的那张卡片、那条笔记究竟是否与“印象笔记”和“Evernote”有关。

这个问题,通过纯文本文件管理笔记,无法克服。这不取决于是否应用了 Markdown 格式,也不取决于是否自主掌握笔记内容,这是整个知识库的底层技术选型限制的。

目前的公共讨论空间,确实存在这样一种误区:

  • 长期有效的知识管理,一定要自己掌握数据;
  • 而自己掌握数据,一定要通过纯文本文件本地存储。

前一句话没问题,后一句话将所有权归属的问题,误读成了技术选型要用 Markdown、纯文本格式。我个人并不反对以纯文本保存信息。这是种很干净的格式,也是历久弥新的长期有效通用格式。但个人知识库的实质并不在于讲知识(无论是否是卡片形式或者“元素化”的形式)保存在硬盘。

知识库的本质是历久弥新。这个角度看,知识库就是“数字花园”或者“知识花园”,需要播种收获,需要时常翻土。指望着一次性烙进去一个文本文件,就巩固了一个知识点,是一种战略上的懒惰。

在前面《关于笔记的再思考》一文中,提到了一种以 WordPress 为核心的知识管理模式。这种模式完全可以通过只有的域名、租用的服务器、通用的 WordPress 平台以及自动化的网盘(及本地)备份实现“自主掌握全部数据”。而从数据存储格式上看,sql 数据库格式的年龄并不比 txt 文本文件的年龄小很多,而世界上 43% 的网站份额也决定了无论是开源社区还是插件市场,WordPress 都不会比任何一款“笔记软件”或“个人管理软件”差。

在结构化的 WordPress 平台上,Category 分类和 Tag 标签完全可以对内容实现“京东自营购物”似的筛选、过滤、搜索,全文检索数据库也不需要从中文分词的角度做出任何二次开发。很多时候,找出一个,或者是一类内容,甚至不需要通过搜索框。这背后的底层逻辑是,WordPress 是基于 SQL 数据库技术的、多维度、大容量的内容管理(分发)平台。

这才是目前个人知识管理最好的选择,也是解决前文所述的“关键词污染”这个纯文本系统固有缺陷的直接办法。当然,WordPress 的技术门槛比起 Obsidian/LogSeq 是略高一些的。这是另一个话题了。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2340/

关于笔记的再思考

“元素化”与“纯文本文件”是一组不可得兼的矛盾。笔记的数量达到万条级别后,散见的文本文件无法实现有效率的搜索。要么忍受动辄几秒十几秒的耗时,要么将文本库转义为“镜像”,如 Mac 系统的 devonthink,或 Win 系统的各种本地检索软件。总之,磁盘文件夹级别,或者叫目录级别的库管理效率极低,如果考虑到批量添加/删除/替换等操作,还需要掌握复杂的正则表达式,学习成本已经不低于掌握 vim/emacs 了。

以 Obsidian 为代表的编辑器软件在开源社区的加持下,作为编辑器的用户体验很好,但作为“笔记管理系统”,管理性能的上限明显。而以 evernote/印象笔记为代表的数据库软件,建立在类似 sql-lite 等数据库架构,可以保证日常管理的效率,却完全不具备开放性,甚至因为封闭属性,已经产生了负向的用户价值。

什么才是合理的中间道路呢?

——一方面,保持类似纯文本文件管理的普世开放性,起码满足达到不低于现在(24H1)Obsidian 社区规模的条件;

——另一方面,建立在数据库架构上,却不会受限于封闭的文件格式或者吝啬的商业模式(印象笔记是其中的典型),可以由用户进行合理范围内的自定义设置/二度开发。

答案呼之欲出,没错,WordPress——地球上超过三分之一的 web 站市场份额,合理的免费/付费模式,无以伦比的开发者社区,mysql 数据库规范架构。

论功能,笔记软件的搜索、分类、tag 标签、时间戳,甚至双向链接(trackback 机制比近年大火的双向链接早了大概 15-20 年),WordPress 作为 cms 领域的行业标准,都可以实现;

论开放,WordPress 社区的规模和开发水平要远超 Obsidian 社区,主题和插件数量极为丰富;

论稳定,WordPress 每天支撑着这世界上近半网站的运转,稳定性较之个人开发者成果,要高上几个数量级;

论预期寿命,WordPress 更是远超现存任何一款“知识管理软件”,即使 PHP 底层技术式微,也会有无数成型的解决方案,继续维护 WordPress 界面背后的那个数据库。毕竟不同于前端技术三年五载迭代更新,数据库技术几十年来一直保持了主干不变。

作为个人笔记库, WordPress 的弊端也很鲜明。

一是初始门槛相对高。现实的方案,免费的 WordPress 程序要配合域名(在大陆地区还需要完成备案)和主机空间(或 vps 甚至服务器),这两个门槛就隔绝了大量使用者。

二是备份/同步相对复杂。作为在线程序,WordPress 的一键化备份一直是个大生意。技术上备份要分为 WordPress 程序/文件系统,和数据库两个分支分别备份,复杂性远超各类个人知识管理软件。

三是作为在线程序,离线无法使用。这一点类似于早期的 roam research。

四是编辑界面相对简陋,不如 Obsidian/Logseq 等编辑软件用户友好,更不如 VS-Code 功能强大。

好在,这些问题除了问题一属于硬资源约束,其他大都可以解决。

备份同步问题,可以设置相应软件的 SOP 定期同步虚拟主机文件夹,备份全站,并在 Mac/Win 的终端界面写好导出-下载数据库的脚本定期执行。门槛稍高,但并不麻烦。

离线使用问题,可以分为离线读取和离线写入分别处理。“离线读取”角度,可以应用 WordPress 静态化插件生成 HTML 文件夹,在备份同步环节本地化,再套用 devonthink 等软件救急。“离线写入”角度,可以临时将录入内容放在其他地方,恢复网络连接再补录到 WordPress。毕竟在现在的生活中,离线环境大多是飞机高铁等临时性环境,应急从权即可。

编辑界面问题,大可“重器轻用”,大大方方用 Obsidian 等写作“IDE”,在 Obsidian 建立一个文件夹叫“写作台”专门放置临时文件,处理一时写不完的长篇思考,写好输出 HTML 复制到 MarsEdit 等 WordPress 编辑端。零碎闪光、摘录,直接进入 MarsEdit,写好直接发表。这样做的好处是,连带着图床功能也可以沾光 Obsidian,尽量保持 WordPress 不存附件,保持在线内容尽可能存放在数据库。毕竟虚拟主机的可靠性比起阿里云腾讯云等图床服务还是差了不少。

理顺这些逻辑,最后就是形成稳定的 SOP 了。哪怕没有上面这些辨析,仅仅是在微信订阅号写作,也是有 SOP 可以梳理的。“重器轻用”后,复杂的流程,SOP 之后不一定真的复杂;有时,“All-in-one”的方案,由于不断调动外部资源,事实上也并非简单。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2337/

我的 2020 年终总结

这是一篇迟到的总结,姗姗来迟在除夕守岁。

2020,庚子年,这世界出了太多的幺蛾子。所幸自己没有浪费时间,还算有些产品。

Projects

  • 2nd Certication:继 2019 年拿到了新加坡政府的第一个认证,2020 年拿到了另一个政府认证。能继续得到外国政府的认可,只是证明了经历的过往并非仅仅具有本土价值。尽管自己的国际化技能还远远不达标,但总算有了发力的起跑器。
  • 3th Certication:第三个政府认证启动,也许会成为 2021 年的年度完成事项。

Side Projects

  • Project HandShake:对冲是大资金的必然选择,在一个不具备在做空环境和做空手段的市场中,设计一个对冲系统,即使系统本身不能赚钱,也不能阻挡其探索意义。新和谐公社虽然失败,毕竟具备极强的启示意义。没有这个项目的探索,后续不会有其它“握手”系列策略诞生。
  • Project HandShake-CN:在一个可做空的市场,寻找到了围绕主要资金集散领域的对冲策略。第一个对冲系统不可行,但提纯的理念到了可行的市场,策略便可行了。橘生淮南则为橘。
  • Project HandShake-CN2:新和谐公社之后会有巴黎公社,巴黎公社之后就是苏维埃了。CN2 就是握手系列的苏维埃。彻底将单边策略与对冲策略合一,自下而上让市场决定对市场的操作,真正算是“以天和天”思路的产物了。

Situation

  • 少子化的趋势延续。数据显示,发达经济体的出生率下降不可逆转,华人的高速增长时代结束。未来人口增长的三极是印度、中东和非洲。低生育种群中的个体,只有两种选择:要么成为全球化意义上的精英,要么成为日本文化中的“下流老人”。所谓“饱食贫民”只存在于欧美发达国家。中日韩等东方文化经济体没有那个空间。另一个角度,新增人口减少,“经验”将重新巩固其不可替代性。算力、储能和材料学的科技树短线见顶,技术增速放缓结合人口增速回落,“家有一(精英)老,如有一宝”将在不远的将来重回话语体系。但问题是,这个“老”,凭什么去当“宝”?这才是每一个正当年的人必须正视的问题。
  • 统治的全球化耦合。美国大选的最大启示是,“人类永不为奴”这种科幻电影的口号一定会在不远的将来成为现实中的广泛主张。全球化会将统治者前所未有的团结在一起。基因技术与再生技术一旦取得突破进展,“人上人”、“天龙人”阶级一定会诞生。权力只会巩固权力,统治者必然维持统治。这个趋势下,人类的基本矛盾会向“统治”与“被统治”转移。
  • 物质充裕与快感供养并存。活着不难,有口饭吃总能做到。但人之为人,不该把天赋灵性用在被剪掉气口的短视频上,用在种田文、穿越文这种快感产品中。每一个人类个体,终其一生的使命之一,永远是神经元的优化、头脑中的熵减。即使是在“三体”的语境中,面壁人依然是人类的依靠。其中的隐喻,还是要不断提升认知。托夫勒四十年前的提法是,在“暴力-金钱-知识”的权力三阶段中,“知识”才是最高权力来源。而短半衰期的“快感”,天生是认知的天敌。

Takeaways

构建外脑、优化技能、保持勇气,这三件事是绕不开的。外脑在哪里?技能是什么?勇气哪里来?以下罗列,挂一漏万。

  • 个人扩表。扩大自己的资产包,避免消费债务。未来的世界,1% 的人占据 120% 的财富,98% 的人分摊 20% 的净负债。中间还有 1%,这些人是奴隶社会的城邦自由民,既不用成为奴隶,也不会拥有奴隶。要努力成为中间这 1%,就要积极扩充资产负债表,利用债务杠杆扩充资产包。已完成:一直与消费负债绝缘;资产包构建中。
  • 产业延伸。要抓住更多产业环节,尽可能利用技术的支持,完成原来只有公司制才能组织的生产流程。举个例子,做自媒体有机会成长得快,但做杂志编辑不行——自媒体借助于技术,个人可以囊括更多的创作、编辑、出版甚至渠道建设等流程。要找这样的事情下功夫,不要在大机构做螺丝钉。已完成:路径规划阶段性完成,彻底摆脱了“大机构螺丝钉”的状态。
  • 回归 CLI。只有命令行才符合人类线性表达的习惯。GUI 天生就意味着注意力涣散。Windows 普及了家用电脑,也加深了“用户”和“开发者”之间的鸿沟。手机 App 进一步让更多的人自认为连通了信息世界,其实只是贡献了自己的时间和注意力,为别人创造商业价值。2021 年,继续探索回归 CLI 的流程。已完成:建立以 Emacs 为核心的个人管理系统;开始尝试尽可能用命令行完成操作。
  • 少用商业软件。商业软件从来不会真心辅助用户,它们只会谋求自身利益最大化。建立客户粘性和挖掘用户数据是各类“印象笔记”们的原罪。笔记文档是人生的外挂存档、外接显卡、移动硬盘,决不能被私有格式和商业软件绑架。已完成:新增笔记完全摆脱商业软件,只以纯文本及类文本格式存储;图片不放任何图床,而是采取通用的 URL 地址注记。
  • 记录日志。事事留痕,为的是不背叛飞逝的光阴。已完成:基于 Org-Mode 的日志系统,可以在几个月甚至几年后,精确查找到某日的日程安排或某个会议的笔记;时间管理软件一元化;摆脱了各类 Calendar 软件(包括苹果和谷歌的一方软件)。
  • 反对硬件消费主义。随着 CLI、文本文件等要素在生活中的比例越来越大,电子设备的硬件需求直线下降。我甚至猜测,不考虑工业设计因素,一个树莓派已经可以满足每日办公需求。骁龙 845/855/865 的算力已经算是基本冗余了。任意一个本地设备再加一个入门级的 VPS,基本就可以满足日常所需。已完成:基于 Emacs 的文本工作流,显著压降了各类电子设备硬件需求。
  • 远离算法。算法要为我所用,而不是算法用我。我不是肉鸡,我是吃鸡的食客。远离一切基于算法的产品,包括但不限于:抖音/头条/淘宝/微信订阅号。已完成:通过 RSS 推送获取信息;海量关注社交媒体的账号重获算法下的随机性;阅读清单自主制定,不参考算法推荐。
  • 亲近数学。数学是一切的基础。有了数学不等于有了一切,但数学验证过不去,则什么都不会有。已完成:将多个数学工具加入交易的算法,获取市场深度信息;以及,前述的 Project 1/2/3。

所有的这些,都是为了一个方向:财务健康,思想自由,人格独立

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/1859/

读书笔记、读书卡片与DEVONthink

对一位科学家来说,整理和组织材料的过程本身,就是一种享受。……从事这一工作时,感到很愉快。这种快感,实际上就是意义本身。——《奇特的一生》

Devonthink

 

出于个人习惯,这些年一直在关注Mac终端上的读书笔记和读书卡片。不动笔墨不读书,读书不留下些书面材料,总觉得有点对不起读书用掉的时间。五六年来,对卡片的载体进行了一轮一轮的探索,目前使用的DEVONthink 2 pro。这个软件,可以很好的满足读书卡片系统的基本需求。

一年前曾写过一篇《用Filemaker Go打造iPad个人读书卡片数据库》,提到了读书卡片系统诸如元素化、本地化、便携性等几个基本要求。实际的使用中,Filemaker数据库暴露出了一个巨大的问题:作为数据库软件,将检索结果聚合在一起然后集中导出很容易,但想要实现快速检索然后集中显示聚合在一起的结果则很难——数据库将“卡片”检索出来,“摞成一摞”,每次只呈现一张。另一个问题是,数据库基于纯文本的存储原则,无法在后续使用中Highlight需要的字句,没办法在“卡片”上标标画画,人与卡片之间仿佛隔了一层玻璃。幸好在Mac上还有DEVONthink,可以满足元素化、本地化、可聚合等基本需求,同时还可以聚合呈现,可以Highlight标注。就目前的使用情况来看,这是一款读书卡片神器。

Devonthink

 

DEVONthink是一款德国人在很多年前编写的软件,中文互联网上对它的讨论还不太多。值得注意的一点是,在英文世界的讨论中,出自各学科研究者的比例非常大。也许这款软件天生就是为了学术研究而诞生的。

Devonthink

 

第一次知道DEVONthink是很偶然的打开了一篇2005年的文章,一个台湾人写的,题目是《從卡片盒到DEVONthink》。那时候还没有使用Mac,看了一眼就略过了。直到后来使用DEVONthink后重新检索到这篇文字,恍然间有了一种踏破铁鞋、柳暗花明的感觉。到目前为止,检索到的最早的讨论DEVONthink的材料是一个老外写于2003年的文章,题目叫《Outboard Brains for OS X》,将DEVONthink比做了“外脑”。绝不是夸张,DEVONthink就是“外脑”。除了收集、存储以外,DEVONthink可以将内容有序组织在一起。如果英文够好,能够用英文写笔记,抄卡片,读文献,DEVONthink甚至可以根据词汇的重叠程度自动分析文章或笔记之间的关联程度,提供“See also”功能,让内容关联最紧密的文章集中显示。这种关联并不是基于“Keywords”,不是基于“Tags”,而是基于文本的内容;这一切都是智能的,不需要人工干预的。当然,由于DEVONthink不能解决中文分词问题,对中文材料只能以句子作为判断单位,效果就差多了。

Devonthink

 

DEVONthink使用的是Mac系统中普遍采用的Library存储方式,有点像iPhoto这类的软件。所有的图片、文字全部存储在一个Library中。这个Library包可以任意移动位置,可以放到移动硬盘,也可以放到Dropbox随时同步。在本质上,Library并不是一个独立的文件,而是一个文件夹。Evernote、Onenote可能面临的存储文件损坏问题,在这里并不存在。内容变化时,Dropbox同步也仅仅同步改变的索引文件和增量的内容,并不会动辄将整个Library通过互联网上上下下的反复上传下载。

有一个老外,自己的主数据库达到了29G,有些担心软件的可靠性。经过咨询DEVONthink的开发者,得到了答案,DEVONthink的单数据库文件数上限是20万,字数(Words)上限是3亿。即使接近了这一上限,也可以通过分拆Library的方式处理。DEVONthink可以同时打开多个数据库操作,很方便。

Devonthink

 

通过运用DEVONthink,很多灵活有效地存储组合得以实现。例如,一个研究者可以将收集到的报纸、书籍截图以内容命名,以出版发行的日期作为Spotlight Comment的注释,存储在DEVONthink中。这样,可以直接按照时间顺序组织、挖掘。就这个应用方法而言,Evernote、Onenote很难实现。DEVONthink的强大功能保证了使用者有充分的空间在软件内进行个性化的“二次开发”。

这是个神奇的软件。仅仅用做收集读书笔记和制作读书卡片,肯定是大材小用了。有兴趣的话,建议以英文关键字在google进行搜索。英语世界中,DEVONthink是个很严肃的研究者软件。

希望DEVONthink可以帮助到越来越多的朋友。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/1260/

用Filemaker Go打造iPad个人读书卡片数据库

0.引子:人人都需要读书卡片

中国古文献全文数据库完成后,一个普通的研究生的文献功底可以接近乾嘉学派高邮二王(王念孙、王引之)及段玉裁的水平以进入研究;而教授可以更集中精力去发现历史上从未发现的问题,解决有史以来不能解决的课题。——朱青生:《十九札》

历来文人都重视制作整理读书卡片。良好的个人卡片库可以使得写作成为“组织”、“加工”的过程,有助于将精力完全集中于思考和观点的表达,而不用将大量精力分配给材料的整理。发表是最好的记忆,人人都需要读书卡片

据说诗人李贺有一个传说,每天随身携带一个锦囊,遇到有灵感的时候就快速记录下来,将纸条扔进锦囊。于是乎经年累月,遂成一代诗人。这个故事的真实性和可行性都是有问题的。真实性的质疑在于古时没有自来水笔,出门在外无法很难及时在纸上书写;可行性的困惑在于大量数据无序集中,后期的挖掘利用是个不小的问题。

李敖曾经自述过“大卸八块”读书法,读书时遇到需要记录的部分,直接用刀剪剪裁,粘贴到一个大夹子中。如果正反两页都有内容,则买第二本书。如书好,想留,则买三本。大夹子依照知识点的主题不同,呈树状排列(如:历史-中国古代-唐代-李世民)。日后需要写文章,直接查找相关知识点,材料自然充裕。这种方法比李贺的可行的多,也真实得多,但仍然存在两个问题。首先,树状结构的只是组织结构很难满足有序排列的需要。举个例子,如果一级门类存在“历史”和“人物”两个分类,则“李世民”这个topic究竟怎么放?李敖本人的办法是再做一个副本存放。这样做会增加无谓的工作量,同时容易遗漏。第二个问题是大量的剪裁材料以非数字化的形式存放,后期利用会很困难。关于这一点,有“一柜子”笔记本的人都会深有体会。

1.理想中的读书卡片是什么样子?

前面的那些问题已经可以通过科技手段予以克服,数据的录入、组织、存储、利用均可以通过数字化方式实现。对于现代人而言,一个理想中的读书卡片库应该具备这些特点:

元素化

卡片库不是网摘,不宜用保存文章的方式保存。“做资料卡片的根本原则只有一条——元素化。简单地说就是“一张卡片一句话”。一句话只包含一个意思,一个意思是意思的最基本的单位。……不怕卡片多,就怕意思杂。”(朱青生)卡片应该是一个个知识点,哪怕是同一作者同一著作同一段落的文字,如果表达了两个意思,也应该制作两张卡片。

随身携带

现时中,对知识的需求是无处不在的,移动性的要求是最基本的要求。将个人的知识存储于台式机中早已不能适应时代的发展,笔记本电脑也过于不便。如果可以将卡片通过ipad、iphone等随身设备携带,则在绝大多数场合均可以对知识加以利用。

字段管理

根据内容的不同,卡片应采取字段的方式进行管理。传统的纸质卡片上,我们会人为划分区域,注明作者、书籍、出版社、年代、页码、内容等,事实上就是一种字段化的处理过程。在数据化的背景下,简单的字段处理成为必然。单纯的一个TXT或者DOC文件分段落存储是不能满足后期利用的需求的。根据这个要求,evernote被淘汰了。evernote里,我们可以将笔记元素化存储,一条笔记一张卡片,但仅有一个tag功能很难将卡片应有的字段要求满足。

跨平台

你永远不知道下一台电脑、下一部手机会是什么牌子,所以不要选择只能用于windows、mac、ios、android系统的软件,否则数据迁移是一个很痛苦的过程。这应该是一个底线要求。根据这个要求大量的解决方案被排除掉了,其中包括著名的onenote、新兴的wiz等。

聚合功能

建立卡片数据库的目的是后期利用。因此,数据输出前合理的聚合功能也成为了必需。我们需要了解的不仅仅是某一个内容在这里有,在那里也有,而是将这些涉及到的卡片聚合在一起。仅仅能够检索到是不能满足要求的,还必须有办法将检索结果有序聚合。在这里,各类wiki已经被淘汰了。

稳定性和易用性

由于是个人的卡片数据,稳定性和易用性必须同时兼顾。一来这个数据库可能会存储成千上万张卡片,用上几年、十几年,必须保证软件的稳定;二来由于软件是个人使用,技术要求不能太复杂,可以根据用户实际需求随时调整。从这点考虑,个人开发的软件(包括wiz、针式等)、在线服务(包括各类wiki、evernote、springpad等)和大型数据库系统均不宜采用。

2.用Filmemaker制作个人卡片数据库

事实上,上面这些要求,一台电脑,一个ipad和一个数据库平台就完全可以满足。软件方面,只需要一个适合个人的、跨平台的并可以在移动设备使用的数据库软件即可。这里我选择Filemaker作为了开发平台。制作过程可以用“三张表格、两个版本、一组关系”概括。

三张表格:书目信息、卡片内容和读书记录

书目信息、卡片内容和读书记录这三张表格应该是读书卡片数据库必不可少的。卡片内容自不必说,为了每一张卡片引用固定的书名、作者、出版社、年代甚至是封面,一个引用源“书目信息”是必不可少的。同时,为了记录自己的读书情况,便于日后检讨回顾,读书记录表也要有。读书记录表格大量引用书目信息,自有字段主要是开始读书的日期和读完的日期。

skitched-20120805-163735.jpg

(图片:Filemaker读书卡片数据库:书目信息表单)

skitched-20120805-163900.jpg

(图片:Filemaker读书卡片数据库:卡片内容表单)

Filemaker读书卡片数据库:读书记录表单

(图片:Filemaker读书卡片数据库:读书记录表单)

两个版本:MAC或PC端/移动设备端

Filemaker数据库有多个版本,可以在windows、mac和iOS系统上使用。PC机或MAC电脑的版本自不必说,为了实用性考虑,移动版本我选择的是ipad版本。iphone太小了,实在不适合使用。尽管iphone确实更随身一些。

Filemaker读书卡片数据库:mac版本界面

(图片:Filemaker读书卡片数据库:mac版本界面)

Filemaker读书卡片数据库:ipad版本界面

(图片:Filemaker读书卡片数据库:ipad版本界面)

值得一提的是,filemaker数据库目前最新版本是filemaker 12版,配套的iPad版本Filemaker Go 12 已经免费,但不支持12以前的数据库版本。现在开始动手的话有福了。我当时买Filemaker Go 11花了300多块钱。

一组关系:以书名为核心关联字段

这个数据库中表与表之间的关系是一个简单的不能在简单的关系。如图:

Filemaker读书卡片数据库:数据库关系

(图片:Filemaker读书卡片数据库:数据库关系)

其中,书名是最核心的字段,串联起了三个表格。

3.卡片数据库的检索

这个数据库制作完毕后,主要的应用模式要通过检索功能实现。Filemaker Go的检索主要通过两个方式:快速查找和进入查找模式(一般检索)。

快速查找

快速查找是在整个数据库中跨字段地检索内容,例如关键字为“excel”,检索结果既包含摘录笔记中包含“excel”的记录,也会包含书名中包含“excel”的记录。在实践中,快速查找可以很好的避免信息遗漏,但同时也会给检索结果带来干扰项。例如,快速查找“心态”这个关键词,《官僚体制,反资本主义的心态》这本书项下的所有记录都会被检索到。

可见,快速查找主要用于一两个关键词进行浏览式检索使用。

进入查找模式

进入查找模式就是进入一般数据库软件中的按字段分别查找。具体使用环节不用细说。查找模式可以实现一些高级功能。比如,要查找关于“茅海建谈论琦善”的观点,就可以在作者一栏填写“茅海建”,在笔记内容填写“琦善”,这样就可以避开蒋廷黻《琦善与鸦片战争》对检索结果的干扰。类似的字段组合方式还有很多,不再一一列举。

可见,查找模式有利于通过组合字段检索条件,实现精确的查找。

4.检索的实际应用

对于回想式的查找,一般只需要再iPad终端浏览查看即可。对于较为大量的信息汇总,iPad版本的Filemaker Go最常用的导出方式是打印PDF。如图:

Filemaker读书卡片数据库
Filemaker读书卡片数据库
Filemaker读书卡片数据库

无论是快速查找还是一般检索模式,检索结果无论多少,都可以输出PDF。通过点击设置图标-打印-PDF-保存或发送电子邮件,检索结果就以PDF的形式输出了。多项检索结果在PDF中对应多个页,一条记录一页。

举例。我们需要在从成千上万张卡片中输出关于“林则徐”的内容,则可以分别以“林则徐”、“林文忠”、“文忠公”为关键字检索,将结果输出一个PDF,片刻间我们手里就有了筛选过的关于林则徐的卡片汇总。

5.实践中的信息流动

实践中卡片数据库的使用一般遵循三个步骤:文本外部录入、集中整理数据、定期更新移动设备

文本外部录入

如果是纸质书籍或者扫描版PDF,一定要将摘录内容提前再记事本或notepad.cc等界面下录入电脑。录入时一般只需要录入页码和摘录内容即可。

之所以不在数据库内录入,主要是考虑尽量减少打开数据库的时间。另外纯文本的录入环境是有助于提高工作效率的。

集中整理数据

整理数据主要是靠粘贴了。由于我们会在数据库的书名设置好默认等于上一条记录,作者、年代和封面等字段从属于书名,所以一般将数据批量粘贴进卡片库时一本书只需要选择一次书名,需要每条记录都填写的只有页码和内容,这样效率比较高。

定期更新移动设备

制定一个计划,每周或每天单向的将电脑中的数据库复制进iPad。由于目前Filemaker Go还没有支持Dropbox或iCloud,暂时只能通过手动方式复制。好在卡片内容时效要求不高,每周或每晚定期复制也可以满足日常要求。

6.结语

高三开学前的暑假,我新启用了一个破旧的牛皮纸本子,专门摘录看书时遇到的比较有启发的句子,然后翻来覆去看。那时颇有些唐吉诃德般的勇气,不看英语不做数学,最喜欢翻来覆去看刘勰的《文心雕龙》和陆机的《文赋》。那个本子记了小半本东西。高三一年,作文无忧。

后来弃用了这个本子,最大的理由就是东西多了不好找。然后几年浑浑噩噩,混乱无序的乱用了几年电脑,直到遇到evernote2,那个纸条一般的笔记软件。之后,Mybase、evernote、Mediawiki、Confluerence等等所有和知识管理相关的软件都接触过。觉得还是Evernote好,但还是无法解决读书卡片的问题——设置不了字段,元素化起来整理不方便。直到一狠心啃了几天Filemaker,似乎真的走上了至少是目前能看到的终南之道。

知识管理这事,如美国诗人艾略特所说:

我们必不可停止探索,而一切探索的尽头,就是重回起点,并对起点有首次般的了解。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/1131/

我对于阅读的一些观点

曾经在微博上和@哥本中分 老师聊起过知识管理系统这个话题。当时浅尝辄止了。一直想写几笔,却只因系统过于宏大,不知何处落笔。总想整理一下。前晚读到徐子渔老师的《我对于阅读的一些观点》,相击生火,信笔记录如下。

文中有六条读书建议,颇为中肯:

1.集中阅读一本书,读完再换。
2.值得读的书要读第二遍,决不放下后就丢一边。
3.别吝惜买书的钱。
4.也别吝惜买书签的钱。
5.别沉迷中文电子书。
6.一定要做读书笔记

与徐老师不同的是,阅读体验中更多的是多线阅读,同时阅读2-3本书。这些书往往是不同领域的平行线——一本杨继绳,一本Facebook效应,一本商务的汉译——什么可能都有。习惯于根据环境和时段选择书籍。早晨、中午无人打扰的时间很宝贵,一般会看优先级最高的书。晚上下班累了,翻翻思考强度小些的书。出门在外没有电脑记笔记,就看看“机场”味稍重的书,一本书也没几张卡片可做,手机拍照足以应付了。阅读这回事,就是给自己请老师上课,课程表上多几节课,问题不大。我们不都是一天6节课8节课过来的?

读过一本书,一定会有多则一两百少则一二十的卡片摘记和思考留下来,整理进Filemaker的时候是一遍Review,精华部分两次记忆已经有印象了。剩下的工作留给关键字检索吧,有兴趣回顾书籍了就搜索书目字段集中回顾,有需要参考或引用了就搜索内容字段以关键字聚合。从个人的体验来看,效率挺高,效果挺好的。

家里有一二三四五个大小不等的书柜书架,买书是生活中一大支出。曾和一位老哥有共识,买书是世界上最便宜的消费(或许只有在中国吧)。深以为然。自从把兴趣转向扫描版PDF,连这最便宜的消费都缩减了支出,有时想想挺对不起著者们的。同意少看论坛上的TXT、文字版PDF文档,真的不知道对不对,准不准,完不完整——看小说看到太监版实在扫兴,几年前也经历过。现在找书,第一优先级是扫描PDF,这个版本到手,就可以参照着去找Mobi或TXT了,手里有了把尺子,踏实多了。顺便说一句,不太喜欢“6寸PDF”,总觉得过度加工了——保真就看扫描PDF,小Kindle就看TXT、Mobi,看不出6寸PDF的核心竞争力在哪里。

徐子渔老师的6个观点梳理了5个。君子和而不同,无论附和或相疑,读书终究是人生乐事。隔空喊话探讨读书,更是乐事中的乐事。

第6个观点,徐老师的书签确实是保持书籍原样同时可以整理笔记的不二法宝——尤其是对于习惯了Kindle DXG,纸质书已用作收藏的人——像我这样的。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/821/

Evernote3 BETA开放注册了

一直推崇的Evernote3终于不需要邀请码就可以注册了。快去Evernote看看吧!

最新的变化:

* 终于增加了付费版,同步流量$5/Mo或$45/Year,能够增加到150M/Mo的流量

* 不需要邀请码可以直接注册使用

强烈推荐这个软件,不仅仅是装机必备,对于我甚至已经是“开机必备”。

很喜欢Evernote的广告语:Remember Everything!

现在就试试吧。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/199/

推荐一个笔记软件:EverNote3.0.0.625

我用Evernote3有一段时间了,最初觉得它不如Evernote2好用,尤其是2.2版本完美支持中文检索之后。经过一段时间的使用,感觉Evernote3也有很多进步。好处罗列如下:

1. 可以和Evernote.com的个人账户同步,第一可以备份笔记,第二可以在自己的电脑不在身边的时候通过网站记笔记,回来同步。
2. 完美支持Tag标签管理,可以给每条笔记加上标签,进而通过增量检索的方式管理笔记
3. 不会出现Word忘记存盘死机的情况。输入的每一个字都是立刻被保存的,所以整个软件根本没有“存盘”的按钮
4. 方便的截取工具。无论是文本还是图片,都能很方便地收集进Evernote。如果是网页,还可以自动加入网页来源的记载

现在的Evernote3还是测试阶段,也有几个不方便的地方:

1. 在线功能的政策经常变,最初的5GB/帐户网上空间忽然变成了200MB,缩水96%;现在又变成了支持每个月同步40MB流量,试着点了升级想看看收费的情况,暂时还不能升级。政策的摇摆不定很难让人产生信赖感,Evernote要注意了。
2. 对中文搜索支持还不够完美。这个问题Evernote3的用户都清楚。
3. 编辑状态下界面不够强大,尽管不用存盘,起草复杂文稿还是不习惯选择Evernote3

最后,说说使用这个软件的一点体会:

1. 这个软件虽然截取网页内容的功能很强,但存储格式是单文件存储,并不适合作为CyberArticle那样的网摘。大量图片等内容会使笔记数据库效率变低甚至出错
2. 这个软件就是笔记软件。想想我们的笔记本是用来做什么的?我的体会是可以分成工作、学习、摘记、个人再加上一个默认的Inbox作为收集器。
3. Evernote3的网摘适合用来摘记网上的只言片语,也很适合记日记,配合ALT+左键点击插入待办事项框也很适合记录工作日志

Evernote3已经成为我每次开机必定运行的软件了,希望大家一起研究。

如果你感兴趣,可以到这里来下载。这是一个汉化补丁( 下载1下载2),不过目前还有Bug。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/194/