月度归档:2024年06月

纯文本笔记管理的最大漏洞:关键词污染

单一的纯文本文件作为数据存储单元,本质上是个“双字段结构”,即文件名是一个字段,文本内容是一个字段。文件名本质上是个字符串,受到长度限制,一般认为超过 256 个字节会产生潜在风险。

在个人知识管理领域,不超过 256 字节的字符串一般不宜存储重要信息。因此,纯文本笔记(无论是txt格式还是md格式),主要通过文本文件内部“较大的那个字段”存储纯文本信息。

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

以这个纯文本文件为例:

这是个典型的卡片式摘录,存储了一个小的知识点:损益表和利润表的名称变迁。这样的文本内容,看起来没有大问题。但当问题复杂一点的时候,事情就会慢慢起变化。

这个卡片是阅读《以交易为生》这本书的摘记。笔记的内容讲的是心中没有主见、定力的人,到处寻找“救世主”。如果希望这个卡片可以在以后复用,除了通过 Random 函数随机碰撞复现,大抵是需要通过关键字检索的。这个时候,可以把原来的关键字:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013

扩展到:

tags: 
#《以交易为生》
#Alexander_Elder
#Y2013
#心态控制
#救世主

如此即可实现在探讨“救世主心态”或交易中的心态控制时,挖掘到这张卡片。事情发展到这里,so far so good。

但是,当另一个研究课题摆在面前时,事情会变得不一样:如果这时候的研究命题是,交易中的技术分析,我用“交易”这个关键字在卡片库中搜索,所有来自《以交易为生》这本书的卡片,由于书名中包含 交易这个关键字,这本书中所有的摘记都会被搜索出。在没有 Devonthink 或者 YARPP 这样的关联计算软件或插件介入时,整个搜索结果会被严重污染。

这一切的根源还是来自于前文的那句话:

在文本文件中存储多维信息,本质上是对不同维度的信息进行降维。

一个读书笔记卡片,或者叫摘记卡片,包含的信息是不同维度的:

  • 内容,即正文;
  • 出处,包括书名、作者;
  • 摘录的时间点;
  • 对主题的概括,以备“搜索”或“聚合”用
  • 批注

这些不同维度的数据,统统压缩到文本文件的文件内容中,以纯文本形式呈现,将不可避免地产生“关键字污染”。现在的新书书名有很长,作者都有“关键字意识”。比如这本书:

这本书里出现的一切奇闻异事、个人感受、名言警句,都会出现在“印象笔记”和“Evernote”的搜索结果中,而无论彼时彼刻的那张卡片、那条笔记究竟是否与“印象笔记”和“Evernote”有关。

这个问题,通过纯文本文件管理笔记,无法克服。这不取决于是否应用了 Markdown 格式,也不取决于是否自主掌握笔记内容,这是整个知识库的底层技术选型限制的。

目前的公共讨论空间,确实存在这样一种误区:

  • 长期有效的知识管理,一定要自己掌握数据;
  • 而自己掌握数据,一定要通过纯文本文件本地存储。

前一句话没问题,后一句话将所有权归属的问题,误读成了技术选型要用 Markdown、纯文本格式。我个人并不反对以纯文本保存信息。这是种很干净的格式,也是历久弥新的长期有效通用格式。但个人知识库的实质并不在于讲知识(无论是否是卡片形式或者“元素化”的形式)保存在硬盘。

知识库的本质是历久弥新。这个角度看,知识库就是“数字花园”或者“知识花园”,需要播种收获,需要时常翻土。指望着一次性烙进去一个文本文件,就巩固了一个知识点,是一种战略上的懒惰。

在前面《关于笔记的再思考》一文中,提到了一种以 WordPress 为核心的知识管理模式。这种模式完全可以通过只有的域名、租用的服务器、通用的 WordPress 平台以及自动化的网盘(及本地)备份实现“自主掌握全部数据”。而从数据存储格式上看,sql 数据库格式的年龄并不比 txt 文本文件的年龄小很多,而世界上 43% 的网站份额也决定了无论是开源社区还是插件市场,WordPress 都不会比任何一款“笔记软件”或“个人管理软件”差。

在结构化的 WordPress 平台上,Category 分类和 Tag 标签完全可以对内容实现“京东自营购物”似的筛选、过滤、搜索,全文检索数据库也不需要从中文分词的角度做出任何二次开发。很多时候,找出一个,或者是一类内容,甚至不需要通过搜索框。这背后的底层逻辑是,WordPress 是基于 SQL 数据库技术的、多维度、大容量的内容管理(分发)平台。

这才是目前个人知识管理最好的选择,也是解决前文所述的“关键词污染”这个纯文本系统固有缺陷的直接办法。当然,WordPress 的技术门槛比起 Obsidian/LogSeq 是略高一些的。这是另一个话题了。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2340/

关于笔记的再思考

“元素化”与“纯文本文件”是一组不可得兼的矛盾。笔记的数量达到万条级别后,散见的文本文件无法实现有效率的搜索。要么忍受动辄几秒十几秒的耗时,要么将文本库转义为“镜像”,如 Mac 系统的 devonthink,或 Win 系统的各种本地检索软件。总之,磁盘文件夹级别,或者叫目录级别的库管理效率极低,如果考虑到批量添加/删除/替换等操作,还需要掌握复杂的正则表达式,学习成本已经不低于掌握 vim/emacs 了。

以 Obsidian 为代表的编辑器软件在开源社区的加持下,作为编辑器的用户体验很好,但作为“笔记管理系统”,管理性能的上限明显。而以 evernote/印象笔记为代表的数据库软件,建立在类似 sql-lite 等数据库架构,可以保证日常管理的效率,却完全不具备开放性,甚至因为封闭属性,已经产生了负向的用户价值。

什么才是合理的中间道路呢?

——一方面,保持类似纯文本文件管理的普世开放性,起码满足达到不低于现在(24H1)Obsidian 社区规模的条件;

——另一方面,建立在数据库架构上,却不会受限于封闭的文件格式或者吝啬的商业模式(印象笔记是其中的典型),可以由用户进行合理范围内的自定义设置/二度开发。

答案呼之欲出,没错,WordPress——地球上超过三分之一的 web 站市场份额,合理的免费/付费模式,无以伦比的开发者社区,mysql 数据库规范架构。

论功能,笔记软件的搜索、分类、tag 标签、时间戳,甚至双向链接(trackback 机制比近年大火的双向链接早了大概 15-20 年),WordPress 作为 cms 领域的行业标准,都可以实现;

论开放,WordPress 社区的规模和开发水平要远超 Obsidian 社区,主题和插件数量极为丰富;

论稳定,WordPress 每天支撑着这世界上近半网站的运转,稳定性较之个人开发者成果,要高上几个数量级;

论预期寿命,WordPress 更是远超现存任何一款“知识管理软件”,即使 PHP 底层技术式微,也会有无数成型的解决方案,继续维护 WordPress 界面背后的那个数据库。毕竟不同于前端技术三年五载迭代更新,数据库技术几十年来一直保持了主干不变。

作为个人笔记库, WordPress 的弊端也很鲜明。

一是初始门槛相对高。现实的方案,免费的 WordPress 程序要配合域名(在大陆地区还需要完成备案)和主机空间(或 vps 甚至服务器),这两个门槛就隔绝了大量使用者。

二是备份/同步相对复杂。作为在线程序,WordPress 的一键化备份一直是个大生意。技术上备份要分为 WordPress 程序/文件系统,和数据库两个分支分别备份,复杂性远超各类个人知识管理软件。

三是作为在线程序,离线无法使用。这一点类似于早期的 roam research。

四是编辑界面相对简陋,不如 Obsidian/Logseq 等编辑软件用户友好,更不如 VS-Code 功能强大。

好在,这些问题除了问题一属于硬资源约束,其他大都可以解决。

备份同步问题,可以设置相应软件的 SOP 定期同步虚拟主机文件夹,备份全站,并在 Mac/Win 的终端界面写好导出-下载数据库的脚本定期执行。门槛稍高,但并不麻烦。

离线使用问题,可以分为离线读取和离线写入分别处理。“离线读取”角度,可以应用 WordPress 静态化插件生成 HTML 文件夹,在备份同步环节本地化,再套用 devonthink 等软件救急。“离线写入”角度,可以临时将录入内容放在其他地方,恢复网络连接再补录到 WordPress。毕竟在现在的生活中,离线环境大多是飞机高铁等临时性环境,应急从权即可。

编辑界面问题,大可“重器轻用”,大大方方用 Obsidian 等写作“IDE”,在 Obsidian 建立一个文件夹叫“写作台”专门放置临时文件,处理一时写不完的长篇思考,写好输出 HTML 复制到 MarsEdit 等 WordPress 编辑端。零碎闪光、摘录,直接进入 MarsEdit,写好直接发表。这样做的好处是,连带着图床功能也可以沾光 Obsidian,尽量保持 WordPress 不存附件,保持在线内容尽可能存放在数据库。毕竟虚拟主机的可靠性比起阿里云腾讯云等图床服务还是差了不少。

理顺这些逻辑,最后就是形成稳定的 SOP 了。哪怕没有上面这些辨析,仅仅是在微信订阅号写作,也是有 SOP 可以梳理的。“重器轻用”后,复杂的流程,SOP 之后不一定真的复杂;有时,“All-in-one”的方案,由于不断调动外部资源,事实上也并非简单。

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2337/

日线定大势 每周观察与思考Y2024W23

写在前面

  • 价格基于成交,成交基于共识,共识基于多样认知的交集。趋势是共识切换,盘整是共识形成。价格涨跌、趋势盘整的背后,是共识的“生、住、坏、灭”。
  • 用最简单的语言记录走势中确定的机会。确定性不一定用于盈利,也可以用于规避风险。
  • 方法上,主要依靠趋势交易、Price Action 和缠论结合。
  • 基于逻辑学排中律的完全分类思想,辅之以适当的概率判断,寻找确定性机会。
  • 确定性的窗口不会经常打开,一旦打开,是可以被抓住的。

螺纹加权指数:基于完全分类的不测而测

周五收盘,螺纹指数呈现出了巨大的不确定性。

image-20240607161958212

短线上,15F 级别始于4月初的这轮上涨在5月末见顶,完成了一个完整的aAb结构。3823短线见顶后,后市有两种可能。

  • 一是,回踩不破3690,形成15F3B,继续上涨;
  • 二是,回踩回到中枢内部,3823成为新的15F盘整走势的起点,开启至少三段的向下盘整。

按照交易的理论,面对不确定性,一般采取两个思路。一是向小的方向,展开小级别,则可以判断同级别是否完美;二是看大的方向,通过1H级别分析15F走势的大概率走法。

此处采取第二种思路,直接看日线级别。

image-20240607162531704

2021年5月的螺纹高点6193起,走势是在完成一个向下的盘整走势。走势内部目前走到了完美前的最后一段。日线级别每天形成一个K线,一段走势常常会持续两年以上的时间。有理由相信,2021年5月至今的这段整体向下的盘整走势已经到了最后阶段。

这个判断和宏观消息面的各种消息是契合的。作为交易者,最忌看大做小,具体的利润还是来自于对每个波动的准确把握。在日线基础上回到1H线级别,分析3393低点后的反弹的意义。

image-20240607162940419

年初4075高点以后到4月初3393低点,一个完整的15F走势(1H图上的一条红线)完成,目前的分歧主要在于当下的反弹是否可以超过3823的前高。无论是否创新高,后面都还有一个15F级别的向下(盘整/趋势)走势。1H级别决定15F级别,做出了这个判断,15F级别就要做偏空分析。

image-20240607161958212

回到15F级别,如果做偏空处理,此时就要等待3823之上,或者之下出现合理的开空机会。

image-20240607163403178

这个位置大概率就在3823以下,3694以上。在这里,也是前期的密集成交区域。价格波动在这个位置会呈现剧烈的无序波动。其中,3700附近是重要的阻力位:

  • 如果突破,短线可以高看到3800一线,有100点左右的做多空间;
  • 如果不能突破,可以背靠3700做空,做空目标价位直接看到3400一线。

小结

  • 下周端午小长假,关注假期消息面对市场的影响。
  • 周二开盘日内价格继续冲高,关注3700一线的波动。
    • 如果突破,短线可以高看到3800一线,有100点左右的做多空间;
    • 如果不能突破,可以背靠3700做空,做空目标价位直接看到3400一线。
  • 周末之前,市场会给出答案。
  • 本文不涉及任何内幕未披露信息,也不构成投资建议。

参考内容

原创文章,转载请注明: 转载自风云居 | Less is more

本文链接地址: https://kangjian.net/blog/2326/