3月和各种龙虾搏斗的经验

我是一名重度数据工作者,日常需要处理大量的本地文件、测试各种想法、分析结构化的数据。在编程学习上,我只知道大意原理却始终难以记牢具体的函数语法,因此十年来屡屡半途而废。直到有了Cursor终于开始大量尝试编程处理数据。但整个工作流的丝滑度提升和真正感受到生产力跃迁,还是在使用了Claude Code之后,让人......

3月和各种龙虾搏斗的经验

本文来自微信公众号: 嬉笑创客 ,作者:CB

我是一名重度数据工作者,日常需要处理大量的本地文件、测试各种想法、分析结构化的数据。在编程学习上,我只知道大意原理却始终难以记牢具体的函数语法,因此十年来屡屡半途而废。直到有了Cursor终于开始大量尝试编程处理数据。但整个工作流的丝滑度提升和真正感受到生产力跃迁,还是在使用了Claude Code之后,让人有“对了是这样”的感觉。

OpenClaw最早也脱胎于Claude Code。

后者基于命令行交互,虽然我在cursor上面开terminal运行,假装有个界面。但其智能化程度已初具AIOS(AI操作系统)的雏形。相比之下,套上IM(即时通讯)外壳的龙虾更符合人类交互天性。这种感觉就像当年在DOS后构建起Windows 95的图形界面交互,更符合人性,效率不可同日而语,让个人电脑产生了大跃进。

国内各家都在拼命推龙虾,颇有当年deepseek配万物的感觉。所有非openclaw的衍生版本大体可以分为云端龙虾和本地龙虾。云端龙虾的体验整体一言难尽。

比如,比较拉胯的产品MaxClaw。其完全基于云端的特性,使得它对本地文件束手无策。既然无法触达本地,就必须具备充足的线上数据源和极强的信息搜集能力,但遗憾的是,公网数据抓取不够准确详尽,每次回复抠抠搜搜,远不如专注搜索的Perplexity;抓特定网站整天被反爬限制。

连kickstarter都攻陷不了。

我自己复制黏贴给你分析,我谢谢你。

信息搜集时常“偷工减料”的问题很严重。时效性尚可,却不愿输出详尽深入的分析,像极了一个应付差事的实习生。

让它每小时跑一遍增量信息并判断是恶化还是好转,结果经常罢工,还异常简略。最后一次更新停在半夜,而且昨天2艘船被击中是一没次提及。

因为认证原因,它也无法通过API批量抓取大量结构化数据,目前基本是个残废体。

云端工具普遍存在一个痛点:即便你提供了Token,调用API接口时也极易触发IP封锁问题。

以量化圈常用的Tushare为例,我购买了年费会员并配置了完全版Token,但由于云端工具的出口IP动态变化,导致数据根本无法抓取;万得(Wind)等本地终端更是不必多言,东方财富等平台的API对其也大多处于封锁状态。

还有个致命问题。最好的雅虎finance免费接口对中文互联网是关闭的。。。下面是Claude Code上跑的,但云端不行,因为某个原因。

我也试用了飞书自己的龙虾,至少在信息搜集与整理上,它表现得更勤奋、更愿意输出长信息。但你细看还是会发现,油价的信息不够更新,因为没接可靠数据源。这有点像你让实习生去更新英伟达的财务模型并分析变化,他去百度了一下别人写的分析结果和你汇报一样。

而这些国内龙虾又没法获取最新最快的有效新闻。老牌工具反而更好用。下面这个东西叫google news

这引出了一个关键点:评价agent输出结果时,往往缺乏客观标准。“偷懒”是人的天性,但这些按用量计费的云端龙虾竟然也学会了偷懒,实在令人百思不得其解,可能是因为还没真正收费。

以前的Chatbox多采用固定月费或年费制,平台有动力让模型“偷懒”以节省成本(输出变短、智商下降),而用户端感知并不明显。现在明明可以通过多输出Token提供完善结果来提升用户满意度,产品逻辑却还没转过弯来。

腾讯的Workbuddy也有类似问题,显得不够智能。它虽然接近本地化版工具,拥有处理本地文件的权限,但在Windows环境下,面对复杂的本地库和环境依赖,它的“大脑”显然超负荷了。我让它打开一个Word文档,它折腾了十几分钟,尝试了各种路径、写了各种Python代码层层“造轮子”,最后才恍然大悟如何打开;而一旦新开对话,它又忘得一干二净。这确实还只是个半成品。

他为了打开一个docx文件自己玩了10分钟。像一个很勤奋但没受过实操训练的实习生。后面还有十几步。如果不是看它满头大汗的样子而且还没收费,我都会怀疑是的士司机在故意绕路烧我token。未来对于用户还真是盲盒,需要token审计计量的服务商,也是个第三方工具的机会。

另外,前天wechat article search这个技能是存在的,但是现在找不到了,可能内部还没讨论清楚要不要开放出独特的宝藏资源:公众号体系。但TX再不运营好公众号可能以后这也变成荒地了。

我还发现了一个有趣的现象:当同样的“灵魂”(大模型)被封装进不同的“身体”(工具)时,其智能表现天差地别。

我的Claude Code背后由Minimax 2.5驱动,Workbuddy我也选了Minimax 2.5,但两者判若云泥。比如处理文档,Claude Code起初也会遇到环境配置问题,但它能迅速理顺路径、装好依赖,后续一直稳定运行。

可以理解为,在AIOS时代,“灵魂”与“身体”是两层皮。模型厂商未必能做好上层应用,而真正的应用能力在于如何将其打造成方便、易用的产品。在这方面,Claude明显更胜一筹。

我曾对比过直接让Claude Code“人工”根据文件名将文件分类,与写脚本调用大模型去识别,背后的驱动同样都是Minimax 2.5,但效果截然不同。Claude Code的识别率和准确度高出太多,而将文件名喂给Minimax则大幅降智,甚至会将典型的中国公司误认为美国公司,或将日韩公司识别为地缘政治内容,让人心累。

每个月收到的几千个文档会用Claude Code来进行分类:

我做一些大胆的展望:如果云端工具不能解决接入各种数据源的问题,很快就会退潮。反之,若能成为集成各种数据来源的“数据终端”,整个产业将迎来巨变。

过去的数据是给人看的,或是给固定终端用的;未来,数据必须开放接口给Agent,甚至是运行在云端的Agent,并提供极其灵活的打通方式。双方是互需关系:Agent需要数据来丰富自己的能力,数据服务商需要通过Agent获得新用户。这甚至有蚕食万得(Wind)等传统金融终端客户群的势头。

同花顺反应很快,你猜明天市场会什么反应。

目前量化界常用的Tushare等还不支持云端Agent(受限于IP变动),我只能在自己本地Claude Code上跑。我相信这种需求迟早会爆发。

不仅是专业数据商,搜索服务商亦然。

Tavily此前被并购便是一个信号,大家都意识到,谁能把Agent的联网搜索做好,就是一桩巨大的功德。我记得云启资本投过类似的公司,陈昱大哥还是很有远见的。

为了迎接Agent时代,整个互联网的基础设施恐怕都要重新建设翻新一遍。

THE END
免责声明:本文版权归原作者所有;旨在传递信息,不代表鲸媒智集的观点和立场。
相关阅读
  • 350位CEO:有关AI的三重真相和投资逻辑

    350位CEO:有关AI的三重真相和投资逻辑

    分钟咨询公司Teneo调查了350位年营收超过十亿美元的上市公司CEO,针对有关于AI的支出(CapEx)等关键问题做了调研,得出了一份非常具备参考性,同时也在某些方面与大众认知出现反差的信息报告。核心信息及数据如下:68%的CEO计划在2026年…

    2025年12月19日 14:43
  • MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    早申放榜只是美本申请的开端,数据显示,ED录取率通常只有20%左右,有超过70%的申请者最终都是在RD阶段竞争。所以即使在早申里没有获得理想的结果,也不意味着申请就结束了。

    2025年12月19日 14:37
  • 防治骚扰电话要感谢美国?

    防治骚扰电话要感谢美国?

    2025年12月8日,美国联邦通信委员会执法局向中国移动、中国联通和中国电信在香港的运营实体公司发出“合规令”,认定其在反自动拨号骚扰电话数据库中的认证存在“重大缺陷”,并要求在14天内完成整改或作出说明,否则将面临被移出RMD、直…

    2025年12月17日 16:41
  • AI时代最重要的技能

    AI时代最重要的技能

    如果说这辈子最需要掌握的技能是啥,我觉得有俩:1、搜索能力;2、输出能力。这里说的“搜索”当然跟之前搜索引擎时代不太一样了,不过逻辑是相同的,都是从浩如烟海的网络信息里查找自己需要的。大家应该注意到了,自从大模型出现后,信…

    2025年12月17日 16:37

栏目精选