Category Archives: 独立思考

关于AI的思考片段记录

  关于DeepSeek(1):稍早前DeepSeek对我说:宇宙的沉默或是最大的警钟。文明或如萤火,短暂照亮黑暗便熄灭。人类若想跨越 filter,必须证明自己不仅是“会使用工具的猴子”,更是能驾驭技术之火的智慧生命。

  关于DeepSeek(2):让DeepSeek比较当年钱学森的《工程控制论》和目前最新的自动驾驶技术的理论框架。它在解释“状态空间”这个概念还挺到位。

  关于DeepSeek(3):问DeepSeek:“33550336是一个完全数,解释一下”。它的回答令人叹为观止。(后注:12月DeepSeek发布了 DeepSeek Math,原来如此)。伟大的DeepSeek赶紧发布R2吧。全中国的程序员都在苦等传说中的DeepSeek Code新版来拯救。现在中国程序员被美国大模型服务针对性折腾,太不爽了。

  关于Agent:在航空英文词汇里,Copilot是副驾驶,Captain是机长。回到计算机专业,造Agent的最终目标必然是造Captain而非Copilot。我去年因为这个和别人发生了剧烈争论。看不见、看不起、看不懂、追不上。大多数人都是这样。OpenAI 最新发布的那个 ChatGPT Pulse,不就是大模型版的今日头条嘛。字节跳动的同学们赶紧啊。这才是Agent该有的样子。Andrej Karpathy判断哪些工作会被 AI 替代的标准(或者说,可以用来考虑那些场景可以尝试开发Agent):不看工作的复杂度,看可验证性。单看IT领域,所有能实现自动化测试的场景,都会最终实现“人在环外”。所谓人机协同,大多数是伪命题。

  关于Infra:重新去阅读很多infra的文章和博客,发现了这一句“知识是病毒,专家是载体,只要有好的交流方式,知识就会不断传播,就会有新的专家成长。”基础设施层的演进速度真的匪夷所思。上半年王坚院士把大模型塞进卫星里发射到太空就够抽象了,最近看到的很多东西吓到我了。

  关于华为:华为把盘古大模型的部门彻底裁撤了。现在进入纸糊必死的时代,即使试图纸糊的品牌叫华为。另一方面,AI芯片方面,华为清晰的列出了接下来三年的产品roadmap,包含芯片型号、预计技术规格和产能,包括出现意外时的取舍优先级。这种产研迭代的节奏感让人肃然起敬。

  关于Data cloud:研究了一下Snowflake近况。自己纸糊的大模型基本上停掉了。集中精力继续做Data Cloud基础设施。目前强调自己是业务-分析-推理三合一。业务就是OLTP,分析就是OLAP,推理是正在摸索的AI接入。股价创新高。

  关于Anthropic:好诡异,Anthropic居然在老版本模型下架的时候,安排对模型(不是对模型的人类用户)进行访谈,收集模型自己对运维、部署和未来开发新模型的建议。这是完全把大模型当活人对待了吗?

  关于传统互联网平台:Amazon 正式起诉 Perplexity AI,因为后者的Agent开始帮人类在Amazon商城上自动买东西,这摧毁了电商大数据推荐广告的技术根基。豆包手机助手一上线,就被微信在内的各种平台封杀,逻辑一样。平台自己的NLP界面做出来之前,不会接受任何其他AI挡在APP和用户之间。问题是,用户最终只需要一个Jarvis。

  关于AI自动做算子优化:这波Google Gemini 3.0大模型的登顶,意味着第一个非英伟达芯片支撑的大模型杀出来了。Google提出了很多爆炸性的思路,同样可以用在中国国产卡生态。夏天看了Google的一篇用DeepSeek自动探索底层算子代码优化的论文。TPU驱动层算子优化(对位CUDA和算法框架)不只是活人在做,而是尝试AI做。这意味着DeepSeek震惊世界的工作(在英伟达体系底层深度优化,节省超过十倍算力)可以由AI在国产卡生态里再做一遍,不用非得组建上百人的、年薪十亿的天才团队。离AI在无人干预下,基于国产芯片,完全自主从头开发一个大模型,还有多少个月?

虚拟现实?

  意大利天体物理学家Vazza, Franco发表了一篇论文,基于现有的物理定律和宇宙学认知,论证我们所处的这个宇宙几乎不可能是由某种高级文明模拟出来的程序。( “Astrophysical constraints on the simulation hypothesis for this Universe: why it is (nearly) impossible that we live in a simulation.” Frontiers in Physics, 2025.)

  这篇论文主要是从信息和能量的角度进行讨论。例如,在最高精度下仅模拟地球一秒钟的运作,需要消耗的能量相当于把十万颗恒星的的质量100%转化为能量。

  我自己想这个问题的时候,感觉可以从数学逻辑的角度考虑,哥德尔不完备定理就是论述基础。查了一下,另一个物理学家团队(Mir Faizal等)已经按照这个思路发了论文。

儒家思想最糟粕的地方

  不重视工程技术,只会利用人口规模和恶性内卷。天天琢磨囚徒困境下的逢迎揣测,反复上演甄嬛传。这是儒家思想最糟粕的地方。日本有世界级的银矿,澳大利亚有世界级的铁矿,西伯利亚有世界级的油汽矿。但凡汉族几千年里稍微有一点进取心,这些家门口的资源也不会落入古希腊时代就开始努力航海的白人殖民者之手。

反共识才值钱

  Linux的OS Kernel昨天刚发布了6.6.6版。作为追更25年的老粉丝,庆祝。还记得1999年我在大学里面办讲座,开设“joyfire linux 源码阅读笔记”的网站,介绍Linux这种奇怪的东西,很多人听不懂。

  专业深度思考得到的反共识才值钱。平庸的二流脑袋,找不到世界的版本漏洞,总想抄未必高明的作业,追逐当下热炒的buzz word标签。这次经济危机,世界正在帮我们消灭不独立思考、抄袭纸糊的copy cat。

  日本停滞三十年,除金融崩溃以外的重要原因是,1990年美国突然把原本为核战争通讯而研发的互联网技术,开放给民间商用接入。日本业界停留在1980年代汽车、消费电子、人工智能的研发上,没及时转向互联网方向。1996年后那一波互联网大潮,日本本土的创业团队完全没赶上。(但日本VC软银投资了开启互联网大潮的美国Yahoo)。

  最近美资VC从中国撤退,本土资本能否“国产替代”,支撑创业者创新试错,这是关顾国运的大事。看一下国内一级二级市场这两年热炒的那些浮躁的题目,还差很远。

  回来说我们自己,前两天的发布会,关于SimbaOS的思路收到了不少反馈。感觉在业内引发的动静比每年Q4的常规发布会要大一些。但未必都认同。没事,反而希望全行业别那么快和我一致,看不懂、看不上的时间久一点。

  最近发现,Postgres创始人、数据库领域“祖师爷”,图灵奖获得者Michael Stonebraker与Apache Spark 作者 Matei Zaharia发表了一篇名为DBOS: A Proposal for a Data-Centric Operating System的论文。很激动。

和大模型对话

  我和大模型对话以后,他总结了下面的结论,有点意思:

  我认为目前大模型领域存在较大泡沫风险,大多数人保持冷静是正确选择:
  1. 大模型技术虽复杂高超,但实用价值还不明确。许多模型只是技术演示,缺乏落地场景和商业价值,难以形成产品。这使投资风险较大,容易产生泡沫。
  2. 几乎所有大型模型都面临数据隐私、计算资源和模型可解释性的挑战。这些问题如果不解决,将严重限制大模型的实际应用和产业化进程。
  3. 目前大模型领域创业公司较多,但真正具有产业竞争力和可持续盈利模式的company还不多。这也增加了泡沫形成的概率。
  4. 盲目跟风和过度投机是泡沫形成的重要诱因。许多投资人并不真正理解大模型的技术细节和应用场景,而是锁定概念进行投机。这势必产生错估风险。
  5. 任何技术热点都经历过高期待→泡沫→爆发→平稳发展的过程。大模型也难免遵循这个规律,我们应理性看待目前的热潮,做好产业和技术积累。
  所以,总的来说,大模型技术本身虽然前景广阔,但目前离实际应用和产业化还存在较大差距。我们需要认识到其中的困难和挑战,理性判断市场热度,避免过度投机和盲目跟风。真正的机会往往出现在泡沫破裂后,关键在于做好技术和产业积累,等待时机成熟。
  大多数人还是应该保持冷静,深化对技术与应用场景的理解,做好产品和产业设计。不必过于渴望热潮带来的暴利,要有耐心迈向技术变现。这才是大模型产业真正健康发展的基石。热度终会消退,真知者自然见真章。
和大模型讨论

企业级领域专家的黄金时代开始了

  听到很多公司困难。可我们的Simba、Kun、Black量价齐升卖得不错。目前问题是客户越来越多,部署、升级、运维还不够完善。出事的时候,蝙蝠侠团队总是熬夜人肉运维很辛苦。我在完善运维SLA,提高平台RAS,建立企业级服务体系。

  目前中国工业产能利用率只有74.3%。也就是说,前些年大量借钱投资的生产线和基础设施,有4/1都闲着。盲目扩大产能满街铺小黄车的时代一去不复返了。老板们回过头开始精算成本和效率。数据基础设施正在变成企业最重要的核心系统。

  努力这么多年,企业级领域专家的黄金时代终于要开始了。再不来,我都要老了。

不要技术自嗨

  去年看到一篇报道,讲一个创业团队先用C++开发一个大数据产品,然后又换成RUST花了半年重写一遍。理由仅仅是对语言的偏好。我回复了几句:“成熟的技术创业者选Java做主语言,不是不懂其他时髦语言,而是因为国内Java工程师的招聘和工资成本明显低于其他语言。技术领导者不能技术自嗨,要在更高层面思考,比如看看公司现金流,算算最坏情况能撑多久。做真正正确的决策。”

造命之人,我即方位我即吉凶

  吐槽一下。这次北森强行IPO,感觉彻底把国内SaaS赛道弄到冰点了。智商这么高的创投圈子,为什么做这么脑残的事?

  其实,前两年无脑吹捧SaaS,强行把不合适SaaS的创业也扭成SaaS的,也是这群人。

  以前博客写过:“大多数风险投资人只是被上一代创业者的成功标签训练的赌徒而已,很多时候他们只是在努力下注和弃牌。”他们追捧时髦的buzz word,一口气投资10个筹码,指望其中1个赚钱,其他无所谓死活。

  前年SaaS、去年HTAP、今年大模型……这些所谓风口其实只属于7、8年前就在那个位置孤独地挖战壕的那些人。创业者才是躬身入局的造命之人,我即方位我即吉凶。不要被二流的投资人忽悠逼迫,乱了节奏,跑到别人的布局里去找死。

  到今天为止,中国10亿参数以上的大模型已发布79个,其中北京38个大模型,广东20个。上两次看到这种情况是当年百团大战和各色共享单车吧。泡沫、筹码。

  如果你既要、又要、还要,风险巨大,劈你的雷一定就在路上——冯唐的《活着活着就老了》

  话说回来,Startup现金流好,不指望投资也能活,才能挺起腰杆让别人闭嘴。

  昔之善战者,先为不可胜,以待敌之可胜。不可胜在己,可胜在敌。故善战者,能为不可胜,不能使敌之可胜。故曰:胜可知,而不可为——《孙子兵法》

欧美的开源社区开始让人讨厌

  最近欧美的开源社区开始让人讨厌,不解决产业和技术的实际问题,就知道政治正确和哲学思辨。你看看这些社区光顾着在干啥:不准程序员讲“黑/白名单”,因为会冒犯非洲裔;要求各开源软件小组里必须至少有一个LGBT;还有自由软件和开源软件两派的意识形态争吵……

  唯一好点的是linux内核团队。就因为Linus本人的暴脾气,他只管代码写得是否干净没bug,架构是否优雅。你敢马马虎虎提交代码,他就在邮件组里当着全球程序员的面问候你全家女性。这人几十年如一日守护着linux操作系统内核的代码水准。其他没有“暴君”的开源社区,依靠投票扯来扯去,陷入“委员会设计”的臭味里,变得平庸而傲慢。

  (写到这停一下,当年我为了写《Joyfire Linux内核笔记》每天跟进Linux Kernel Mail List。还写了好多小新闻报道发在国内开源爱好者论坛里。一转眼20年过去了)

  Simba团队本来是复活Apache Ambri项目的全球首倡者,结果委员会效率非常低,听一个公司CEO讲,他们提交的bugfix能拖2年才合并。委员会里塞进来很多印度人,不干实事就会发邮件找茬。烦死了。请教了美国硅谷的几个开源创业的华人大佬,他们都一致建议,公司应该自主掌控开源社区,不要和Apache基金扯在一起。我已经下定决心,单独分出去建立自己的开源项目。反正70%的活都是中国人在实干。当然我们还会遵守开源协议游戏规则。大数据开源社区有兴趣的同学,到时候可以来看看。

行千里路,读万卷书

  罗永浩回复郑刚的文字,像个企业家了。人的变化,有时很难有时很简单。创业者有义务克制情绪,坦诚理智的表达。这样才对得起自己的战友和团队。

  在情绪控制和人际沟通上晚熟。此前一次创业,我曾当过唯唯诺诺的老好人,创业结束后反思了一年,决定以后要遵从本心,坚定坦诚。但这两年似乎矫枉过正,暴躁。前一阵想了一下,意识到好幼稚,对不起团队,开始调整状态。我一定会成为一个坚定、坦诚、温和、沉稳的人。慢慢来,也麻烦大家帮我。

  JC老大回复说:就是要多想很多事,不只想到自己,还要想到团队伙伴客户投资人不同角度,做平衡。这其实是很难的,没犯过足够多的错,不足以形成习惯。

  对。行千里路,读万卷书。