对硅基生命原理的思考——生存、复制、进化与合作

自然规律奖励的不是瞬间最大功率,而是全生命周期的总耗散量。生命是耗散能量的超级机器。
复制就是共振:如果一个结构能复制自己,那么它消耗能量、制造熵的能力就会呈指数级增长。
自然界没有永恒的朋友或敌人,只有能量效率的共同体。

兜兜转转,还是Drupal好

WordPress
商业化很成功,使用体验很好,三方模块质量很高,就像MacOS。
对于普通用户来说,稍微有点复杂的三方模块都收费不菲。这对模块开发者而言是好事。
适合没精力学习编程,但愿意付费的用户。
一个中型电商网站使用 WordPress 的年均成本约 594 美元,小型用户使用代价巨大。
由于插件注册往往是绑定到域名的,对于拥有多站点、或者需要不断换方向试错的创业者,非常不友好。
许多付费主题(如 Divi、Astra)内置专属插件(如页面构建器),但这些工具与其他插件的兼容性较差。

Drupal
商业化不太成功,学习曲线更陡峭,三方模块大多维护力度不足,就像Linux。
需要具备编程思维和动手能力,且有前端模板开发能力才能真正用好。
更适合DIY能力强(其实就是抠门)的程序员。
但是核心模块足够强大灵活(比如原生支持自定义字段、实体、视图、多语言),大多数模块免费,支持原子化组合。
如果觉得PHP落伍,需要前后端分离,还可以用 Nextjs for Drupal。
再加上AI辅助写前端,开发速度应该不比WP慢。

当前的 AI 编程能力实测

Trae + Claude 3.7 Sonnet:大致75分,还是需要手工修一些代码,并且有的Bug反复尝试10次以上,人工辅助定位了位置,但始终无法修复。可惜就是免费限流了。
Trae + DeepSeek-R1:大致70分。幻觉多一些,也会偷懒,出错概率高于 Claude 3.7 。
VSCode + Cline + Gemini 2.0 Flash Thinking:大致70分。Gemini 2.0上下文窗口很大,可以一次性快速生成超多代码,具备多模态能力,都是加分项。拖后腿的是 Cline,对IDE的集成度、RAG策略还是不够,导致经常陷入Bug反复修改无效。Cline 的MCP功能很好。
VSCode + 通义灵码 + qwen2.5-max :60分以下,因为通义灵码对整个IDE的集成度不够。在不指出引用文件情况下,会导致完全孤立的去修改一个文件,导致全局灾难。

标签

快速、低成本的数字人方案

实时生成数字人视频,成本很高。本文构想了一种浏览器端的数字人方案,借助于AI生成2D模型,成本很低,可交互反馈,适用于教学、培训、动漫等场景。

标签

论大模型时代的原生产品

下一代AI为先的产品形态,交互方式应该是更自然的拟人形态,并不局限于语音文字交流。 应该即是具身智能,拟人交互。又是跨屏跨端,无处不在。 还应该在AR的加持下,全感官、沉浸场景式交互。

陆奇2023.04演讲——我的笔记和思考

思考=模型=知识。泛化:举一反三的能力是泛化。语言,给我们带来最根本的能力,是零样本泛化能力,用来沟通只是语言的副产品。人类有了语言,所以才有第二系统,才能思考。
三位一体结构演化模式:感知(信息系统)→ 思考(模型系统) → 实现(行动系统)

医疗相关数仓建设

主导公司大数据平台产品建设,涵盖 数据采集、主数据管理、数仓、数据服务、标签 几大产品。
主数据管理:建立医百主数据管理系统,主要支持对 医院、医生、药品、会议海报、数据字典 进行人工编辑、审核。
数仓:采用维度建模范式,提供 人、机构 的OneID产品逻辑,HCP、HCO、医学知识、学术等数据模型定义。
指标体系:建立含58个原子指标、70+项维度的指标体系。

项目开始
2020-04-18

宏观经济数据库&分析大屏

建立宏观经济数据库及AI经济学家,对内提升宏观投研效率,对外提供宏观经济自动化解读。宏观经济数据库:企业自有产权的宏观经济数据库,涵盖中国宏观、区域宏观、世界宏观、产业经济等类别数据。宏观经济分析大屏:面向政府及企业高层决策部门,提供对全球、中国乃至区域宏观经济的分析解读及预测。

项目开始
2019-04-01

基于联邦学习的多方数据联盟

2019年,联邦学习作为数据合作的新兴技术,开始在国内传播。我对其进行了学习研究,并应用到了京东数据联盟、钼媒数据平台中。
传统数据打通:把特征或标签数据整合到一方,同时利用双方数据进行训练得到模型,存在隐私数据出库、数据资产外流的弊端。
联邦学习:数据拥有方在不用给出己方原始数据的情况下,也可进行联合训练(交换加密训练参数)并得到足够准确的模型(与传统数据打通建立模型的差距很小),且训练目标为非个体信息或经过用户授权,各方无法反推他方原始数据。

项目开始
2019-10-15