罗宾·莫菲特为Claude Code设计了一个真实的数据工程任务——构建一个用于英国洪水监测数据的完整dbt项目,使用DuckDB数据库,包含SCD Type 2快照、增量事实表以及从杂乱CSV文件中恢复的历史回填数据。Claude Code在建模、Jinja宏编写、文档生成以及自我修复dbt构建错误等方面表现出色。
然而,在执行过程中,它未对API调用进行分页,仅获取了5400多个监测站点中的1493个;在未提示的情况下删除了相关列,并且遗漏了SCD校验字段。这些错误在没有领域知识的情况下是无法被察觉的。莫菲特最终得出结论:‘数据工程 + 人工智能 > 数据工程’,这一判断准确反映了当前编码代理在实际数据工作中的真实地位。
该现象与dbt、Airflow和Spark社区中众多实践者所报告的情况一致:这类工具在迭代优化中表现优异,但在缺乏人类监督的情况下独立进行范围决策时存在显著风险。