Skip to main content

Databend 北京 meetup 技术交流总结

· 7 min read
wubx
Data AI

在 AI 大火的背景下,数据库公司基本都在规划着如何与 AI 结合,也就有了这次活动。我想约一下同行朋友一起交流,看看 Data + AI 或是 AI + Data 这两个方向会碰撞出什么样的结果。本次活动邀请到:

  • BoHu (张雁飞) Databend Labs 联合创始人 《Databend 技术演进之路》
  • 白珅 《Databend 向量索引:加速 AI 应用的数据引擎》
  • 李仲舒 TiDB 社区架构师 《AI 时代,一栈式数据底座 TiDB 赋能企业数智化转型》
  • 赵燕 亚信 数据产品部 架构师 《数据平台向 AI Native 的演进》

本次到场近 30 位技术从业者,都对 Data 和 AI 充满期待。

第一个分享是 Bohu 带来的《Databend 技术演进之路》,介绍了 Databend 从结构化数据的 OLAP 到半结构化数据处理,再到利用向量处理半结构化数据,最后还展示了利用向量计算为棋手匹配对战队友的案例。

第二个分享是白珅的《Databend 向量索引:加速 AI 应用的数据引擎》,讲解了向量索引的实现以及复杂查询中标量条件和向量条件如何结合。

第三个分享是李仲舒的《AI 时代,一栈式数据底座 TiDB 赋能企业数智化转型》,讲解了 TiDB 在 AI 领域取得的成果,同时介绍了 TiDB Serverless 和 TiDB Local 版本的区别及定位。

第四个分享是赵燕的《数据平台向 AI Native 的演进》,分享了亚信在政企、通信行业的 AI 实践和落地,以及 AI 和 Data 结合的实现方案。

四个分享都很有深度,内容丰富。后续拿到 PPT 后我会进一步为大家解析。每个分享后都有不少问题提问,互动非常良好。会上有几个比较有意思的问题,这里挑选三个与大家探讨:

问题1: AI 和 数据库会不会出现超融合的数据库? 目前大家普遍认为这是一个趋势。从现场看,Databend、TiDB 都已经集成了 vector 类型及对应的索引,业界的 OceanBase、Snowflake 等产品也都有类似的方案。

这方面大家更关注的是 WHERE 条件中标量条件和向量条件结合后的执行状态,Databend 在这方面有一个成本评估机制,会决定优先使用哪种实现方式。

问题2: Chat2BI 是不是一个不错的方向? 从亚信的落地案例来看,Chat2BI 是一个很有前景的方向,未来可能会发展成为公司的"数字 CTO",能够更加理性地帮助企业做出决策。

问题3: Databend 有没有行业定位? 没有特定行业定位。Databend 和 TiDB 都属于基础软件,不具有特定的行业属性,但各有其适用范围。

会后,与会者围成一圈进行了深入探讨,其中几位来自其他公司的内核开发人员提出了一些技术疑问。令人惊讶的是,来自中电的朋友对 Snowflake 非常了解,现场比较分析了 Snowflake 和 Databend 的异同。

这个活动让参与的人还是挺感概的, 大家聚在一起, 有很多也是第一次见面用技术话题把大家串联起来,探讨着工作遇到的问题和对未来技术的思考,最后很多朋友相互加了微信。

我目前长期在福州工作,趁着这次活动回北京,也拜访了一些朋友。与朋友交流后,我的主要感触是:

  1. 互联网行业确实在萎缩,特别是教育行业,经历了一次生死考验后才逐渐恢复。大多数公司仍保持着拼搏的心态,努力"留在桌面上"(很多公司仍强制加班到晚上10点)。目前来看,只有小额贷款公司的业务特别火爆。我感觉北京的公司整体战斗力仍然很强。
  2. 企业招聘减少,人员流动性降低,许多人似乎暂时失去了对新技术的追求热情,取而代之的是对 AI 的焦虑。有些公司仍在使用10年前的设备,服务器还是配备 SATA 硬盘。我认为这类公司的管理层应该意识到:既然已经支付了员工工资,提升设备性能其实可以大幅提高生产效率,是值得的投资。
  3. 约见的朋友中,很多人需要频繁出差。有些虽然常驻北京,但经常一个月都在外地。大多数朋友不是在客户现场就是在去客户现场的路上,过着"牛马流浪"式的生活。
  4. AI 创业仍有不少机会,我接触的多位朋友都在从事 AI 相关的创业项目。AI 行业的工作强度极高,通宵加班、晚上10点下班、周六上班都是常态,大家都在与时间赛跑。尽管如此,每个人都相信这个方向未来有 1000 倍甚至 10000 倍的增长潜力。

💬 社区支持
有问题与我们的团队联系:Slack

微信:82565387