全球报道:这将是一场灾难？37年历史的PostgreSQL数据库将进行重大架构变更

2023-06-24 15:34:56 互联网

编译 | 核子可乐、Tina

在瞬息万变的开源世界中，软件项目来得快、去得也快。如今获得广泛追捧的工具，很可能在短时间后就被更好的成果取代，再也无人问津。但即使在这样残酷的环境下，也有不少项目能够长期保持生命力。

PostgreSQL 数据库系统就是其中的典型，其历史可以追溯到 1986 年的伯克利 POSTGRES 项目。经过几十年的发展，作为一款跨平台、免费和开源的数据库软件，PostgreSQL 应用已经相当广泛：根据 Stack Overflow 2023 开发者调查数据显示，PostgreSQL 甚至超越了 MySQL，成为开发人员首选。

【资料图】

对拥有如此悠久历史的大型代码库做根本性变更绝非易事，但项目开发团队正在认真考虑这种可能性，希望让 PostgreSQL 脱离长久以来的面向进程模型。

任何 PostgreSQL 实例都是以大量协作进程的形式保持运行，其中包含一个用于所有接入客户端的进程。这些进程使用精心设计的库通过多个共享内存区域进行彼此通信，而这个库的作用就是在内存设置各异、映射地址不同的所有进程之间建立起复杂的数据结构。

多年以来，这套模型一直兢兢业业地支撑整个项目。但随着项目发展，现实世界正在发生巨大变化。因此，PostgreSQL 开发团队意识到必须尽快调整、顺应现实的潮流。

一份提案

今年 6 月初，Heikki Linnakangas 在经过一系列线下讨论之后，发布了将 PostgreSQL 转为线程模型的提案。

我觉得现在大家已经达成了强烈共识，比以往任何时候都更支持这项重大调整。实现这个目标需要投入大量精力、讨论很多细节，但团队高层对这个基本思路没有异议。

这封电子邮件的发布，就是想把这种沉默的共识变成明确的发展路线。

其中简要概括了这项迁移所涉及的种种挑战，并低调地承认转化过程“肯定无法通过单一版本彻底完成”。但邮件中没有提到推动这项重大变更的原因，好在随着讨论的进行，相关信息很快得到了补充。正如 Andres Freund（PostgreSQL Developer & Committer，EnterpriseDB 高级数据库架构师）指出的那样：

我认为原有流程模型开始产生诸多限制，这个问题在大型设备上体现得尤其明显。跨进程上下文切换所带来的开销，原本就比在同一进程内的不同线程间切换要更高——我估计这种开销还将持续提升。面对大量连接，整个体系最终一定会因 TLB 未命中而浪费大量时间。这是进程模型无法跨进程共享 TLB 的天然属性造成的必然结果。

他还提到，进程模型也增加了开发成本，迫使项目不得不维护大量重复代码，包括在同一地址空间内保留本不必要的多种内存管理机制。在随后的消息中，他还补充称由于线程全部运行在同一地址空间之内，因此可以更高效地实现状态共享。

但有部分开发人员反映，Linnakangas 所说的“强烈共识”可能并没有那么强烈。Postgres 的主要贡献者 Tom Lane 表示，“我认为这将是一场灾难，大量原有代码将受到影响。”他随后补充称，此次调整将带来“巨大”成本，产生“不止一个安全级 bug”，也无法证明其收益超过成本投入。有人提出，目前还有其他一些高优先级工作值得早做打算。也有人担心随着进程模型被淘汰，原本基于各独立进程的隔离性将被打破，导致系统的整体健壮性受到破坏。

尽管如此，大部分 PostgreSQL 开发者还是以谨慎乐观的态度支持、至少愿意尝试这一改动。EnterpriseDB 副总裁、首席数据库科学家，PostgreSQL 主要贡献者 Robert Haas 表示，PostgreSQL 在大型系统上的扩展性确实不佳，主要就是因为所有进程都在消耗资源。“其他很多数据库并不存在这个问题。如果不进行某种重大的架构变更，PostgreSQL 将无法克服这个难题。”

也许单纯转向线程模型可能还不够，但他认为这将为其他后续改进开个好头。

从提案到现实

将 PostgreSQL 服务器的核心转移至单一地址空间，几乎必然带来诸多挑战。正如 Haas 等研究人员所指出，其中最大的问题就是服务器“目前正频繁使用全局变量”。具体来讲，当每个服务器进程都拥有自己的集合时，全局变量就能良好运作；而在用线程加以替代时则会引发问题。根据 Konstantin Knizhnik 的说法，PostgreSQL 服务器目前使用约 2000 个全局变量。

开发团队随后讨论了该问题的几种解决思路。首先是将所有全局变量拉入统一的“会话状态”结构，而这套结构具备线程本地化属性。但考虑到需要创建并维护的是需要容纳 2000 个变量成员的复杂结构时，这个提议因为可行性太低而很快失去了吸引力。另一种方法是直接把所有全局变量放入线程本地存储内，这种方法倒是简单可行，但大量使用线程本地存储会导致性能损失，损耗转为线程模型带来的收益。Haas 指出，对全局变量做明确标记（包括将其放入线程本地存储）本身也有积极的意义，可说为减少全局变量的使用开了个好头。Freund 赞同这个观点，并表示即使后续没有全面转向线程模型，这项调整也将有所回报。

但 Freund 也警告称，将全局变量转移至线程本地存储只是这项工作中最简单的部分：

在此之后，重新设计 postmaster、定义如何处理扩展库、扩展兼容性、开发工具以实现线程化 postgres、在会话生命周期内建立新的内存分配和释放机制（以往是通过退出进程实现内存释放）、保证变更的可审查性和可移植性等等，全都是更加困难的工作。

这里还有一个讨论热度不高、但却非常有趣的观点，即 Knizhnik 已经完成了 PostgreSQL 的线程端口。他说全局变量的问题并不是那么难以解决。他在配置数据、错误处理、信号等方面遇到的麻烦还更多。另外，支持由外部维护的扩展也是个重大挑战。可尽管如此，他还是认可转向线程模型所带来的一系列显著回报，只是提醒项目决策层在采取任何行动之前，务必要认真做好研究分析。

PostgreSQL 开发团队还想到了另一个复杂问题，即是否可能同时支持基于进程和基于线程两种模式。在继续支持进程模式的同时引入线程架构不仅极为困难，而且会显著增加项目的总体维护负担。但 Haas 坚持认为，PostgreSQL 绝对不可能彻底放弃对进程模式的支持。毕竟线程在一部分用例中的性能反而更差，也有不少重要扩展无法在线程模式下正常运行。他强调称，只有在确认线程架构运行良好之后，才可能认真讨论要不要彻底放弃进程支持。

目前无论是从邮件讨论还是从社交媒体平台投票结果来看，大多数 PostgreSQL 开发者认同架构转换的理论收益。

并且，数据库管理系统 Peloton 早在 2015 年就已经尝试让 PostgreSQL 多线程化了。至于 PostgreSQL 本身，从讨论到具体实施落地还有很长的路要走，更重要的是，需要有人主动请缨、表示愿意投入时间来推进这项工作。

Peloton 的《Postgres 架构变更公告》：

最初，Postgres 采用的是多进程架构。其中主进程名为 Postmaster，负责处理 Postgres 接收到的请求，以及启动、关闭等系统层面的操作。请注意，Postmaster 本身并不执行这些操作，而会派生出子进程来执行操作。再有，处理用户查询的 backend 也是由 Postmaster 分叉而来。这种架构非常适合基于磁盘的数据库，因为磁盘可以作为大容量共享存储。由于 peloton 充当主内存数据库，多进程架构导致不同后端和 peloton 数据库间的信息共享变得极其困难。在早期的尝试中，我们曾考虑用共享内存让 peloton 从每个分叉的 backend 处获取查询计划和其他信息。但结果证明其性能慢得令人无法接受，因此我们最终决定将 Postgres 转为多线程架构！

参考链接：

https://news.ycombinator.com/item?id=36393030

https://lwn.net/SubscriberLink/934940/3abb2d4086680b78/

https://github.com/cmu-db/peloton/wiki/Postgres-Modifications

声明：本文为 InfoQ 翻译整理，未经许可禁止转载。

今日好文推荐

“AI孙燕姿”爆火后，Meta发布通用语音生成AI：可合成6种语言，支持多种语音功能

Nature 总结六大 ChatGPT 编程技巧：是非常强大的编程辅助工具！

AI之下没有秘密：网友诱骗ChatGPT激活 Windows 11，ChatGPT落入陷阱！

“偷”代码建起公司、学历造假、6天拿下1亿美元却拖欠工资，这位AI独角兽CEO屡遭质疑后亲自回应了

杨立昆：生成式AI还不如狗聪明；谷歌建议员工不要将机密内容输入Bard；王小川公司发布开源大模型｜ AI一周资讯

你也「在看」吗？

图片合成技术（tif图片合成分解器） 天天热资讯

全球微资讯！duvetica中国专柜_duvetica

origin没有安装 模拟城市5（origin没有安装）

kindledx（关于kindledx的基本详情介绍）

天天观速讯丨师旷劝学字词翻译（师旷劝学的翻译是）

宁夏银川市开展为期一个月公共安全隐患排查整治专项行动

俄总统普京将发表讲话_环球即时

资讯推荐:41℃高温把盆里的衣服晒冒烟了 衣服有被火烧过的痕迹

环球消息！走进柯拉丨全球领先的水光一体“数智化”原来这么给力

微动态丨党建引领促共建 端午“粽”情暖民心

河南省西平县发布大风蓝色预警 全球快播

股指仍在60均线压制，市面抛售的情绪还存在 环球播资讯

年轻人对零食的爱，淡了？_每日热门

苹果和华为“撞车”，万众期待的Vision Pro，难以在国内上市？|全球热讯

埏埴是什么意思？ 埏怎么读？埏的读音|天天聚看点

平罗农村宅基地制度改革经验在全区推广 天天新动态

当前时讯：他爆料称，宋仲基多次带凯蒂到片场，表现自然还以为是工作人员_实时焦点

每日聚焦：赞！一人支教众人支援 这位支教大学生有个给力“后援团”

【独家焦点】最大可达30mm：新版NFC计划扩大6倍接触范围

环球观天下！保护知识产权激发创新活力

大乐透23071期金银胆码推荐|全球焦点

当前聚焦：【美】历史经典的哥特式玫瑰园别墅

榴莲壳煮水喝要煮多久，榴莲壳煮水喝要煮多久才能吃

楼顶种菜隐患多，宝山“城管蓝”及时治理复原貌|环球热点

全球即时看！来了！2023年广西高考文史、理工类一分一档表

2023年人力资源服务概念上市公司是哪些？（6月24日） 全球独家

头条焦点：辽宁省鞍山市发布大风蓝色预警

微头条丨宁夏银川市开展为期一个月公共安全隐患排查整治专项行动

考后“心”锦囊！这份心理调适指南，送给高考后的你们

内蒙古自治区呼伦贝尔市发布高温黄色预警 全球报道

花与茶携手 芳香满园名满天下 全球热点评

常州：端午民俗出新意 传统文化焕生机_微动态

水滴公司荣获《机构投资者》“2023年度最佳ESG”

世界报道:2023粤港澳车展：新款捷豹F-PACE售价47.2万起

【全球速看料】微软拟议收购动视暴雪之前，曾计划收购 Zynga 游戏公司

强力家具贵吗 强力家具网上商城

连破纪录！北京现史上首次40℃“三连击”

江南华南仍有大范围强降水?华北黄淮等地高温天气持续|热点评

返程大军来了！长三角铁路24日预计发送旅客302万人次_天天快消息

百事通！日引流200+！贼安全的一套小红书引流技巧！

天天热点评！上海电视节揭晓白玉兰奖 《人世间》《县委大院》夺冠

副中心这里将添国际知名主题亲子乐园！引进头部娱乐IP|环球热消息

香港机场一国泰航空客机中止起飞 机上乘客被紧急疏散

上海星璨整形医院好不好

全球时讯：华为语音助手怎么关闭_华为语音助手叫什么

全球动态:端午假期民航预计发送旅客534万人次

世界即时看！绿皮火车图片_绿皮火车的时速

哇哦，迪卡侬造车了！！！

河南省普通高中学业水平测试成绩查询_学业水平测试成绩查询2018

新疆打造“文化+美食+旅游”城市名片 多地开启“人从众”模式

当前关注：创意大发！如何制作塔罗牌，送给心爱的男友，让TA惊喜连连

重庆四环来了！将形成“四环二十二射六十联线”高速公路网布局_全球播报

全球今热点：苹果修复全平台系统中Triangulation 漏洞，黑客可利用其传播木马

鱼胶的食用方法 鱼胶的食用方法和功效|焦点观察

天天即时：满屏皆空！两大利好消息，A股，节后会稳吗？

孙杨多高_关于孙杨多高的介绍

2023新乡医学院招生计划-各专业招生人数是多少-今日观点

xcode怎么把英文调成中文（xcode怎么设置成中文）

FIBA3x3官推晒文班姐姐打球视频：我们最喜欢的文班打3x3 全球微头条

纽约记者：尼克斯内部有一些人士有意迪文岑佐_热消息

贫民窟女孩，却压倒“双琪”嫁给千万女生宠爱的男神并独揽经济大权！ 全球热消息

新动态：泡好的干豆角几分钟能煮熟?

环球焦点！陆丰市第四期“陆丰味道”就业创业人员技能培训班圆满结业

这份心理调适指南，送给高考后的你们

俄军方：将确保不参与叛乱的“瓦格纳”武装人员安全

世界观天下！高考成绩今日15:00公布 七大官方渠道可查

2023年厦门公积金贷款条件及要求是怎样的? 天天快消息

环球视点！射频消融术百万医疗报销吗？报销比例是多少？

节令美味贺端阳！古人吃粽子有啥讲究？-全球最资讯

当前热点-霍格沃茨之遗亚利桑德拉巨怪逃课方法攻略

北部湾5.0级地震有破坏性影响吗？ 海南地震台回应|世界信息

每日看点！西安感染者增加丨已进入高发期，陕西疾控重要提醒→

环球最资讯丨北部湾发生5.0级地震 震源深度20千米

环球速看：我市重拳整治“小卡片”

今日正式开通运营！“双11”的双向奔赴来了！攻略

奋战二季度！中关村顺义园加快推动园区经济高质量发展

出库单据打印软件 出库单打印软件免费版|世界讯息

热评丨“端午+”，让传统佳节推陈出新

观察：41岁凯特王妃初现赛马会，意外穿大红色很醒目，顽皮小动作示爱威廉

盐城市网球中心党支部召开廉政工作会议

图片合成技术（tif图片合成分解器）天天热资讯

origin没有安装模拟城市5（origin没有安装）

资讯推荐:41℃高温把盆里的衣服晒冒烟了衣服有被火烧过的痕迹

微动态丨党建引领促共建端午“粽”情暖民心

河南省西平县发布大风蓝色预警全球快播

股指仍在60均线压制，市面抛售的情绪还存在环球播资讯

埏埴是什么意思？埏怎么读？埏的读音|天天聚看点

平罗农村宅基地制度改革经验在全区推广天天新动态

每日聚焦：赞！一人支教众人支援这位支教大学生有个给力“后援团”

2023年人力资源服务概念上市公司是哪些？（6月24日）全球独家

内蒙古自治区呼伦贝尔市发布高温黄色预警全球报道

花与茶携手芳香满园名满天下全球热点评

常州：端午民俗出新意传统文化焕生机_微动态

强力家具贵吗强力家具网上商城

天天热点评！上海电视节揭晓白玉兰奖《人世间》《县委大院》夺冠

香港机场一国泰航空客机中止起飞机上乘客被紧急疏散

新疆打造“文化+美食+旅游”城市名片多地开启“人从众”模式

鱼胶的食用方法鱼胶的食用方法和功效|焦点观察

贫民窟女孩，却压倒“双琪”嫁给千万女生宠爱的男神并独揽经济大权！全球热消息

世界观天下！高考成绩今日15:00公布七大官方渠道可查

北部湾5.0级地震有破坏性影响吗？海南地震台回应|世界信息

环球最资讯丨北部湾发生5.0级地震震源深度20千米

出库单据打印软件出库单打印软件免费版|世界讯息

涪陵：端午小长假又添新去处市内海拔最高摩天轮开放

【环球播资讯】国产CPU做出512核心 8路主线全面提升50%

【快乐骑行】古稀老人骑行团打卡邢台齐夸泉城风光好

湖南前行科技有限公司环球热头条

图片合成技术（tif图片合成分解器）天天热资讯

拍照怎么摆姿势更自然些_拍照怎么摆姿势更自然环球播资讯

origin没有安装模拟城市5（origin没有安装）

祥生控股集团：安永辞任公司核数师已接获港交所复牌指引

国产CPU做出512核心 8路主线全面提升50%

江西庐山1：5不敌武汉三镇止步2023赛季足协杯第三轮

北方此轮高温天气还将持续这份防暑指南助你熬过高温“持久战”_全球热门

资讯推荐:41℃高温把盆里的衣服晒冒烟了衣服有被火烧过的痕迹

天天热头条丨市场监管总局：推动气瓶安全排查整治加强燃气用品质量安全监管

三天涨超20%！工业富联最新发声全球新消息