中国数据库排行榜

DB-Engines想必大家都不陌生,该网站统计全球数据库的排行榜。一直困扰于我的是中国数据库排行榜又是怎样的?为此,花时间用Python写了一爬虫,抓取国内数据库的一些统计数据,制作中国数据库排行榜

中国数据库排行榜的计算方式基本和DB-Engine类似,然而根据国内做了一些调整,统计的数据维度有:

  1. 当月相关数据库网页数量:国内搜索引擎当月抓取的网页数量
  2. 当月微信公众账号相关数据库发文量:国内大多通过微信公众账号取代传统的博客来进行技术传播
  3. 当月微博相关数据库讨论数量:微博能反应国内对于相关数据库的讨论热度
  4. 51job职位信息数据量:反应当前该数据库的就业情况,51job是老牌的猎头服务公司
  5. 拉勾网职位信息数量:反应当前该数据库的就业情况,拉钩网是新兴的猎头服务公司

可以看出,所有数据都是第三方产生,不会因个人的喜恶而产生大幅的变化,因此该榜单的权威性不容忽视

中国数据库排行榜 —— 2017年1月

先看中国数据库排行榜Top 20:

中国数据库排行榜 · 2017年1月-势活
中国数据库排行榜 · 2017年1月-势活

中国排名第一的数据库是MySQL,第二位是Oracle,但两者的分数还算比较接近。排名第三的是Microsoft SQL Server,与DB-Engines一样,但是在得分上落后前两者非常多,这与国内的形式来看也基本一致。排第4的是现大热的文档数据库MongoDB,也符合预期。

但是仔细看会发现,Top 10中总共有3个MySQL数据库版本,分别是MySQL(第1)、Percona(第7)、AliSQL(第8)。如果看Top 20,则总共有5个MySQL数据库版本,除了上述还有MariaDB(第12),InnoSQL(第18)。可见MySQL在国内的流行程度。

Redis和Memcached也入选了Top 20,但Redis得分比Memcached高不少,这也反应当下这两类缓存的流行度。

比较出乎意料的是,Spark SQL排进了前十,超越好战友HBase(第14)和Hive(第17位)。看来国内大多数人和我的观点一致,看好Spark SQL,未来有希望成为大数据平台的一哥。

国产的数据库TiDB和巨杉也进入了Top 20,分别排名第11和15位。TiDB非常不错,希望能早日进入Top 10。身边也有好多朋友问我对TiDB的看法,的确最近比较火。

文艺男屌丝的心头好PG(PostgreSQL)排名第13,想比全球DB-Engines的榜单下降不少,这就是国内PG尴尬的现状。而PG的好基友GP(GreenPlum)未能入选Top 20,略感失望,排名25。

国产数据库排行榜

中国数据库排行榜 · 2017年1月-势活

比较意外的是OCeanbase的排名比较低,微信公众账号甚至当月没有一篇相关的技术文章。这是内部被淘汰的节奏嘛?双11已过,咋还不见出来晒太阳,吹牛逼呢?同样命运的还有之前浪潮的K-DB。

想要查看完整的榜单吗?请点击此链接