天天观焦点:国产自研:浪潮中前行

北京日报   2023-05-29 07:19:30

时至今日,国产可替代的势头已经“溢于言表”。近年来,高科技企业被列入“实体名单”的情况时有发生,关键领域“卡脖子”情况依然存在。大国博弈时代背景下,关键领域技术和产品独立自主、安全可控的重要意义不断在国际竞争中凸显。

所幸,国内已经出现一批科技企业进入了研发国产可替代、解决关键领域技术难题的浪潮之中。这些企业集中于工业制造、信息产业等行业,在事关国家安全、生产制造、国计民生的领域内打破国外技术垄断,缩短技术差距,加固国产技术护城河,推动我国科技高水平自立自强,为我国社会经济发展保驾护航,成为科技发展和国家竞争中独一无二的“国潮”。

360


(资料图)

360GLM大语言模型:为“国产ChatGPT”的研发提供了一种解题思路

随着ChatGPT横空出世,大语言模型已经成为人工智能领域的重点发展方向,研发竞争空前热烈。业内普遍认为,大语言模型会带来一场强人工智能或者通用人工智能为驱动力的工业革命,但客观情况是,我国目前在大语言模型领域依然在追赶的阶段。360集团创始人周鸿祎曾在接受媒体采访时反思,过去国内对人工智能的研发太过于实用主义。然而,周鸿祎也认为,在两三年内,国内有机会在大语言模型方面迎头赶上。

360为大语言模型领域迎头赶上提供了一种可能,也为“国产ChatGPT”的研发提供了一种解题思路。

5月16日,360和智谱AI宣布达成战略合作,双方共同研发的千亿级大模型“360GLM”已具备新一代认知智能通用模型水准。双方的合作研发是基础模型和应用场景的一次有效结合。周鸿祎曾多次表示,微软作为产业公司补齐了OpenAI的工程化、场景化、产品化和商业化能力,是微软和OpenAI珠联璧合的分工模式促成了这次人工智能拐点的涌现。国内应当建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+OpenAI”组合引领大模型技术攻关。他表示,此次与智谱AI合作,正是借鉴了这种产研协同关系。

据介绍,智谱AI被评价为国内“最具OpenAI气质和水准”的人工智能公司。根据斯坦福大学大模型中心的测评,智谱AI研发的双语千亿级超大规模预训练模型GLM-130B的准确性等关键指标与OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平。而360拥有国内先进的多模态研发团队,在人工智能技术上有长期积累,叠加搜索、浏览器等场景优势,可以在训练数据、强化学习、工程调优、用户场景和商业化等方面提供有益补充。

据了解,通过此次合作,360形成了自主研发+合作研发“双引擎”驱动的大模型布局。在双方的紧密协作下,国产大语言模型技术将获得更加广泛、深入的落地场景,赋能更多行业。

腾讯

金融云:依托产品构建全栈领先的国产数字基座

不只是数据库,云平台等基础软件也都在技术创新和产业应用中快速成长,并在一些领域成为了独当一面的存在。

例如在金融行业,基础软件被国外巨头垄断、金融机构面临成本难题曾是长久以来存在的困局。而金融市场作为“蓄水池”,对资金流通和国计民生至关重要,因此,与金融行业相关的技术和软件自立自强尤为重要。除此之外,央行与金融监督管理局也发布金融科技发展指引,强调在关键产品技术上的自主可控。

值得庆幸的是,金融行业基础软件已经完成国产化替代,现在进入核心系统国产化替代的深水区。

5月11日,在腾讯金融云国产化战略峰会上,腾讯云副总裁胡利明正式发布金融国产化战略:腾讯云将继续加大自研产品投入,联合金融行业合作伙伴共同完善国产化生态,形成自主可控的金融国产化解决方案,并依托产品构建全栈领先的国产数字基座。同时,腾讯云还将携手伙伴,共同构建金融分布式核心解决方案。

在技术底座上,腾讯云提供包括:腾讯专有云TCE、金融原生云TCS、腾讯云数据库TDSQL、TDMQ分布式消息队列、CRedis分布式缓存、Coding研发效能平台等产品,全面覆盖了银行分布式核心系统所需的技术底座,并已在国有大行、股份制银行、城商行、省农信联社等数十家银行核心系统建设中成功交付,而且运转成熟稳定。

其中,腾讯专有云TCE构建了一云多芯国产技术底座。基于腾讯专有云TCE,金融机构能快速搭建出一个符合国家标准的金融级生态云平台。

胡利明介绍,腾讯金融云全栈国产化产品供给能力已实现全国领先,未来将持续加大技术投入打造新一代国产化精品产品。

据悉,腾讯金融云全栈国产化产品供给能力已实现全国领先,底层基础产品已经完成了与众多芯片厂商的国产化适配。截至目前,共有15款产品通过21项工信部质量测试,与合作伙伴完成700余项自主创新互认证。

腾讯云方面表示,腾讯金融云将持续深耕国产化赛道,提高产品核心竞争力,同生态合作伙伴一起,助力金融行业数字化转型走出深水区。

蚂蚁集团

OceanBase:让国产数据库走向田间地头

数据库事关国计民生。社会运转的每个时刻都会产生海量数据,而海量数据的存储、管理和调用都离不开数据库。然而事实上,国内数据库领域技术实力在过往很长的时间内相对薄弱,这使得数据库成为了国家35项“卡脖子”的关键技术之一。

在此背景下,国产数据库领域一直努力打破国外技术垄断,试水突破新技术。可以看到,目前国产数据库已经发展成熟,并开始尝试走向通用,试水对生态化开放。

3月25日,首届OceanBase开发者大会在北京举行。大会发布了OceanBase 4.1版本,公布两大友好工具,升级文档易用性,统一企业版和社区版代码分支,全面呈现了OceanBase打造极致的开发者友好数据库的成果。

与此同时,OceanBase首次公布了四项“开发者友好”实践。一是,发布了OceanBase 4.1版本——事务处理性能提升40%,数据分析性能提升15%,旁路导入平均将加载数据的性能提升6倍,新增租户级别物理备库以及更细粒度的资源隔离能力,全面兼容MySQL8.0版本,更通用、易用。二是,推出向导式的安装部署,降低了使用分布式数据库第一道门槛。三是,推出场景化文档,解决文档“不好找、不好用”的问题。长期以来,国产数据库技术文档劝退了一批数据库爱好者。Ocean-Base结合外界反馈的问题和建议,从贴近用户视角和场景做设计,重构了7000多页文档。四是,宣布将整体研发流程迁移至外部,统一企业版和社区版代码分支,同时宣布即将开源三大开发者工具,迈出了走向生态化开放的重要一步。

OceanBase CTO杨传辉在大会现场表示:“OceanBase将持续降低开发者使用门槛,全面提升OceanBase的易用性,打造真正对开发者友好的数据库,建设开放的技术生态,让国产数据库走向田间地头。”

据了解,截至目前,OceanBase已实现全行业应用场景覆盖,助力金融、政务、运营商、零售、互联网等多个行业的400多家客户,实现了关键系统升级。Ocean-Base资深研发总监易鸿伟表示:“Ocean-Base已经从金融走向通用,打破了过去分布式数据库只能支持大企业、大客户的思维定式,可以更好地服务中小企业。”文/李濛

OceanBase创始人、首席科学家阳振坤:

在数据库国际竞争中“换道超车”

生活在这样一个移动互联网的时代,每个人每天都在生产着大量的“数据”。我们的出行记录、消费记录、浏览的网页、发送的消息是数据,我们听到的音乐、看到的视频同样也是数据。通常来说,这些庞杂的数据会被按照一定的规则,存放在一个名为“数据库”的仓库中。

半个多世纪以来,全球数据库行业在技术和应用上一直处于相对稳定的状态,市场份额上则主要把持在Oracle(甲骨文)等几家欧美公司手中,中国市场亦是如此。相关数据显示,2020年全球数据库市场规模为671亿美元,其中中国数据库市场规模为35亿美元(占全球5.2%),几乎被国外品牌的数据库所垄断。

如果用一个很形象的比喻来说明这样的状况,那就是在过去几十年里,我们把很多重要的信息和数据存放在数据“仓库”中,但实际上这些仓库的钥匙却并不在我们自己手中。直到2010年,阳振坤的一次全新的尝试开启之后,让中国数据库市场开始有了一些新的变化。

阳振坤现任蚂蚁集团副总裁,同时也是OceanBase的创始人、首席科学家。2010年,45岁的阳振坤开始带领团队完全自主研发分布式关系型数据库OceanBase。经过十余年的自主创新,目前OceanBase已获授权发明专利202项,申请发明专利350余项,软件著作权19项,发表论文40余篇,主导和参与国家/行业/团体标准超25项,出版中文专著1部。成果300万行核心代码已基于木兰许可协议并采用OpenCore模式对外开放,致力于构建我国自有产权的数据库产品技术路线和生态体系。

在经历的各项“实战”中,OceanBase已连续10年稳定支撑“双十一”,创新推出“三地五中心”城市级容灾新标准,在2019年和2020年两次刷新了“数据库世界杯” TPC-C的世界纪录,成为榜单上首个分布式关系型数据库。目前,OceanBase已成为金融级数据库核心系统升级的首选。

据公开数据显示,目前,OceanBase已应用于超过1/4国内头部金融机构,并从金融开始走向国计民生、走向海外,现已服务工商银行、建设银行、交通银行、浦发银行、中国人寿、中国人保、中华财险、招商证券、山东移动、江苏移动、中石化、海底捞、理想、GCash等,助力政府机构、金融、运营商、零售、互联网等多个行业的400多家客户实现关键系统升级。

在业内人士看来,OceanBase的成功研发和规模化应用,验证了国产数据库技术在“换道超车”上的可行性,为数据库领域的国际竞争提供了新的赛道与空间,既为各行业分布式架构转型奠定了坚实的基础,也为国家关键行业信息基础设施安全和信息安全保障贡献了力量,还为国家“双碳”战略提供了有力的科技支撑。

在“正国潮”策划全面展开之际,我们专访到了这位自称“蚂蚁集团最老程序员”的阳振坤。他在很多问题上的开诚布公和独到见解,让我们对数据库行业有了全新的认识。

北京日报:OceanBase为什么专注于国产自研数据库?国内市场和产业的发展对于国产数据库有哪些需求?

阳振坤:关系数据库是整个社会的关键信息基础设施,支撑着整个国民经济和社会发展运行。数字经济的高速发展,使得关系数据库从商场、酒店、工厂等封闭环境走向了互联网等开放环境,传统的集中式数据库如Oracle等无法解决像“双十一”这种场景对数据处理的需求,全世界也没有成熟的解决方案,分布式关系数据库OceanBase应运而生。

其实国内市场与产业的发展,对国产数据库的成本要求、可扩展性及数据实时分析能力都有明确的需求。通俗理解,成本要低,性能不能低。现在,OceanBase也在淘宝、支付宝等业务场景得到了很好的打磨,并在国内银行、保险、证券、能源、通信、政务等领域得到了广泛的使用。特别是,在金融机构的核心系统升级里,OceanBase的性能优势体现得尤为明显。

北京日报:区别于国外的数据库,OceanBase在打造国产自研数据库的过程中,在技术上取得了哪些重要突破?这样的国产自研技术对于北京市打造信创产业高地意味着什么?对于国家的战略发展意味着什么?

阳振坤:OceanBase从第一天开始,走的就是完全自主研发的模式,独创了原生分布式数据库的路线和技术,以及到现在的单机分布式技术。研发之初,这些都是别人所没有的,完全和别人不一样。从技术角度来看,OceanBase是分布式数据库的开创者也是引领者,到今天为止,国内大部分还是基于中间件的分布式或者是基于云的共享存储模式,它们其实都是“集中式+”的概念,OceanBase已经是原生分布式,以及单机分布式。在这个维度上,我们是打破了数据库的技术边界的。

事实上,中国的基础软件已经进入有能力进行根创新的阶段,全球关系型数据库产品和技术都在从集中式走向原生分布式,国产数据库也不例外。国产数据库需要积极、主动参与国际竞争,努力成为全球主流数据库。

数据库作为三大核心的“卡脖子”工程,如果能在数据库自研的高地上走出来,必将助力北京的相关产业,同时北京大力发展基础科研的相关政策和举措,也必将有利于像数据库这样的基础科研的突破。这是一种联动模式,对国家来说也是种新型模式的探索。我们需要有信心,同时要有战略定力,只要坚持长期投入,未来国产数据库一定会迎来大爆发。

北京日报:今年三月份,OceanBase宣布开源三大开发者工具,迈出了走向生态化开放的重要一步。开源和生态化开放对于OceanBase来说意味着什么?对于国产数据库的发展来说有什么意义?

阳振坤:数据库的发展,生态是非常核心和关键的。其中,人才培养是数据库行业发展的基石。OceanBase自成立以来,就非常重视数据库人才培养,与华东师大、武大等国内众多高校共建联合实验室、课题研究中心,共同输出论文、专利和科研成果,以及积极参与国产数据库课改合作,用企业的力量去解决学校理论教育和实际工作脱节的问题。

在这个过程中,我们研发了专门锻炼学生内核开发能力的MiniOB教学实战平台及配套教材教程,还连续举办两届OceanBase数据库大赛,通过实际行动助力数据库人才生态建设。

开源,可以让更多的人用起来,让更多的人了解和使用这些工具,从而在这个基础上进行创新。开源最大的好处是可以降低学习门槛,提供共享的学习氛围和工程实践的测试场景,建设一个健康、繁荣的生态。2021年6月,我们正式开源300多万行代码,采用中国的木兰开源协议。开源以来,OceanBase社区版收到了很多开发者和行业用户的积极评价,在互联网、银行、保险等行业用户的生产环境中开始被试用和使用,累计逾300家客户进行了深度实践,其中包括携程、知乎、快手、翼鸥教育、作业帮、翼支付、浦发、360、58同城等客户。

OceanBase已连接了3万多的社区开发者,从2022年10月份开始OceanBase在中国数据库流行度榜单墨天轮上已连续6个月排名第一,在全球数据库流行度榜单DB-engines 排名126名,位居国产数据库前列。只有越来越多的企业参与到自研数据库的生态中来,数据库的产业才会更加地蓬勃发展。

OceanBase正在构建以合作伙伴为中心的商业模式,期待和更多的产业生态进行深度合作,共同推进数据库产业的发展。

北京日报:您对OceanBase的发展有什么期待?

阳振坤:OceanBase要做一个“顶天立地”的技术。“顶天”就是技术上要不断追求新突破,“立地”就是要把技术做成通用产品,让整个社会都能普遍使用。Ocean-Base诞生之初就有着天时地利人和,这是千载难逢的机会。数据库行业是个重研发,长期主义的事,OceanBase会一直努力下去,为中国数据库在世界范围内立足而努力下去。让自研的分布式数据库突破技术边界,走向世界顶峰,并落地千行百业,我们一定要做,而且一定能做成。文/刘洋