中关村论坛探索中国大模型发展:发展初期鼓励开源开放,基础研究仍需创新强化
当下,人工智能发展正迎来新拐点。ChatGPT的爆火引发“千模大战”,“中国企业如何在大模型研发的竞争中不落于人后”也成为最近2023中关村论坛上的热门话题。
目前,中国大模型技术正沿各技术路线迅速发展,在自然语言处理、机器视觉和多模态等领域涌现出盘古、悟道、文心一言、通义千问、星火认知等多个具有行业影响力的预训练大模型,未来也将有更多大模型为各行各业带来新的效率革命和体验升级。
多名业内专家在中关村论坛期间表示,目前正处于发展AI大模型的历史机遇期,大模型应用已经逐渐走向实体经济,为了不断寻求在通用人工智能技术方面的突破,补齐底层算法、关键软硬件和生态体系建设短板,我国人工智能产业仍需进一步加强产学研合作,鼓励大模型开源开放的同时,加强自主创新研发。
大模型即将带来产业应用新变革
“当下我们正处在一个全新的起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,也即将改变世界。”在2023中关村论坛全体会议上,百度CEO李彦宏表示,越来越多的人认可第四次产业革命正在到来,革命的标志就是人工智能,因为大模型成功地压缩了人类对于整个世界的认知,让人们看到了实现通用人工智能的路径。
创新工场董事长、首席执行官李开复也表示,“AI大模型是一个绝对不能错过的历史机遇,是有史以来最大的一个平台”。通过发展 AI 大模型,中国可以推动创新产业的发展,带动经济增长,实现科技与经济的双重红利。
李开复表示,大模型已经慢慢走向实体经济,随之而来的AI 2.0时代将推动AI-first应用的发展,从生产力和娱乐领域开始,颠覆如搜索引擎、电商、金融、教育、影视娱乐、医疗、游戏等诸多行业,重构人类的工作,很多重复性的劳动会被取代。
21世纪经济报道记者在会上了解到,大模型产业化应用正逐步适配各行各业的实际需求,基本上沿着两条路径发展。
第一种是通用类大模型持续拓展应用领域,文心一言、通义千问、紫东太初、星火认知等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。
第二种是垂直领域专业类大模型不断深化落地,一批针对生物医药、遥感气象等垂直领域的专业大模型发挥其领域纵深优势,提供针对特定业务场景的高质量专业化解决方案。
新一代人工智能产业技术创新战略联盟秘书长、北京智源人工智能研究院院长黄铁军在接受21世纪经济报道记者采访时指出,未来三年,模型一定会从语言扩散到视觉、听觉、具身、行动、机器人、自动驾驶等方向。“此前预期的纯无人驾驶还有包括机器人进入制造业、家庭有可能在几十年内发生,人和AI相互融合来降低以往产品的生产成本,也会发展全新的产品和服务,这会是一段和谐共生的好日子”。
14省已开展大模型研发
本次论坛上,科技部新一代人工智能发展研究中心发布了《中国人工智能大模型地图研究报告》。据不完全统计,到目前为止,中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发,主要集中在北京、广东两地,其中北京38个,广东20个。
“北京、广东、浙江、上海等地的大模型数量最多,这4地也是近三年人工智能服务器采购数量最高的地区。各地也在通过提供公共算力的方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支持。”中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘建议,后续应当加强智算中心、超算中心、云计算中心等计算资源的统筹,制定公共数据共享目录和共享规则,推动数据分级分类有序开放。
值得注意的是,北京市已经在5月份启动“北京市通用人工智能产业创新伙伴计划”,以推进人工智能大模型研发和应用,赋能千行百业数智化转型,同时还发布了《北京市促进通用人工智能创新发展的若干措施(征求意见稿)》,从算力、数据、算法、应用、监管五大方向,对北京大模型发展提出了21项措施。这或将成为国内首个地方政府紧贴AI大模型产业化发展提出的专项措施。
“北京发展AI的优势在于要素最全,能够有效整合资源,但这也不是北京一个城市的事情,而是全国乃至全球性的庞大产业生态。”黄铁军表示,各地在支持人工智能产业的过程中一定要注意产业协同,企业也不能用原来的产品思维方式来谋划大模型研发,创新需要差异化,不宜一哄而上。
李开复表示,AI 2.0市场预计将是移动互联网规模的10倍,容纳得下巨头、中小企业、初创公司在三个层级的赛马,期待形成巨头、中小微创新企业一起发展的“创新综合体”。
《报告》显示,在研发主体分布上,大学、科研机构、企业等不同创新主体都在参与大模型研发,学术界和产业界之间的联合研发仍不足。在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。
赵志耘表示,大模型技术仍处于发展初期,潜在的基础理论和技术创新空间巨大,通过蒸馏、量化等小型化技术实现模型“瘦身”,为大模型小型化、绿色化发展提供技术支撑,进一步加强产学研合作,鼓励大模型开源开放,也将加速大模型技术进步。
开源开放与自主创新并进
纵观全球,打造人工智能生态,有开源和闭源两种路线。中国科学院院士、中国计算机学会开源发展委员会主任王怀民介绍,大模型因其不确定性形成开源模式和预研模式同时推进的基本格局。
对于人工智能生态建设,科技部副部长吴朝晖在2023中关村论坛上表示,中国坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。
黄铁军表示,开源是大模型的未来,需要不断加强协同创新。近期大模型热潮席卷全球之后,开源开放的活力被进一步激发,开源开放正在成为塑造人工智能未来发展的主导力量。中国的开源经过30多年的发展也一定进入了蓄势发展的新阶段。
从政策层面看,2017年,中国发布《新一代人工智能发展规划》,将开源、开放作为基本原则写入了规划。科技创新2030——“新一代人工智能”重大项目也提出引导鼓励国家项目支持研发成果开放共享,依托人工智能头部企业建设国家新一代人工智能开放创新平台,构建开放生态、推动行业发展。
《报告》显示,从开源创新生态上看,大模型中,已有半数以上大模型开源,北京、广东、上海三地开源数量和开源影响力均居国内前三。高校/科研机构是开源主力。清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型开源影响力最高。
目前,百度、华为、阿里、科大讯飞等中国科技企业在开放人工智能的框架和模型方面积极参与工作。百度首席技术官王海峰在论坛期间表示,得益于百度在人工智能技术领域的全面布局和技术积累,尤其是飞桨深度学习平台和文心大模型的联合优化,文心一言在一个多月时间内推理性能提升了近10倍,效率更高,效果更好。
不过,此前在全球大火的ChatGPT,在ChatGPT2发布之后,OpenAI对其实行闭源发展。会上也有不少业内人士强调,开源开放的同时仍要坚持自主创新。
“支持开源,但不能过度依赖开源模型”,李开复在接受媒体共同采访时指出,开源模型无法达到国外大厂自研模型的性能,开源模型的能力会成为“天花板”。海外大厂的开源技术也存在关闭风险,另外由于国内外文化、用户习惯和法律法规不同,将国外训练好的模型带到国内进行微调是存在风险的。
“中国大模型公司不应再依赖于他人的开源模型,需要尽快建立自己的IP和技术优势,形成护城河。”李开复说。
中国工程院院士、中国人工智能学会理事长戴琼海指出,中国已成为全球最大的人工智能应用市场,人工智能应用技术整体水平与美国相当,但也需要注意人工智能头部企业与美国仍存在差距,大部分人才集中于应用层,而在基础性技术上则明显处于弱势。未来应从政策、机制和投入上深化人工智能的人才培养和基础研究,强化原始创新,避免陷入“无源之水”困境。