智谱AI推出第三代基座大模型 社保基金、阿里腾讯等领投 投融资开始向头部企业集聚

人工智能 AI资讯 AI产品来源:百家号评论2901阅读模式

《科创板日报》10月28日讯,(记者 李明明)继之前宣布今年累计获得超25亿人民币融资后,10月27日,智谱AI公司宣布推出全自研的第三代基座大模型ChatGLM3及相关系列产品。

《科创板日报》记者了解到,自智谱AI2020年底开始研发 GLM 预训练架构起至今,已完成了5次产品升级。

今年以来,国内多家主流大模型产品也多次完成迭代,比如,两天前的10月26日,腾讯宣布,腾讯混元大模型迎来全新升级,升级后的腾讯混元中文0-能力整体超过GPT3.5。

智谱等国内多家大模型迭代进入“白热化”

智谱AI张鹏CEO表示,ChatGLM3的语义能力与逻辑能力,得到了大幅度增强,并实现了若干新功能的迭代升级。包括多模态大模型CogVLM的看图识语义功能,在10余个国际标准图文评测数据集上取得SOTA(即“最先进”)。开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景的应用。

据了解,截至目前,智谱AI的产品已能支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、寒武纪、摩尔线程、百度昆仑等。

此前,市面上最主流的三种模型训练路径(GPT、BERT、T5)都来自国外公司,智谱AI则提出了全新的GLM(通用语言模型)路径。简单来说,假如GPT的工作原理,可以比作“根据上文做完形填空”,GLM做完形填空的依据则从上文扩充到上下文。智谱AI称GLM的训练效率会比GPT更高,也能理解更复杂的场景。

智谱AI研发GLM产品,用了近三年时间。2020年底,智谱AI训练了百亿参数模型GLM-10B,2021年,训练出万亿稀疏模型,2022年,公司研发了双语千亿级超大规模预训练模型GLM-130B。今年3月,智谱AI推出了千亿基座的对话模型ChatGLM。6月,ChatGLM2正式发布。

《科创板日报》记者注意到,从今年3月开始,国内的AI大模型如雨后春笋般涌现。此后,开始不断迭代。

比如由前搜狗CEO王小川创立的百川智能,其核心团队来自搜狗、Google、腾讯等知名科技公司,成立仅半年时间就已经发布了6款大模型,其中4款开源可免费商用,2款闭源,据报道,其中两款开源大模型累积下载量超过六百万次。

而大厂也动作频频。 5月6日,科大讯飞发布星火认知大模型。6月9日,讯飞星火认知大模型V1.5推出。8月15日,讯飞星火认知大模型升级至V2.0版本。10月24日,科大讯飞发布了讯飞星火认知大模型V3.0,并称2024年上半年将实现对标GPT-4,不到半年间已经迭代了4次。

作为国内最早布局大模型的参与者之一,今年3月16日,百度推出文心一言,开启邀测。6月宣布文心大模型已经迭代到到3.5版本。8月31日,文心一言率先向社会公众开放。10月17日,李彦宏宣布文心大模型4.0正式发布。

国内大模型公司竞相推出各种新版本的背后,与国外科技巨头对大模型迭代迅速并且激烈竞争不无关系。 由于GPT-4目前的整体表现优于现有的大型语言模型,为此,谷歌发布 PaLM 2,全面升级迎战 OpenAI。而Meta 则引领开源模型,于7月19日发布了大模型Llama 2。

在此背景下,国内大模型企业也纷纷跟进,努力推进生成式AI技术的发展。对此,周鸿祎曾表示,“原先认为国内大模型和国际差距有一两年,现在我收回这句话,中国大模型的发展速度,已经基本赶上国际先进水平,整体的基本水平已经赶上GPT-3.5,追赶GPT-4的速度也超过想象”。

一位接近智谱的投资人告诉《科创板日报》记者,如今,大模型的创业和研发热潮已过第一阶段,而真正考验企业实力的新阶段才开始。大模型企业需要从技术、资本整合等方面来证明自己的实力,所以都在不停地进行技术升级,保持行业地位,以此获得更多融资。

国内大模型企业融资尚不算火爆

伴随大模型不断迭代而来的,是企业的不断融资。自2019年成立,4年间智谱AI已经进行了8轮融资,最近一轮是今年9月19日的B-4轮融资,金额12亿人民币。

10月20日,智谱AI公开宣布,今年已累计获得超25亿人民币融资,参与方主要有社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、红杉、高瓴等多家机构,包括君联资本在内的部分老股东跟投。

社保基金中关村自主创新基金于今年5月成立。此前在2023中关村重大科技成果专场活动上,社保基金宣布将设立“社保基金中关村自主创新专项基金”,首期规模50亿元,基金期限超过10年。

资料显示,智谱AI的首席科学家,是清华大学计算机系的唐杰教授,同时他也是KEG实验室带头人。核心团队中,董事长刘德兵系中国工程院高文院士弟子,总裁王绍兰为清华创新领军博士,CEO张鹏毕业于清华计算机系。

据公开资料,在与OpenAI、谷歌大脑和Meta等公司的大模型准确性等关键指标对比中,智谱AI大模型GLM表现依然出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上,甚至超过了GPT-3和Meta的OPT大模型。

今年,硅谷科技媒体The Information把智谱AI评为最有可能成为“中国OpenAI”的5家企业之一。

8月31日,备受行业瞩目的首批11家公司大模型产品获得备案,智谱AI(GLM大模型)与百度(文心一言)、抖音(云雀大模型)等并列其中。相关业内人士认为,这代表智谱AI已是国内大模型赛道较为头部的选手。

根据财联社创投通数据,大模型赛道今年大约有30起融资事件,逾7成集中在种子轮、天使轮,公开披露融资额约60亿人民币,被投企业多为较知名的大模型公司,如智谱AI、百川智能、生数科技、月之暗面等。投资方多数为互联网大厂如腾讯、阿里、美团、蚂蚁等。

根据 PitchBook 数据显示,2022年,硅谷的风投资本对生成式AI公司共投入13.7亿美元,今年则达到21亿美元。

上述投资人告诉记者,大模型赛道已形成强者愈强、弱者愈弱的马太效应,资金大都流向有知名度且有一定规模的企业。不过,目前国内大模型企业融资额较美国还有一定差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体用户上传并发布,仅代表该作者或机构观点,不代表AI物的观点或立场,AI物仅提供信息发布平台。
特别提示:阅读原文,请点击标题下的“来源:XXX(链接)”或文后“版权声明”处“本文源自XXX(链接)

weinxin
我的微信
AI物微信
微信扫一扫
人工智能
  • 版权声明 本文源自 百家号 整理 发表于 2023年 10月 29日 18:10:49
  • 转载请务必保留本文链接:http://aiwu.net/717.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定