303272

读创网首页 > 科技 >
【原创】读创下午茶|中国大模型赛道风起云涌!商汤今日官宣:于高考等多项评测,其大模型已超ChatGPT
来源:深圳商报&读创
编辑:

读创/深圳商报记者 马强

2023年高考今日开考,高考作文、AI写高考作文等关于高考的主题毫无疑问登上热搜并全网刷屏。但在另一个看不到的赛场——大模型,中美两国创业者的竞争,也在悄无声息地进行。在港上市公司商汤科技今日在其微信公众号宣布,其与上海AI实验室等发布“书生·浦语”大模型,已在包括高考在内的多项中文考试中,取得了超越ChatGPT的成绩。

▲高考首日,多个与高考相关主题登上热搜。截图来源:新浪微博

截至7日15:50,商汤科技港股报2.14港元,涨0.94%,公司总市值716.2亿港元。

▍商汤:AI考生今日抵达,“书生·浦语”大模型多项成绩领先ChatGPT

商汤科技在公众号文章中称,近日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有1040亿参数,是在包含1.6万亿token的多语种高质量数据集上训练而成。

▲截图来源:商汤科技微信公众号

中文大语言模型是否能够在高考中赶超ChatGPT呢?文章称,全面评测结果显示,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各个科目的数据集(GaoKao)。

“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集:

•由伯克利加州大学等高校构建的多任务考试评测集MMLU;

•微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);

•由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;

•由复旦大学研究团队构建的高考题目评测集Gaokao。

实验室联合团队对“书生·浦语”、GLM-130B、LLaMA-65B、ChatGPT和GPT-4进行了全面测试,针对上述四个评测集的成绩对比如下(满分100分)。

▲截图来源:商汤科技微信公众号

记者注意到,文章特别提到,Gaokao是由复旦大学研究团队构建的基于中国高考题目的综合性考试评测集,包含了中国高考的各个科目,以及选择、填空、问答等多种题型。在GaoKao测评中,“书生·浦语”在超过75%的项目中均领先ChatGPT;而且,在以美国考试为主的MMLU上,“书生·浦语”也实现和ChatGPT持平。

不过,商汤科技在公众号文章中也坦承,虽然“书生·浦语”在考试评测上取得优秀成绩,但在测评中也可以看到,大语言模型仍然存在不少能力局限性。“书生·浦语”受限于2K的语境窗口长度(GPT-4的语境窗口长度为32K),在长文理解、复杂推理、撰写代码以及数理逻辑演绎等方面还存在明显局限。另外,在实际对话中,大语言模型还普遍存在幻觉、概念混淆等问题。这些局限使得大语言模型在开放场景中的使用还有很长的路要走。

▍中美是大模型赛道头部玩家,中国今年新增大模型已超美国

入局的远不止商汤科技!自ChatGPT去年末在全球掀起巨大轰动以来,大模型无疑已成为全球最热闹的赛道之一。在这个赛道上,中美是两大头部玩家。数据显示,中国已推出79个大语言模型,尤其是在2023年以来,推出大模型的数量已超美国。

新发布的《中国人工智能大模型地图研究报告》统计,过去5年,中国10亿以上参数规模的大模型已经发布了79个,涉及14个省市,北京和广东最多。美国已经发布了100个大模型。在大模型领域,中国和美国遥遥领先,两国相加占全球总量的80%以上。

在微软OpenAI、Google的引领下,2023开年以来,全球掀起了大模型“军备竞赛”时代的序幕。中国互联网大厂和科技大佬的创业热情也由此点燃,做类ChatGPT产品、建中国版OpenAI蔚然成风,也正因此,有业内人士惊呼:AI 2.0的“诸神之战”已经开启!

互联网大厂一马当先。百度率先推出“文心一言”,腾讯推出AI智能创作助手“腾讯智影”及“混元”AI大模型,阿里达摩院推出中文多模态预训练模型M6项目,科大讯飞启动生成式预训练大模型“1+N”任务攻关,华为推出“盘古”大模型,字节跳动也被爆正在布局大模型AI Lab……

科技大佬和创业团队也不遑多让。今年2月,原美团联合创始人、高级副总裁王慧文宣布打造中国OpenAI。之后,前搜狗CEO王小川,前京东AI掌门人周伯文,阿里技术副总裁贾扬清,出门问问创始人李志飞,AI大牛、创新工场人工智能工程院院长李开复等一众大佬,争先加入ChatGPT创业队伍。今年3月,语言大模型玩家澜舟科技宣布完成了Pre-A+轮融资,并推出语言生成模型——孟子MChat可控大模型;清华唐杰教授的智谱AI;清华系黄民烈教授的聆心智能;清华系NLP实验室孙茂松、刘知远团队;深言科技岂凡超;循环智能联合创始人杨植麟;复旦邱锡鹏教授团队等等,也都被曝已或早或晚耕耘于大模型沃野。

城市是另一个维度。上海、北京两地相继出台人工智能相关政策。日前,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》重磅发布,深圳将发挥政府投资引导基金作用,统筹整合基金资源,形成规模1000亿元的人工智能基金群。整体来看,《行动方案》分别从强化智能算力集群供给、增强关键核心技术与产品创新能力、提升产业集聚水平等六大方向制定多项措施,旨在打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区。

▍英伟达掌握大模型算力“命门”,黄仁勋也将访华?

说到大模型,就不得不说英伟达,以及其创始人兼首席执行官、美籍华人黄仁勋。

▲英伟达  图源:新华社

生成式AI训练大规模神经网络,需要高度复杂、并行的计算能力,传统CPU的并行计算效率较低,GPU的并行计算能力极强,非常适合训练生成式AI。英伟达目前占据着GPU市场84%的份额,可以说掌握着AI大模型“军备竞赛”的算力“命门”。失去了英伟达的GPU,大模型就会歇火。也正因此,英伟达美股年内涨幅美股第一,近日还成为全球首家“万亿俱乐部”芯片企业。

马斯克结束访华刚走,市场传言,黄仁勋也要来。据传,黄仁勋还会与腾讯、字节跳动、理想、比亚迪和小米的高管碰面。如何在美国管制之下更好地开拓中国市场,并满足中国“百模大战”的庞大算力需求,可能是黄仁勋要考虑的一大课题。

如果能顺利成行,黄仁勋将成为继库克和马斯克之后,今年第三位到访中国的万亿美元市值美国科技巨头。黄仁勋判断,未来生成式人工智能将推动万亿美元的数据中心将从通用计算向加速计算转型,但这个庞大的市场,几乎一半属于中国,一半属于美国。

▍群雄逐鹿谁能脱颖而出?优秀的技术产品是“赛马”赛出来的

对AI 2.0的前景以及大模型的未来,AI大牛李开复有着较为深刻的认知。李开复认为,AI 2.0将是一个巨大的平台机遇,其规模将是移动互联网的10倍,所有的应用和界面都会被重写一遍,将颠覆很多行业。内容生产、娱乐等是AI2.0最快也最易于落地应用的领域。

李开复还指出,使用海外的开源大模型就可以做出中国版的OpenAI的说法有误。虽然开源模型本身有一定局限性,但如果直接使用海外的开源大模型,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外,拿海外训练出来的大模型在国内做微调也值得商榷。因为国内外文化习惯、法律法规不同。所以,自主创新做大模型是中国企业的必经之路。

群雄逐鹿态势已成,谁能最后脱颖而出?李开复预计,未来不可能有50家大模型公司存在,会收敛到一个很小的数字上。不过,AI2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面“赛马”。在当前大模型这个赛道,大家都在你追我赶,可以鼓励以各种不同的模式去先行先试,而优秀的技术产品,也正是“赛马”赛出来的。

审读:孙世建

 
 
 
  • 天气
1
【原创】云游长城,复现藏经洞……游戏技术跨界助力文化产业
2
【原创】19年,我们从不缺席!深圳商报记录文博会成长的每一个细节
3
【原创】商报社论|牢记文化新使命 展现文化大作为——热烈祝贺第十九届中国(深圳)国际文化产业博览交易会开幕
4
【原创】第十九届文博会7日开幕 “文化第一展”迈向“国际头部展”
联展期间还将举办工艺美术“工美智造·品质生活”研讨会,邀请数十位中国工艺美术大师、行业专家、企业及展商代表共聚一堂,共同研讨后疫情时代下工艺美术行业的现状与机遇,以及如何突破现状高质量发展。由第十九届文博会“中国工艺美术文化创意大赛”评选委员会主办,深圳国际文化产业博览交易会有限公司、广东省工艺美术协会、深圳市工艺美术行业协会承办的“中国工艺美术文化创意大赛”,于6月7日在深圳国际会展中心14号馆举行。此外,14号馆最亮眼的就是“第十届百名中国工艺美术大师作品联展”。
5
【原创】逾万作品参展,文博会14号馆“助力深圳工艺美术产业高质量发展”!
大鹏LNG入夏后开始高负荷运转,坚定保供不松懈。2022年,在大鹏LNG的推动下,深港历史性达成深度引航合作,提升了LNG船舶通行效率。而按照船期计划,大鹏LNG在5月26日至6月8日的14天内,将以2天接1船的频率高效接卸7船LNG,为粤港澳大湾区迎峰度夏增添“底气”。
1
【原创】中国大陆首个供气突破亿吨接收站在深圳大鹏诞生
2
【原创】深圳发布推动现代农业高质量发展“19条”措施
29日,深圳市统计局发布数据显示,1-4月,深圳经济运行总体平稳,发展延续恢复向好态势。全市规模以上工业增加值同比增长2.1%。投资、消费、出口,“三驾马车”蹄疾步稳。
3
【原创】“三驾马车”蹄疾步稳!深圳1-4月经济延续恢复向好态势
4
【原创】政企合力促经济高质量发展,宝安助“龙”计划显成效
5
深赣红色教育主题对口合作发布会在深圳召开
 
E办事
  • 办事八达通
  • 生活八达通