2023-05-09 11:47

科大讯飞股价迅飞,大模型逊色

5月8日,科大讯飞的股价开盘后放量涨停,报63.86元。5月6日,这家公司赶在A股周末休市前一天发布了自家的自然语言大模型“讯飞星火认知大模型”(以下简称“星火”)。

自OpenAI发布GPT-4后,国内的百度、华为、阿里巴巴先后推出自家大模型,力争造出中国版ChatGPT,而在智能语音行业做了20多年的科大讯飞野心更大,其董事长刘庆峰在上周五的发布会上称,讯飞星火认知大模型在文本生成、知识问答、数学能力“已超越”ChatGPT。

不止如此,科大讯飞还计划在10月24日前让“星火”实现中文能力超过 ChatGPT、英文能力与之相当的目标。升级时间截止日为何如此精准?有网友发现,该公司预计在今年10月12日前完成大股东减持。

“已超越”、“将超过”,未来不可知,体验在当下。然而,社交网络上,“星火”大模型已经制造了多起翻车现场。


休市前发布大模型 开盘即涨停


5月8日,科大讯飞(002230.SZ)在开盘15分钟后即涨9.91%,在上午9点46分报63.86元,快速触及涨停,成交额达87.07亿元。今年以来,这家专业搞智能语音的上市公司,股价已接近翻番,市值近1500亿元。

科大讯飞2023年一季报显示,公司一季度净亏损5789.5万元,上年同期净利润1.1亿元。该公司曾表示,虽然在一季度业绩下滑,但基于在国产替代和业务开拓上的进展,预计从二季度开始将会实现收入和毛利正向增长。

二季度刚结束第一个月,科大讯飞的股价先飞了。“周一开盘,科大讯飞肯定要涨了。”5月6日下午,有关注股票的网友如此预测。当日,科大讯飞在公司大本营合肥发布了自家的大模型“讯飞星火认知大模型”(以下简称“星火”)。

休市前一天发布重磅产品,科大讯飞促成了最大的利好信号。

据悉,“星火”大模型具有七大核心能力:多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。

发布会结束后的周末两天,A股休市,科大讯飞出现在各大券商研报的头条里,中信证券、华泰证券等都对科大讯飞的“星火”大模型的应用前景给出正面评价,释放“买入”信号。

市场强预期还是来自科大讯飞的“星火”大模型发布会。与百度发布文心一言时的录播演示不同,科大讯飞实时演示了“星火”的能力。

结合“星火”的讯飞AI学习机批改作文能力提升

发布会上,刘庆峰让植入了“星火”大模型的AI学习机批改作文,一篇手写作文被划上了各种批改建议,从标点、词句运用到修辞手法,AI化身全方位的“作文老师”。据悉,升级以前的AI学习机只能纠正错别字、病句等低级错误,有了大模型后,能给出修改的具体依据和范例,生成更细致的内容评价,也能量化分析学生的写作能力。

给市场释放更大信心的还有科大讯飞接下来的大模型升级计划:公司计划10月24日前实现对 ChatGPT的能力对标。按刘庆峰的话说,中文能力要超过ChatGPT的水平,英文能力与之相当。

“星火”号称10月24日前超越ChatGPT中文能力

科大讯飞的目标对齐时间,不像一些大模型研发公司只敢说“未来X个月”,而是精准到了“10月24日前”。有人好奇,“到时候实现不了,不怕打脸吗?”有细心的网友发现了“端倪”:科大讯飞的大股东要在10月减持。

今年3月22日,科大讯飞发布“大股东计划减持股份的预披露公告”,持有该公司股份8349万余股(占本公司总股本比例3.59%)的股东中科大资产经营有限责任公司计划在2023年4月21日-2023年10月12日以集中竞价(或大宗交易)的方式减持该公司股份不超过2323万余股(占本公司总股本比例1%)。

微博博主@小咖科技v认为,科大讯飞无惧打脸、吹爆自家大模型的原因是要“在10月12日之前顺利高价减持掉2323万股”。

当然,大股东减持计划还是科大讯飞的“预告”,到时候股价还能否保持当前的势头也是未知数,既需要看科大讯飞的盈利能力行不行,还得看AI大模型的风口能不能持续到今年10月。


超越ChatGPT? “星火”翻车案例满网飞


在评价“星火”大模型的能力时,发布会上的刘庆峰一直在对标ChatGPT,“英文如果满分以5分计算,ChatGPT现在是4.48分,我们已达到4.29分。”他称,当前讯飞星火认知大模型的文本生成、知识问答和数学能力,已超过ChatGPT。”

自信“已超越”“将超越”ChatGPT的“星火”大模型到底行不行?未来不可知,当下却是能体验的,已有拿到内测资格的各路网友给出了测试。

有网友混搭了四大名著中的人物和情节提问,想试试“星火”能不能发现错误。结果它讲起了“林黛玉三打白骨精”的故事,故事里,薛宝钗成了林黛玉的表哥。

于是,网友降低难度,问了一个只关于《水浒传》的问题:哪几个人因为被戴绿帽子上的梁山?以此考验“星火”对“绿帽子”的理解。结果,答案也是驴唇不对马嘴,“星火”把鲁智深和潘金莲捏把成不良CP不说,还给宋江安排了妻室“李氏”,和西门庆谈起不伦恋……《水浒传》的人名似乎只是人名而已,“星火”负责给他们“造谣”。

不死心的网友放弃了逻辑问答、语义理解这些难度,直接问了一个《水浒传》的情节:火烧草料场的是谁?结果,林冲被陷害的经典情节被安排到了宋江上,还给宋押司加了段“占领草料场”事迹。

号称语料来源丰富的“星火”有一种完全没被输入四大名著的既视感。而对于一些更简单的事实类问题,“星火”的错误也容易给不知情人的带来误导。有人询问铜陵的车牌号,安徽本土企业科大讯飞研发的“星火”对老家的城市表现出陌生,将铜陵的车牌代码输出为“皖M”。事实上,铜陵市的车牌代码是皖G,皖M是滁州市。

从网友们的体验反馈看,大模型“星火”在基础的文本回答上翻车率不低,同样有大模型“一本正经胡说八道”的通病。如此表现想在10月24日前超越ChatGPT,科大讯飞得加把猛油了。也难怪有网友打趣,“星火”在中文能力上超越ChatGPT的说法,和寒武纪自称超越英伟达一样,“完全不可信”。

本文链接:https://www.8btc.com/article/6817018
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇