嗨热线网 > 科技 >

腾讯大模型的绝活,居然是发布会上没吹的写代

2023-09-09 23:17

就在昨天腾讯的全球数字生态大会上,腾讯大模型混元终于亮相了

为什么要说终于?

在各方消息看来,除了像小米这种说不打算做大模型的之外,绝大部分大厂们基本都已经陆续上线过大模型了。

其实,腾讯自己也在 6 月中旬就推出了自己面向 B 端行业的 MaaS ( Model-as-a-service ,模型即服务 )解决方案。

方案中包含了很多行业大模型,只不过当时腾讯的通用大模型依旧还很神秘。

 

后续的各种消息、报道里,腾讯也在内部不断打磨混元大模型。

所以这也让差评君对混元的期待值,越来越高。

毕竟上一个用 “hun yuan ” 名号的,可是打了一整套闪电五连鞭。

 

话不多说,下面就开始新一轮大模型测试。

本次测试和混元同场竞技的是,大模型界的老学长 ChatGPT 。

整个测试环节将分:常规语义理解、复杂问题理解、连续对话与角色扮演能力、学习能力、代码能力、数学能力、长文总结,以及大家喜闻乐见的弱智吧问答等 8 个维度。

这次我们一反常态,把长文总结能力的测评放在了第一位。

因为我们让大模型总结的,就是这篇测评本身( 除长文总结能力部分 )。

至于能不能当成省流版,往下看你就懂了。混元的总结非常精练,但过于精练,以至于我很难从这个总结得出有效的信息。

但当我让他展开讲讲的时候其实还行,但可惜无中生有了 “ 长文总结 ” 这个模块。

而 ChatGPT 由于输入字数限制,被我人为分成了两部分输入,不确定这有没有没影响它的总结能力。

在回答中,它莫名克扣了对自己的所有评测,甚至没在总结里写出混元的数学能力、弱智吧问答挑战和差评君的观点,也不好用。

郑重说明:网站资源摘自互联网,如有侵权,麻烦通知删除,谢谢!

联系方式:hiholiday12399@gmail.com