看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。
但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。
甚至能区分在图中完整可见的有3个和部分可见的有1个。
CogVLM由清华和智谱AI合作开发,通讯作者为唐杰和丁铭,论文和开源代码已上传到GitHub。
看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。
但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。
甚至能区分在图中完整可见的有3个和部分可见的有1个。
CogVLM由清华和智谱AI合作开发,通讯作者为唐杰和丁铭,论文和开源代码已上传到GitHub。
郑重说明:网站资源摘自互联网,如有侵权,麻烦通知删除,谢谢!
联系方式:hiholiday12399@gmail.com