给自己放个假吧ChatGPT,再更新的这么快,网友的脑洞可就跟不上了。
本周一,ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。
以后你下班骑共享单车回家路上要是感觉车上有什么故障,可以给零件拍张照直接问它。
然后你回到家了,看到毫无头绪的冰箱藏品后,ChatGPT可以告诉你挑哪几样出来能做个晚饭。
吃完睡觉,还没睡意的话,它还能给你一些ASMR服务,如果B站或者YouTube上那几个博主你已经听厌了的话。
1985年9月,写了《看不见的城市》的卡尔维诺因为突然的中风而去世,这年夏天他因为头痛的问题曾去寻求过医生帮助,主刀医生说自己从未见过这么般构造复杂而精致的大脑。
ChatGPT从一开始就像一颗无比精美的大脑——并且是看不见的——但它现在终于有了眼睛、耳朵和嘴。
全球网友:那就来吧,比划比划。
图源:推特
有人试了试,它基本可以替人做软件项目的开发了。
一个软件项目的诞生大概是这样的:先在白板上画线框图,整理出编排逻辑,然后开始写代码,最后生成界面。现在这件事,白板上的活儿归你,离开白板归它。
一位开发者把自己的线框图直接拍照扔给ChatGPT,它直接把软件写出来了。
他还玩了些小把戏,比如把编排用并不规整的箭头表示潦草的替换了位置,ChatGPT不但看出来了,而且照单全收。
我们大概还是低估了多模态会带来什么。
人工智能与人类智力的发展在这里是相反的。人类先有眼睛,看到了世界之后形成了语言和逻辑,反过来又能更好的描述和理解所看到的世界。人类在600万年历史间的智力水平提升,就是一个巨型的机器学习熔炉。
而对于ChatGPT来说,他已经有了最好的智力水平,已经能够理解很多事了,限制它的反而是文字对于信息的压缩,导致它无法接触到更复杂的问题。当给这样一颗大脑一双眼睛会带来什么。也就是让它被允许直接看到图像信息,拆解问题的能力开始爆炸。
有人给ChatGPT喂了一张SaaS软件的界面图,并且要求它将其分解为小的组件并且把所有代码都写出来,它真的做到了。
你甚至可以粗暴的给它一个Unity的编辑界面截图,叫它提供一个添加模型动作的流程。