发布日期:2024-12-15 06:33 点击次数:110
今天是OpenAI直播第6天推特 反差,终于来了个能看点的。
Day4是个很枯燥的canvas的极小更新以及向全量用户洞开,昨晚Day5完全即是给苹果作念下PR,都是纯正的垃圾期间。
而今天,4o的及时视频通话,终于来了。
是不是嗅觉有点生疏?没念念到吧,4o果然还有及时视频通话。。。
鸽了7个月,快被东说念主忘干净了。
追念一下今天的直播,有三个东西:
1. 及时视频通话。
2. 及时融会屏幕。
3. 圣诞老东说念主抵制语音。
一个一个说吧。
一. 及时视频通话本年5月14日,OpenAI的春季发布会上,他们认真掏出了GPT-4o。
其中最酷的东西,固然是他们的原生多模态。
全球也都见识到了,高档语音模式的威力,能师法情怀、能唱歌、能演戏。在小红书和X上,也曾看到多半东说念主,在用它来作念厚谊奉陪、练白话等等。
在锤真金不怕火鸿沟,系数是一个弘大的大杀器。
然则其实,其时最让东说念主抖擞的,如故及时视频。
能及时对话,能融会你的衔接性四肢,能知说念你在干啥。
也有挂念。
比如你跟他聊桌子上的一杯冰好意思式咖啡,这杯冰好意思式长的无头六臂奇奇怪怪情态如故红色的,你们聊的很怡悦,然后切到了另一个话题,过了一分钟后,你骤然问他,我们刚才聊的咖啡是啥情态。
它会很准确的告诉你,是红色。
就像,AI第一次,有了跟东说念主类同样的眼睛。
他们我方也演示了一个很意旨的例子。
即是先让ChatGPT跟在座的东说念主聊了一圈,然后问它:
而GPT回话的很好,径直把女生的名字回话的很准确,它记着了她。
然后又演示了另外一个就地教东说念主作念咖啡的场景。
我一直认为,着实的及时视频融会,比语音和文本都首要的多。
因为关于我们东说念主来说,从出生到寰宇的第一天,当你还不会话语、还读不懂笔墨的期间,你融会这个寰宇,全靠视觉。
这是我们融会寰宇的基石。
而当今推特 反差,当你举起一张手写的便签,它能立马看懂;当你你给它看一册杂志上的告白,它能分析背后的联想意图和话术立场;你对着镜头摆弄一件家里的小物件,它能指出其用途、历史、致使给出创新忽视。
这个东西,我认为如故挺酷的。
今天晚上,他们认真通知行将上线了。没错,是行将上线。。。
一周以内,对Pro和Plus用户洞开。
OpenAI你是果真狗。
其实嗅觉以OpenAI这段期间直播的节律,表面上这种功能,应该是跟o1pro和Sora雷同,直播完后就径直全量上了。
然则有可能是受到了昨天Gemini2的冲击(他们也有视频融会),又或然是因为昨天早上ChatGPT的全线崩溃。
导致这一波节律浩大,致使,我都认为今晚的直播,都是为了不显得我方丢东说念主,临时换上来的。。。
二. 及时融会屏幕一个基于及时视频融会的变种。
只不外一个是通过录像头,看外部的施行寰宇,一个是通过雷同于屏幕分享的时势,让它来看你的屏幕。
跟视频及时融会一下,一周内上线。
这个东西,我认为相配有效,雷同于给你一个随时待命给你忽视的给力助理。
随时看着你的屏幕,然后给你指令。
比如说一些我能念念到的最浅显的应用场景。
你在写PPT,嗅觉这页何如作念何如丑,有点卡壳时,你就不错问它:
"这页的视觉排版逻辑是不是有点问题?"或然"这个配色看起来怪怪的,有莫得更好的推选?"
它就能径直指出中枢问题,比如某一页的笔墨太密集,这个标题应该放在左上角,配图应该换个写实立场的,致使它还能帮你现场给你一个最优有筹算,把问题眨眼间管束。
再比如,在你写代码的期间,屏幕分享开着,它能及时看你代码的证实,指出可能的作假,致使径直告诉你哪些变量定名不法式,哪些逻辑不错优化。
你都毋庸我方debug,它径直化身你的leader,边看边指正。
还有一个我我方认为最实用的场景,即是处理表格数据。
因为我通常会作念各式奇奇怪怪的数据分析,掀开Excel的期间果真满屏的数据让你头晕脑胀,这个期间你只需要说一声:
“这份报表有啥什么异值?”或然“能不可帮我画个趋势图?”
当它立马就能帮你分析数据并给出论断的期间,我认为,这即是帮了我大忙了。
固然,我理念念中的最齐备的形态,如故跟雷同于那种Computer Use的Agent连合,径直帮我把事干了,那才是我最念念要的。
比如,我们在用Figma作念界面联想的期间,联想到一半,嗅觉排版不太对劲,于是就不错径直对它说了一句:
“合座勤俭少许,字体换成无衬线体。”
它立马接纳联想,调遣了笔墨间距、对王人时势,还推选了几种更妥当的字体供选拔,最终完成一个更专科的联想有筹算。
致使,它还能帮你融会背后的联想逻辑那就更屌了。
比如你问它:“为什么这个排版显得更欢娱?”
它还能从用户体验的角度开赴,领悟黄金分割、留白利用等表面,带你快速提高审好意思和手段。
这个,可能才是我最念念要的曩昔。
亦然我认为,屏幕及时融会的终极形态。
三. 圣诞老东说念主抵制语音一个挺空洞的更新,在高档语音内部,新加了一个新的音色。叫Santa。其实即是个,圣诞老东说念主的语音。
咫尺也曾及时上线了,都不错在高档语音模式里体验到。
就,果真空洞。
可能关于老外来说,这个“吼~吼~吼”,果真有节日氛围吧。。。
女同telegram写在临了OpenAI直播,也曾进行一半了。
稍稍盘货一下。
Day 1:满血o1上线,ChatGPT Pro会员上线,o1 pro推出。
Day 2:基于o1的强化微调。
Day 3:Sora认真发布。
Day 4:ChatGPT Canvas全员洞开以及小功能更新。
Day 5:给苹果站台,宣传苹果全系接入GPT。
Day 6:4o的及时融会上线。
说真话,相配的低于预期,相配的不尽东说念主意,相配的念念让我骂他。
每天晚上,都是心烦虑乱、如芒在背、如鲠在喉。
Dalle 4呢?AI Agent呢?AI搜索浏览器呢?猎户座新模子呢?
你这都是些啥啊。
最凄怨的不是这个,最凄怨的是,还有6天。
每天晚上我都会在小群里开腾讯会议,第一天来了80个东说念主,第二天40个,第三天因为预报Sora也有40个,第四天20个,第五天11个。
而今天,惟有5个。
果真,也曾越来越莫得东说念主在乎了。
但愿在后头的6天里,奥特曼你能蜕变一下我关于你的怨气,让我们认为,OpenAI这样玩,都是计谋,是在裁汰全球预期。
给力的东西,其实都放在后头。
果真,求求了。
为了你们我方。
也为了我们这些,每天熬夜的兄弟。
著述开首:数字生命卡兹克推特 反差,原文标题:《OpenAI全量上线4o视频通话 - 我们等了7个月》
风险提醒及免责条件 阛阓有风险,投资需严慎。本文不组成个东说念主投资忽视,也未接头到个别用户出奇的投资指标、财务现象或需要。用户应试虑本文中的任何意见、不雅点或论断是否合适其特定现象。据此投资,包袱闲暇。