美国4月份核心消费者价格同比上涨3.6%,环比上涨0.3%,均符合预估。
OpenAI发布GPT4-o,推出适用macOS的桌面级应用
当地时间5月13日,OpenAI通过直播展示了产品更新,发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI还与苹果走到一起,推出了适用于macOS的桌面级应用。
点评:GPT-4o的多模态能力颇受关注,其具备视觉能力,可通过手机摄像头“看到”画面并描述,可在“看到”电脑桌面并解答问题,还可以充当实时翻译、辨别人的脸部表情。此外,包括OpenAI推出macOS桌面级应用在内,业内近期对大模型落地端侧多有期待。OpenAI发布的多个演示视频中,GPT-4o运行在电脑和手机上,这或许意味着,OpenAI下一步会着力推动大模型在端侧应用。
谷歌发布十几款产品对阵OpenAI
北京时间5月15日凌晨,谷歌在2024年I/O开发者大会上一次性掏出十几款产品的更新对阵前一天举办发布会的OpenAI,重磅级的发布包括轻量化的模型Gemini 1.5 Flash、AI通用智能体Project Astra、强大的AI搜索、视频生成模型Veo、第六代TPU Trillium等,Gemini 1.5 Pro的上下文窗口也从100万tokens升级到200万。
谷歌此次的视觉识别和语音交互产品Project Astra被认为是正面交战GPT-4o。Astra项目展示了多模态理解和实时对话能力。在谷歌演示的视频中可以看到,通过摄像头,这个AI助手能完成帮忙理解屏幕中的代码、找眼镜在哪里这样的工作,也可以通过画面理解"薛定谔的猫"这样的概念。
点评:在两个小时的主题演讲里,据Gemini统计,"AI"被提及了121次,谷歌官网同步发布了11篇AI相关的博客介绍此次更新。这场不见硝烟的战争,谷歌看起来全力以赴了。值得玩味的是,在谷歌发布会后, OpenAI CEO奥尔特曼(Sam Altman)在X上发文表示,“我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。”这被行业解读为在暗讽谷歌。
OpenAI内斗风波关键人物离职
OpenAI联合创始人兼首席科学家伊利亚·苏茨克沃(Ilya Sutskever)当地时间周二在社交媒体上宣布,他决定离开工作近十年的OpenAI。未来他将有自己的项目要做,并会在适当时候分享细节。OpenAI CEO奥尔特曼很快在社交媒体上表示:"苏茨克沃和OpenAI即将分道扬镳,我非常难过。如果没有他,OpenAI就不会有今天。"
点评:苏茨克沃在去年底OpenAI内斗风波中扮演关键角色,他参与董事会投票解雇了奥尔特曼,随后又支持奥尔特曼回归公司。虽然内斗风波表面上平息了,但苏茨克沃在OpenAI的处境仍显尴尬。外界认为,OpenAI内部对AI的发展有两种态度,保守派强调安全和OpenAI的基本价值观,苏茨克沃是保守派代表人物,以奥尔特曼为代表的另一派更强调加快发展和商业化。苏茨克沃离开后,或许OpenAI在商业化上会更加坚定。
OpenAI被曝解散“超级智能对齐”团队
5月18日凌晨,OpenAI安全主管、“超级智能对齐团队”负责人Jan Leike在社交平台宣布离开OpenAI。这也是继OpenAI联合创始人兼首席科学家伊利亚·苏茨克沃辞职之后又一名高管辞职。Jan Leike在社交平台X上公开透露,与OpenAI高层在公司的核心优先事项上存在长期分歧,最终双方的分歧已经严重到无法调和的地步。团队在推动其研究项目和争取计算资源时遇到了重大阻碍,缺乏资源会严重影响研究的进度和质量。
随后OpenAI证实,由Ilya和Jan Leike共同领导的“超级智能对齐团队”已经解散。此后,该团队的研究工作将被整合到OpenAI的其他研究小组中。去年7月,OpenAI宣布成立一个新的研究团队“超级对齐”,要用AI监督AI的方式,解决超智能“AI对齐”问题。“AI对齐”的意思是,要求AI系统的目标要和人类的价值观与利益相一致。
点评:一度几乎导致OpenAI分崩离析的宫斗事件终于尘埃落定。AI风险团队解散是OpenAI内部最近出现动荡的又一证据,也再次引发了人们对该公司在开发AI产品时如何平衡效率与安全的质疑。针对这一消息,马斯克评价道, “这显示安全并不是OpenAI的首要任务”。 OpenAI CEO奥尔特曼发文肯定了Jan Leike在OpenAI的贡献和领导能力,并表示,未来几天内会发表一篇更长的文章,来阐述OpenAI对于产品安全的规划和所做的事情。
月之暗面创始人谈GPT-4o:多模态是当前重点投入方向
5月18日,Moonshot AI月之暗面创始人杨植麟现身第五届上海创新创业青年50人论坛,在接受媒体采访时杨植麟谈及OpneAI 近期发布的最新产品GPT-4o,他告诉第一财经记者,多模态是公司当前持续的重点投入方向。在持续布局技术的同时,杨植麟也表示,公司希望在商业化和技术发展之间取得平衡。"我们希望能够在‘爬楼梯’和‘看风景’之间取得平衡。大模型的能力接下来有非常大的提升空间,当前产业仍处于开端,刚做到10的25次方运算,接下来26、27、28、29次方的运算,我们希望能够把精力和优先级放在‘爬楼梯’上,而不仅仅只是‘看风景’。" 杨植麟在主旨演讲中谈到。
点评:5月14日,OpenAI发布了新一代旗舰生成模型GPT-4o,该产品新增了文本、语音、图像三种模态的理解能力。杨植麟也关注到了GPT-4o 的多模态能力,"这个也是我们持续重点投入的方向,所以接下来也希望有更多的成果和大家分享。"他表示。杨植麟称GPT-4o标志了一个技术的成熟。对月之暗面而言,"可能探索一些不一样的路径去适配市场和用户的一些实践。"他告诉记者。
多家美国AI创业公司开启裁员
5月17日,美国旧金山AI编程独角兽Replit宣布了一次重大裁员,CEO Amjad Masad 在社交平台发布了一封电子邮件,他透露,将有30名员工被裁掉,占员工总数的20%。Masad 表示,这一决定是在 Replit 为更好地服务企业客户而进行的战略调整的一部分。尽管公司目前财务状况良好,但为了实现更大的发展潜力,公司决定缩小团队规模,以便更加专注和高效地推动创新和市场扩展。据悉,Replit已从a16z以及Coatue筹集了超过2.2亿美元的资金,最新估值超过10亿美元。
除Replit外,还有多家美国生成式AI创企被曝陷入资金短缺危机。大语言模型创企Reka AI被曝可能以10亿美元被数据存储和分析公司Snowflake收购,此前面临卖身乃至倒闭危机的AI独角兽企业Stability AI,则正在争取一笔“救命钱”。
点评:市场观点认为,科技巨头下场竞争是加剧初创企业危机的直接原因。随着科技巨头们不断推出各种免费或付费的生成式AI服务,企业客户们放缓或减少了对商业软件的支出,这让本来资金就并不充裕的AI初创公司们面临更大的竞争压力,要在这场关于AI的“烧钱游戏”中活下来并不容易。
字节挑起大模型价格战
5月15日,字节跳动发布豆包大模型。火山引擎总裁谭待披露豆包大模型的商业化价格——豆包主力模型在企业市场的定价为0.0008元/千Tokens,即0.8厘的价格可处理1500多个汉字,较行业平均价格便宜99.3%。市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。至于为什么要做降价这个市场动作,谭待表示,目前接触的很多客户都在做大模型方面的尝试,但创新这件事的风险度很高,尤其在AI领域,因此需要将成本降低,带动大家更广泛地使用起来。
点评:大模型算力贵、价格高阻碍了落地应用,业界已在推动大模型商业化价格逐步降低。OpenAI近期发布的GPT-4o价格为GPT-4 Turbo的一半,智谱入门级产品GLM-3 Turbo模型调用价格下调80%。不过,在大模型应用还未大规模落地的情况下,单是打价格战能否刺激市场需求,目前还难下定论。
腾讯混元大模型逐步推动开源
5月14日,腾讯混元文生图模型Hunyuan-Dit升级并开源,参数量15亿。随后,腾讯宣布将在今年第三季度开源文生文模型,包括Hunyuan-S、Hunyuan-M和Hunyuan-L,分别用于手机端、PC端、云或数据中心部署。关于混元逐步开源的原因,腾讯混元模型应用负责人张锋告诉第一财经记者,大模型应用很多场景需要私有化,这种情况下只提供API(接口)不太能满足需求。此外,腾讯相关负责人还透露算力成本有所降低,腾讯使用自研Angel训练推理平台,调度异构卡集群,万亿大模型推理成本比开源减少70%。
点评:国内科技大厂开闭源路线已分化,华为、百度均未推出开源模型,其中百度坚持走闭源路线,而腾讯和阿里的大模型都走开源和闭源并行路径。目前,开闭源路线胜负未定。此外,随着GPT-4o调低价格、字节跳动推出低于行业均价的大模型,近期大模型算力成本下降也成为业内关注的话题。腾讯之外,字节跳动也在通过优化模型结构、混合调度云计算算力等方式降低算力成本。推理算力下降成为大势所趋。
百度智能云一季度营收47亿元,生成式AI贡献收入比例6.9%
百度发布2024年第一季度业绩。财报显示,该季度百度总营收315亿元人民币,同比增长1%,归属百度的净利润为54.48亿元,同比减少6%。财报后的电话会中,李彦宏表示,百度智能云在本季度营收达47亿元,同比增长12%,生成式AI贡献的收入比例达6.9%,占比逐步扩大。李彦宏还表示,搜索最有可能成为AI时代的“杀手”应用,而百度搜索的AI重构工作仍处于早期阶段。
点评:百度是国内"百模大战"中最早入局者之一。作为国内搜索引擎龙头,百度如何用大模型重构搜索备受关注。不过,搜索引擎能否成为AI时代的“杀手”应用,还很难下定论。目前的AI搜索产品更像是搜索引擎与大模型问答能力的糅合,还没有完全颠覆搜索引擎的形态,大模型智能涌现后也还未改变搜索引擎格局。未来,打败传统搜索引擎的不一定是AI引擎,或许是智能助手等其他产品形态。
宇树发布Unitree G1人形机器人:定价9.9万元
5月13日,人形机器人公司宇树科技发布了其最新人形机器人产品——Unitree G1人形智能体,AI化身,售价仅9.9万元起,目前已经在电商平台上线。
在宇树科技发布的产品视频里,这款机器人能够像人类一样用机械双臂灵活地完成一系列动作。官方数据显示,这款机器人身高约127厘米,体重约35公斤,具有超越常人的灵活性。其小跑速度大于2m/s,拥有广阔的关节运动空间,23至43个关节,最大关节扭矩达到120N.m,可进行高难度的动态动作,如动态站起、坐下折叠、舞棍等。G1还可选配Dex3-1力控灵巧手,通过力位混合控制,这使得G1能够模拟人手的精准操作能力,对各种物体进行精确控制。
点评:目前限制人形机器人行业发展的一大阻碍就是成本,宇树科技此次推出的9.9万元的机器人无疑能更大程度推动落地。对于成本是如何下降的,宇树科技方面答复记者表示,宇树在过去的四足机器人产品上,积累了很多机器人降成本的经验,所以下降较快。过往的机器人设计经验以及机器人量产经验,带来了效率提升。
MiniMax 上线AI应用“海螺AI”
5月15日,明星大模型公司MiniMax宣布上架C端产品“海螺AI”,支持输入200k的上下文长度,1秒内处理近3万字的文本,进行书籍、长篇报告、学术论文等长篇内容的阅读、分析和文本写作。MiniMax发文表示,海螺AI可以辅助学生、职场新人、自由工作者、创作者等各类人群,作为一个外挂大脑和人生搭子,帮助化解信息过载和高速运转带来的压力。
目前这款产品在官网以及应用端APP上线。据了解,海螺AI接入了MiniMax自研的多模态大模型,包括万亿参数MoE大语言模型abab6.5,语音大模型和图像大模型。
点评:进入2024年,各家大模型企业都在争相推出AI应用产品,追求落地。不久前MiniMax 创始人闫俊杰接受采访时表示,资源排在前列的中国大模型创业公司很难在资源占有量上领先对手一个量级,“拐点只可能来自技术、产品或者是商业化效率的领先。”
逐际动力完成新一轮战略融资,阿里参投
5月17日,通用机器人初创公司逐际动力完成新一轮战略融资,杭州灏月企业管理有限公司参与了本轮投资,双方表示将共同推动以通用人形机器人为代表的具身智能的发展,开拓可商业化落地的应用场景。
杭州灏月是阿里巴巴(中国)网络技术有限公司的一致行动人公司,成立于2023年10月,淘宝中国持股约57%,浙江天猫技术有限公司持股约36%。
点评:在大模型加持下,机器人企业也迎来了春天。此前阿里已投资了一圈大模型企业,现在其目标也开始转向机器人了。逐际动力成立于2022年,总部位于深圳,聚焦做通用机器人,产品包括全尺寸人形机器人、四轮足机器人、双足机器人及相关解决方案,落地应用聚焦在智能制造、工业巡检、物流配送、特种作业、家庭服务等B2B和B2C领域。创始人张巍博士是南方科技大学长聘教授。在成立逐际动力之前,曾任美国俄亥俄州立大学长聘教授。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者郑栩彤
相关阅读 字节、阿里再掀价格战,百度紧跟!大模型卖出“白菜价”图什么?“只要有一家降价都得跟,要不然估计就会掉队。”
昨天 17:53 通义千问GPT-4级主力模型降价97%,1块钱200万tokens大模型价格战再起。
昨天 10:37 OpenAI首席科学家伊尔亚宣布离职,奥尔特曼:没有他就没有今天的OpenAI奥尔特曼同时宣布,雅库布将接替伊尔亚,成为OpenAI的首席科学家。
05-15 09:59 记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放第一财经记者使用GPT-4o来描述图片,发现其生成结果较准确,5秒左右就能生成描述图片的文字。
05-14 08:37 李开复谈大模型布局,十年内不套现李开复表示配资交易软件,创立零一万物时便向投资人承诺,10年内不套现,且最好的套现方式是“赶快上市”。
05-13 19:10 一财最热 点击关闭