故城县股票配资腾讯研究院AI速递 20250324

发布日期：2025-03-25 21:38 点击次数：164

生成式AI故城县股票配资

一、 OpenAI上新：语音转文本、文本转语音2套新模型，1个新网站

1. OpenAI发布两款新的语音转文本模型(gpt-4o-transcribe和gpt-4o-mini-transcribe)，价格优于Whisper且性能更佳；

2. 新推出文本转语音模型gpt-4o-mini-tts，支持指定内容和风格，最大支持2000 token；

3. 推出体验网站OpenAI.fm作为语音调试PlayGround，具有代码一键导出功能。

二、 Anthropic解锁Claude上线实时网络搜索，逆袭OpenAI和谷歌？

1. Anthropic为Claude推出网络搜索功能，终于摆脱了"数据截止"限制，现已向美国付费用户开放；

2. Claude作为第一梯队的AI助手最晚推出网络搜索，落后于Google Gemini、ChatGPT和DeepSeek等竞争对手；

展开剩余82%

3. 网络搜索提升了Claude的实用性，能实时获取信息并在回答中附上来源，但仍存在与普通搜索相同的上下文限制问题。

三、腾讯正式推出混元-T1：业界首个Transformer-Mamba 推理大模型

1. 腾讯发布自研深度思考模型混元T1正式版，具备快速响应和超长文处理能力，已上线腾讯云，即将在元宝灰度上线；

2. T1采用首创Hybrid-Mamba-Transformer融合架构，有效降低计算复杂度和内存占用，在相近激活参数量下解码速度提升2倍；

3. 在MMLU-PRO等多项benchmark上表现优异，达到87.2分，在长文本理解、上下文记忆方面展示独特优势。

四、 AlexNet，AI历史转折点，13年后源代码终于公开：带注释的原版

1. AlexNet源代码在13年后由谷歌与计算机历史博物馆(CHM)合作正式公开，包含原始代码和训练参数文件；

2. AlexNet是人工智能发展的转折点，由Krizhevsky、Sutskever和Hinton于2012年开发，引领计算机视觉领域革命；

3. 源代码公开历时五年谈判，代码中的实验记录注释展现了这一开创性神经网络的诞生过程，被誉为AI爱好者的宝库。

五、 ElevenLabs举办了一场全球黑客松活动，这些AI Voice产品得奖了

1. ElevenLabs价值30亿美元的语音AI黑客松吸引数百开发者参与，共创建超过300个AI Agent；

2. 全球冠军GibberLink实现AI间通信协议转换，爆火视频展示AI检测后切换到机器专属GGWave通信；

3. 活动囊括线上及全球六地线下赛事，获奖项目涵盖旅行、医疗、游戏、安全等多领域AI语音应用。

前沿科技

六、自动驾驶实现垂直领域的AGI，不是Robotaxi，而是RoadAGI？

1. RoadAGI是元戎启行提出的新技术路径，能实现不依赖高精地图的"门到门"自主移动，比L5级自动驾驶更快实现；

2. 元戎启行定位为AI公司而非智驾公司，VLA技术成熟是推出RoadAGI的关键，首个落地场景是无人配送；

3. 其CEO周光认为真正的AGI需要物理世界AI、数字AI和生成式AI打通，成为统一模型，RoadAGI是通往物理AI的垂直领域突破。

报告观点

七、 Sam Altman：作为10亿用户的消费者公司，OpenAI的过去和未来

1. ChatGPT的诞生是意外之喜，OpenAI已从研究实验室转变为拥有10亿用户的消费级公司，Altman承认原本没想到会成为大型消费互联网公司；

2. DeepSeek走红让Altman反思策略，他表示未来将在免费层级提供GPT-5，并暗示可能开源部分模型，向更开放的方向发展；

八、海外Agent落地有哪些新趋势？OpenAI 5号员工创办的公司这么看

1. Agent落地面临的主要痛点包括速度延迟、身份认证复杂、基础设施成本高、缺乏自主执行能力，现有云服务难以适配短时高并发与长时大规模需求；

2. Agent Orchestrator编排器是创业公司的核心竞争壁垒，决定了任务规划、并行处理与多Agent协作能力，未来并行Agent将显著提高执行效率；

3. 通用型Agent比垂直型Agent更具长期优势，能整合多功能一站式满足用户需求，Convergence AI的Proxy在上线一个月内已突破10万用户。

九、顶级风投发布生成式游戏报告：世界模型将是AI的下一个主要形式

1. 世界模型将成为AI的下一个主要形式，能够模拟虚拟世界随主体行为演变，提供三维互动体验，未来有望用于复杂任务执行；

2. 世界模型技术从2018年到2025年快速发展，从DeepMind的Genie到腾讯的GameGen-O，实现了更高保真度、更复杂物理效果和更强交互能力；

3. 世界模型短期内难以取代3A游戏，面临状态性限制、法律版权纠纷、缺乏三维数据集等问题，但通过混合方法有望在游戏和机器人等领域实现广泛应用。

十、 Nature发「智能体摩尔定律」，Agent能力每7个月翻倍，将远超人类

1. Nature报道AI Agents能力呈指数级增长，约每七个月翻一番，2024年加速至每三个月翻一番；

2. 研究提出"50%-任务完成时间跨度"指标，通过让AI与专业人员完成相同任务并比较成功率来衡量AI能力进展；

3. 按此"智能体摩尔定律"发展趋势故城县股票配资，预计5年后AI将能自动完成人类需一个月才能完成的任务，最快可能在2028年11月实现。