AI创投周报|智谱发布GLM-4.5融合大模型,多模态AI公司Reka AI完成
AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图片由“千象”(网址:www.hidreamai.com)生成
1. 智谱发布GLM-4.5融合大模型,以原生智能体能力挑战GPT-5
智谱AI近日推出新一代旗舰模型GLM-4.5,主打「Agent Foundation Model」定位,成为全球首个将推理、编程与智能体能力原生整合的融合大模型。该模型在发布后迅速引发行业关注,其实际表现甚至被OpenAI视为重要竞争对手,并在多项基准测试中位列国产模型第一。GLM-4.5的推出标志着国产大模型从参数竞赛转向能力融合的新阶段,其高效、低成本的特性使其成为开发者与企业的优选方案。
GLM-4.5的核心突破在于其ARC(Agentic/Reasoning/Coding)能力融合,支持全栈Agent开发、网页创作、PPT生成等复杂任务。实测显示,该模型不仅能生成交互式动态网页,还能精确模拟科学场景,如遵循霍曼转移轨道构建火星飞行器轨迹。其「Full-Stack全栈功能」可输出完整项目源码,两行代码即可接入Claude Code生态,性价比远超同类产品。此外,GLM-4.5采用混合专家架构,以355B总参数实现多项SOTA,生成速度突破100tokens/秒,API成本低至0.8元/百万tokens。这一系列创新使GLM-4.5成为AGI探索中的里程碑,重新定义了AI服务的实用边界。
2. 阶跃星辰发布Step 3多模态推理模型,开源性能比肩顶级闭源方案
阶跃星辰在2025WAIC上推出新一代多模态推理基座模型Step 3,以316B参数量实现开源领域突破性进展。该模型采用原创MFA架构,在MMMU、MathVision等12项基准测试中刷新开源SOTA,其国产芯片推理效率达DeepSeek-R1的300%,被业界视为"最适合应用的模型"。创始人姜大昕强调,Step 3的研发聚焦真实场景需求,联合华为昇腾等10家芯片厂商成立"模芯生态创新联盟",推动全产业链协同创新。
Step 3的核心突破体现在"多开好省"四大维度:原生支持视觉理解、代码生成等跨模态任务,7月31日将全面开源;在实测中能精准解析视觉错觉图像、计算复杂分账场景,甚至破解"吉娃娃松饼"视觉难题;通过注意力-前馈网络解耦(AFD)技术,8K上下文场景下解码成本低至0.055美元/百万token。其StepMesh通信框架实现异构芯片高效协同,在NVIDIA Hopper架构上吞吐量较DeepSeek-R1提升70%。作为阶跃"1+N"模型矩阵的核心,Step 3与Step 3o Vision等多模态模型共同构成AGI技术生态,目前已在华为昇腾等国产芯片完成部署,展现强大的产业落地潜力。
3. Edge浏览器推出Copilot模式:AI重塑网络浏览体验
微软近日为Edge浏览器推出革命性的“Copilot模式”,将传统浏览器转变为具备跨标签页情境感知能力的AI智能体。这一功能由微软CEO纳德拉亲自展示,能够同时分析多个网页内容,例如快速总结9篇Nature论文的共性。Edge产品副总裁表示,这标志着人类与网络互动方式的重大转折。目前该模式已在所有Copilot市场限时免费开放,仅支持Windows和Mac平台。
Copilot模式的核心在于深度整合AI能力。用户可通过统一输入框实现搜索、导航或对话,AI能自动识别意图并执行相应操作。例如,在浏览食谱时直接提取步骤并转换计量单位,或一键分组杂乱标签页。未来还将推出“主题式旅程”功能,根据用户研究主题推荐学习路径。微软强调隐私保护,敏感操作需单独授权。此举被视为对Chrome的挑战,同时区别于激进AI浏览器初创公司的方案,微软选择兼顾传统功能与AI创新。分析指出,浏览器可能从免费转向订阅模式,AI或成为付费核心功能,预示网络浏览新时代的到来。
4. 火山引擎发布SeedEdit 3.0:AI图像编辑迈入精准可控时代
在2025WAIC上,火山引擎正式发布豆包・图像编辑模型SeedEdit 3.0,并上线火山方舟平台。作为字节跳动旗下火山引擎的核心AI产品,该模型聚焦解决图像编辑领域个性化需求激增与智能化不足的痛点,通过"指令驱动"革新传统修图流程,实现"打字P图、指哪改哪"的精准控制体验。其技术底座源于豆包文生图模型Seedream 3.0的深度优化,在多项关键指标上实现突破性进展。
SeedEdit 3.0的核心突破体现为三大维度:指令精准响应能力支持单命令完成复杂操作,如精准消除画面指定元素(路人、水印)并自然补全背景,或一键替换商业海报文字且保持原字体风格;多场景编辑泛化性覆盖人像光影重塑、黑白照片风格化上色、线稿转写实建筑等进阶需求,实测中成功将黄昏暖色调精准融入海边静物,并将服装设计线稿转化为真实材质渲染;跨模型性能优势在定量测试中,其CLIP图像相似度评分超越Gemini 2.0、Step1X等模型,人脸保持能力显著领先,在横向对比中,文字编辑精准度与风格转换质量均优于GPT-4o和Gemini 2.5 Pro。技术层面,该模型通过多源数据融合策略(合成数据/专家编辑数据/视频帧数据)与多粒度标签体系解决语义一致性难题,采用扩散模型蒸馏与自适应采样技术实现8倍推理加速,生成耗时从64秒降至8秒。作为国内首款产品化AI修图工具,SeedEdit 3.0已在电商海报生成、影视特效制作等领域展现颠覆性应用潜力。
5. 后摩智能发布业界能效比最高的存算一体AI芯片M50
后摩智能在2025WAIC上发布了一款突破性产品——后摩漫界®M50,这是该公司潜心两年研发的成果。M50是一款基于存算一体技术的端边大模型AI芯片,以其超高的能效比成为业界标杆。吴强表示,后摩智能的目标是让大模型算力像电力一样普及,真正赋能各行各业。
M50的核心亮点在于其第二代存算一体技术。该芯片拥有160TOPS@INT8的物理算力和100TFLOPS@bFP16的浮点算力,同时具备153.6GB/s的超高带宽和最大48GB内存,而典型功耗仅为10W,相当于手机快充的功率。这一突破得益于后摩智能自研的第二代SRAM-CIM技术,通过深度改造SRAM阵列,实现真正的“存内计算”,大幅提升效率。此外,M50搭载的天璇架构支持弹性计算,可跳过比特级零值计算,最高加速160%,并首次在存算架构上实现浮点运算量产。配套的后摩大道®编译器工具链进一步降低了开发门槛,使大模型部署更加便捷。后摩智能还同步推出了基于M50的终端和边缘计算产品矩阵,包括力擎™系列M.2卡和力谋®系列加速卡,覆盖从AI PC到工业质检的多样化场景。吴强透露,公司已启动下一代DRAM-PIM技术研发,未来将推动百亿参数大模型在终端设备的普及。
6. 上海交大联合团队开源端侧原生大模型SmallThinker,突破移动AI瓶颈
上海交通大学IPADS研究所、人工智能学院联合初创公司本智激活(Zenergize AI)在HuggingFace开源了专为端侧设备设计的原生大模型SmallThinker系列。该系列包含SmallThinker-4B-A0.6B和SmallThinker-21B-A3B两个稀疏模型,其创新架构直接从零预训练,无需依赖高端GPU,仅用端侧CPU即可实现高效推理,标志着端侧AI技术的重大突破。
SmallThinker的核心优势在于其针对端侧算力、内存和存储特性的三大原创设计:双层稀疏架构将稀疏度提升5倍,专家路由前置技术隐藏I/O延迟,混合稀疏注意力机制降低76%的KV缓存占用。其中,4B模型在1GB内存限制下推理速度达19.41 tokens/s,而21B模型在百元级国产RK3588开发板上比同类模型快21倍。团队配套开源的PowerInfer推理框架进一步释放性能潜力,使模型在手机极限内存(1GB)场景下仍保持流畅运行。评测显示,SmallThinker不仅智力超越同尺寸开源模型,更在8GB内存的PC端实现2倍于Qwen3-30B的推理速度。未来,团队计划通过持续预训练和智能体开发,推动端侧AI向“个人贾维斯”演进。
7. 京东云开源JoyAgent智能体平台,企业级AI落地门槛归零
京东云在2025WAIC上宣布开源企业级智能体平台JoyAgent,成为全球首个100%开源的完整智能体解决方案。该平台基于京东内部超2万智能体实践打磨,包含前后端、框架引擎等全栈能力,支持docker一键部署,在GAIA榜单上以75.15%准确率比肩商业产品。其独特之处在于彻底解决了企业智能体"最后一公里"难题——无需二次开发即可直接投入生产环境使用,将传统需要数百万投入的企业AI部署成本降至零。
JoyAgent的核心突破体现在四大技术创新:采用"计划层+执行层"双级架构,实现复杂任务的智能分解与高效执行;首创文件系统与内存混合的上下文管理系统,突破大模型token限制;工具智能体可动态进化角色,使错误率降低40%;支持五线程并行搜索,生成专业报告速度提升3倍。实测显示,仅需简单指令即可自动完成"新疆七日游规划+火车票查询"等复合任务,生成包含可视化图表、参考文献的深度行业报告。其企业级安全性通过京东618等亿级流量场景验证,为金融、供应链等严肃商业场景提供开箱即用的可靠AI支持。
8. OpenAI推出苏格拉底式学习模式,AI导师颠覆传统教育
OpenAI近日为ChatGPT上线全新"Study and Learn"学习模式,采用苏格拉底式教学法,专为大学生设计复杂学科辅导。该功能面向所有版本用户开放,未来几周将扩展至教育专用版,上线首日即引发热潮,大学教授主动请求接入教学系统,网友预言这将重塑教育AI市场格局。这一创新标志着OpenAI从知识输出转向能力培养的战略转型,其系统提示词已被开发者破译,展现出高度可复用的教育框架。
学习模式通过四重机制实现深度教学:交互式提问引导主动思考,分步骤拆解博弈论、贝叶斯定理等难点;个性化评估用户基础后动态调整教学深度,如量子力学讲解会区分入门与专业需求;实时知识检查通过测验反馈巩固学习效果;全程支持自由切换教学模式。实测显示,面对"离散数学复习"需求,AI能制定分层教学计划,3小时助学生攻克正弦位置编码难题;在国产芯片适配性测试中,其教学响应精准度较传统教育AI提升70%。这种"有教无类"的智能辅导,正推动AI从冰冷工具向温暖导师进化,谷歌、Anthropic等厂商已跟进布局类似功能。
人工智能初创公司的新融资
1. Reka AI完成1.1亿美元B轮融资,资金将用于研发扩展与企业级AI推广
公司网址:https://reka.ai
近日,Reka AI宣布完成1.1亿美元B轮融资,公司估值达10亿美元。本轮融资吸引了NVIDIA和Snowflake等科技巨头的参与,彰显了市场对其多模态AI技术的高度认可。融资资金将主要用于加强研发能力,并加速企业级AI应用的商业化落地。
Reka AI是一家专注于多模态人工智能技术的前沿公司,致力于开发能够同时处理文本、图像、视频和音频的AI系统。其核心产品包括三个层级的模型:Reka Edge(70亿参数):轻量级模型,适用于边缘计算场景;Reka Flash(210亿参数):平衡性能与效率,适合通用任务;Reka Core:旗舰级高性能模型,支持复杂跨模态推理。这些模型在多项基准测试中表现优异,例如在视频问答任务上超越Gemini Ultra,并具备多语言对话、代码生成等能力,进一步巩固了其在行业内的技术领先地位。
2. Armada完成1.31亿美元战略融资,加速模块化数据中心与边缘计算服务扩展
公司网址:https://www.armada.ai
边缘计算公司Armada近日宣布完成1.31亿美元战略融资。本轮融资由新投资者Pinegrove、Veriten和Glade Brook领投,现有投资者Founders Fund、Lux Capital、Shield Capital、8090 Industries及微软旗下M12风险基金继续跟投。融资资金将用于开发新一代模块化数据中心,并进一步扩展其边缘计算服务网络。
Armada专注于为偏远及恶劣环境提供去中心化的高性能计算解决方案,通过模块化硬件与软件平台,将实时数据处理和人工智能能力部署至网络边缘。其核心产品包括:Galleon移动数据中心:集装箱式、自给自足的便携数据中心,适用于油井、矿山、战场等低连接或无网络区域,支持实时AI分析(如ChatGPT、计算机视觉)。软件生态系统: Commander平台用于统一管理边缘设备的连接、数据流及预测性维护;专为Starlink卫星通信及物联网设备优化的操作系统Armada Connect,确保偏远地区稳定联网。目前,Armada已与Wipro、Newlab等行业伙伴合作,为能源、采矿、物流等领域提供定制化边缘AI解决方案,减少对集中式云的依赖,显著提升实时决策效率。
3. Gaia Labs完成2000万美元种子轮及A轮融资,资金将用于AI智能手机研发、节点网络扩展与Web3集成
公司网址:https://www.gaianet.ai
Gaia Labs近期宣布完成2000万美元种子轮和A轮融资。本轮融资由ByteTrade/SIG Capital(隶属Susquehanna集团,金融科技与AI领域头部投资机构)和Mirana/Mantle Eco Fund(Mantle生态基金,专注Web3基础设施建设)联合领投,EVM Capital、Taisu Ventures、NGC Ventures等多家区块链与AI领域机构参与投资。本轮融资资金将重点用于AI智能手机研发、分布式节点网络扩展及Web3生态集成,进一步推动去中心化AI基础设施的规模化落地。
Gaia Labs是一家专注于构建去中心化人工智能基础设施的科技公司,致力于开发独立于中心化控制的AI系统,并利用区块链技术保障数据安全与透明度。目前,公司已部署超过70万个分布式节点,覆盖数千个区块链生态,累计处理17万亿次AI推理请求,同时为开发者提供开放工具包以构建去中心化AI应用。此外,Gaia Labs正在推进全球首款AI原生智能手机的量产计划。该手机基于三星Galaxy S25 Edge硬件定制,支持本地化AI推理(如多模态交互、实时翻译等),无需依赖云端服务器即可运行复杂模型,确保用户对数据与代理行为的完全控制权。公司旨在通过技术栈扩展与Web3深度集成,解决传统AI系统在隐私垄断、算法偏见等领域的核心痛点,重塑人机交互范式。
4. CoreWeave完成17.5亿美元优先票据发行,资金将用于AI基础设施扩建
公司网址:https://www.coreweave.com
美国AI云计算服务商CoreWeave宣布成功发行17.5亿美元优先票据,较原计划的15亿美元规模扩大2.5亿美元。该债券期限至2031年,年利率为9%,募集资金将主要用于人工智能基础设施项目的建设与扩展。
CoreWeave是一家专注于GPU加速云计算服务的人工智能基础设施提供商,其核心业务依托高性能GPU集群(如英伟达H100及Blackwell架构芯片),为AI训练、推理、视觉特效渲染及生命科学计算等高负载场景提供弹性、低成本的算力支持。该公司的Kubernetes原生云平台提供虚拟/裸金属服务器、存储及网络服务,支持按小时租赁模式,相比传统云服务,其性能提升35倍,成本降低80%。此外,CoreWeave通过与英伟达深度合作,确保硬件技术持续领先。
5. Maro完成430万美元种子轮融资,用于加促进其安全领域产品开发
公司网址:https://seekmaro.com
Maro宣布完成430万美元种子轮融资,由Downing Capital Group领投。本轮资金将用于加速团队扩张、产品技术迭代及市场推广战略,进一步深化其在认知安全领域的解决方案覆盖。
Maro是一个认知安全平台,专注于解决由人为因素(Human Risk)引发的安全风险问题。其AI技术通过实时动态干预,帮助企业防御由AI技术放大的社会工程攻击、内部威胁及非受控AI使用等隐患。平台结合行为分析与意图识别模型,为安全管理者提供员工行为与风险的即时可视化分析,在风险演变为安全事件前主动干预。其核心在于将认知心理学与机器学习融合,构建动态防御系统,覆盖金融、科技等高敏感行业,显著降低人为失误导致的安全漏洞与合规成本。
6. Nexxa.ai完成440万美元种子前轮融资,资金将用于团队扩张与工业领域拓展
公司网址:https://nexxa.ai/
Nexxa.ai近日宣布完成440万美元种子前轮融资,本轮融资由a16z speedrun领投,Augment Ventures、Propeller Ventures、Plug and Play、Beat Ventures、SBI、Untapped Ventures、Cross Atlantic Angels等机构跟投,天使投资人Rick Berry和Pat McCarthy也参与了投资。融资资金将主要用于扩充工程团队,并进一步拓展工业领域的业务布局。
Nexxa.ai是一家专注于将认知型AI技术深度应用于重工业领域的技术公司,其核心解决方案是通过开发能够与现有工业软件无缝集成的智能代理系统,为制造业、能源、采矿、铁路及建筑工程等领域提供新一代自动化支持。区别于传统RPA的刚性规则驱动模式,该平台采用基于成功标准的认知自动化方法,使AI代理既能辅助工程师完成复杂技术任务,也可自主执行操作。在保留企业现有软件投资的前提下,通过具备工程语义理解能力的AI代理,有效解决全球400万工业工程师面临的碎片化系统与手工流程痛点。典型案例显示,其解决方案可像"确保车内清洁"这样定义目标导向任务,由AI自主规划执行路径,这种范式显著提升了在航空航天、汽车等财富500强企业遗留系统中的工作流效率。该技术特别适用于需要协调多套专业工程工具与估算系统的复杂场景,为重工业数字化转型提供了兼具灵活性和适应性的实施路径。
7. 心理健康人工智能公司Slingshot AI完成5300万美元A轮融资
公司网址:https://slingshot.xyz
Slingshot AI近日宣布完成5300万美元A轮融资,由Radical Ventures和Forerunner Ventures领投。本轮融资后,公司总融资额达9300万美元。资金将主要用于加速其AI心理治疗助手Ash的市场推广,并拓展多语言服务与全球覆盖范围。
Slingshot AI是一家专注于心理健康领域的人工智能公司,其核心产品Ash是一款基于心理学专业模型的AI治疗助手,能够通过语音或文字交互提供个性化心理支持,帮助用户管理情绪、应对生活压力及改善人际关系。公司旨在通过技术手段缓解全球心理健康资源短缺问题,尤其聚焦亚临床人群的需求。
8. Memories.ai完成800万美元种子轮融资,加速视觉记忆技术研发与商业化落地
公司网址:https://memories.ai
Memories.ai近日成功完成800万美元种子轮融资,由Susa Ventures领投,Samsung Next、Crane Venture Partners、Fusion Fund、Seedcamp及Creator Ventures跟投。本轮资金将用于技术研发与市场拓展,进一步推动其视觉记忆技术的规模化应用。
作为一家专注于长视频内容理解的AI公司,Memories.ai致力于开发全球首个大型视觉记忆模型,赋予AI类人的长期视觉记忆能力。其平台可高效处理千万小时级视频数据,通过创新的“索引+检索”机制模拟人类记忆流程,实现视频数据的高效压缩、关键信息提取及跨时段关联分析。目前,其技术已应用于安防与营销领域:为安保企业提供秒级监控录像风险行为定位服务;帮助品牌方分析社交媒体视频趋势,并支持自然语言交互查询。Memories.ai的技术突破在于解决了传统AI模型对长视频(超过2小时)的认知局限,并在多项视频分类与检索基准测试中刷新了SOTA性能。未来,公司计划将技术拓展至机器人视觉记忆、自动驾驶场景理解及智能眼镜等新兴领域。
关于阿尔法公社