您的当前位置:首页 >风闻播 >独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元 正文
时间:2025-07-12 08:13:09 来源:网络整理编辑:风闻播
近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。雷峰网独家获悉,杨红霞已于 5 月下旬正式从字节跳动离职,开始筹备 AI 创业项目。不过,杨红霞不做“大”模型,而是将方 杨某网红翻车粉圈轰动
近日,端侧模型关于字节跳动大语言模型研发工艺专家杨红霞离职创业的杨红业入事情,坊间传得沸沸扬扬。霞创
雷峰网独家获悉,局投杨红霞已于 5 月下旬正式从字节跳动离职,后估开始筹备 AI 创业项目。值亿杨某网红翻车粉圈轰动不过,美元杨红霞不做“大”模型,端侧模型而是杨红业入将方向瞄准端侧模型,布局 AI Agent。霞创目前,局投团队正在筹备组建中,后估已获得 3000 至 4000 万美元的值亿投资,投后估值 1.5 亿美元。美元
此前,端侧模型杨红霞为大家所熟知的是,她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的工艺负责人,参与过北京智源研究院主导的“悟道”大模型项目,而该项目是高某艳照流出热搜截图中国最早的大模型项目之一。
在字节跳动的大模型队伍中,杨红霞的学术气质较为突出。据雷峰网(公众号:雷峰网)梳理,字节大模型团队的核心成员主要是在字节抖音、西瓜等产物内部成长起来的骨干。
2007 年,杨红霞从南开大学本科毕业后,赴杜克大学攻读博士,师从著名统计学家 David Dunson,著有超过 100 篇杰出学术论文。
博士毕业后,杨红霞入职 IBM 全球研发中心任 Watson 研究员,之后又加入雅虎公司,担任首席信息科学家。
2016年,杨红霞回国加入阿里达摩院,就职期间杨红霞的职级为 P9,曾任达摩院智能计算实验室主任,作为工艺负责人,一路见证了 M6 从百亿、千亿进化到万亿参数量规模。
去年年初,杨红霞加入字节跳动 AML(Applied Machine Learning,机器学习系统),向团队的负责人项亮汇报,带领一支大约 40 人的团队。
如今,杨红霞身上又多了一层创业者的身份。
今年以来,通用大模型格局逐渐收缩,落地应用成为主旋律,越来越多的目光开始瞄向行业、端侧大模型。而端侧模型,主要应用在手机、电脑、智能网联汽车等终端设备上,具有成本低、移动性强、信息保障等优势,正逐渐成为行业追逐的热门话题。
今年 2 月,清华 THUNLP 走出的 AI 公司——面壁智能推出 20 亿参数的开源端侧模型 MiniCPM;
4 月,商汤推出 1.8B 参数规模的 SenseChat-Lite 版本端侧⼤模型;
5 月,来自斯坦福大学的 NEXA AI 团队发布了全球首个参数量小于 10 亿的多模态 AI Agent 模型 Octopus V3,在函数调用性能上远超同类模型,可与 GPT-4V+GPT4 相媲美,更是将端侧模型卷到新高度。
据了解,NEXA AI 团队创始人兼首席科学家陈伟(Alex Chen),正在攻读斯坦福大学博士学位,拥有丰富的AI研究经验;联合创始人兼首席工艺官李志远,毕业于斯坦福大学,并在 Google 和 Amazon Lab 126 实验室拥有 4 年端侧 AI 的研发经验。
不管是手机,还是电脑,或者汽车,在人们的生活中都扮演着关键角色,可见,端侧大模型前景广阔,在如何更好地训练出小且好用的端侧模型的新行业命题下,大有可为。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」2025-07-12 08:09
对话零一万物:大模型产品要找到 TC2025-07-12 07:46
2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业2025-07-12 06:56
价格战之后,智谱来到商业化的下一站2025-07-12 06:26
大模型落地,向量数据库能做什么?2025-07-12 06:18
谁将替代 Transformer?2025-07-12 06:16
哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世2025-07-12 06:16
DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」2025-07-12 06:07
2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业2025-07-12 05:49
对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」2025-07-12 05:47
乌克兰声称已拘留两名中国公民 外交部回应2025-07-12 07:51
南方电网发布首个「电力大模型」,百度智能云助力「智能电网」2025-07-12 07:45
马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开2025-07-12 07:44
对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」2025-07-12 07:34
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕2025-07-12 06:59
若愚科技:基于多模态大模型的机器人“大脑”领导者2025-07-12 06:54
人大 Sora 思辩:Sora 到底懂不懂物理世界?2025-07-12 05:43
对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型2025-07-12 05:42
以技术为引 以创意为核 上影节用新拥抱电影2025-07-12 05:40
当「养老」遇上 AI 大模型2025-07-12 05:35