关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家269人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以军批准对黎巴嫩发动进攻的作战计划

新华社 浏览 3334

*ST景峰一字涨停,法院决定对公司启动预重整

第一财经 浏览 2935

美军连扣两艘油轮 美方:都是委内瑞拉“影子舰队”

新华社 浏览 311

夫妇盯上2‰自然损耗规则 上千吨粮食遭盗卖价值500万

CCTV今日说法 浏览 580

为什么最好全款买蔚来ES8,也不要贷款分期买?套路实在太多了

大志聊车 浏览 351

"小鹏X9"一夜成名 标配双腔空悬+后轮转向

车界全览 浏览 3152

马克龙:首批法国士兵已抵达格陵兰岛

界面新闻 浏览 331

尤斯特:我目前核心目标是保持巴萨稳定,让球队不受外部干扰

懂球帝 浏览 223

记忆|慕津锋:追忆杨振宁先生

上观新闻 浏览 449

人形机器人上演“春晚争夺战”,机器人到底是不是用来表演的?

BT财经 浏览 348

生于1996年女子连任董事长 去年薪酬92万元

每日经济新闻 浏览 541

合规上路的“老爷车” Cyan发布P1800 GT复刻版

撩车视界 浏览 3132

江铃旗下羿驰 05S 纯电紧凑型 SUV 将于10月16日上市

IT之家 浏览 447

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 495

今年春天最火的4双平底鞋,配裤子穿高级又松弛!

LinkFashion 浏览 217

以总理办公室:内塔尼亚胡28日将启程访美

上观新闻 浏览 340

LG将于8月开始为特斯拉生产4680电池

不看车bukanche 浏览 2964

AC米兰vs恩波利全场数据:射门数15-5,射正数5-2

懂球帝 浏览 3090

特朗普"朋友"1.3亿美元捐款到账 还不够美军发1天工资

红星新闻 浏览 550

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 461

89岁相声名家李如刚去世!师承侯宝林

楠楠自语 浏览 353
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8