20

主题

0

回帖

103

修为

高级合伙人

modelscope.cn 官方

积分
87

🚀 2025年末,DeepSeek 3.2强化推理与Agent能力,Mistral-3系列回归,智谱开源周连发GLM-4.6V、AutoGLM-Phone、RealVideo等多模态重磅模型~
🎨 文生图赛道卷出新高度:Flux2登场,Z-Image-Turbo 在6B规格上凭「10步内高质量出图+超强中英理解」引爆社区,生态迅猛崛起,魔搭Day 0全链路支持!
🔧 开源基建持续深耕:DiffSynth首发i2L(image-to-LoRA)登双榜热搜、SWIFT拓展GRPO生态+国产芯片支持,Agent与评估工具快速迭代,让模型「好训、好用、好落地」~
🌍 不止线上——魔搭国际站优化+首场韩国线下活动圆满收官,杭州开发者中心正式启用,魔搭开源从此有了「实体孵化器」✨
不知不觉中,我们就走到了2025年的末尾,本月我们也迎来了DeepSeek 3.2正式版本的更新,通过对推理和agentic能力的增强,新版本的V3.2无疑为模型在实际应用中落地提供了更全面的支持,同时发布的还有专注于深度思考的Speciale版本,旨在探求模型智能的边界。在文本生成模型领域,MistralAI久违的带来了Mistral-3系列,包括Mistral-Large-3和Ministral-3等模型。另一方面,在刚刚划上句号的智谱开源周期间,智谱给开发者带来了全方面的惊喜。从GLM-4.6V在视觉理解的全面提升,到AutoGLM-Phone在通过模型管控操作智能终端设备方面的探索,再到GLM到ASR-nano与TTS模型带来的在语音领域上的新进展,以及RealVideo等一系列模型在实时视频交互上的突破,智谱在各种模态模型上的全方面的投入和开放,为社区发展注入了新的活力。
而在视觉生成,尤其是文生图领域,过去一个月更是让广大开发者目睹了社区“日新月异”的进展。首先是广受关注的Flux系列模型,在本月推出了新一代Flux2版本。其后社区则迎来了新选手Z-Image-Turbo:作为一个只有6B规格的模型,Z-Image-Turbo能在10步以内生成高质量的图片,在人像领域尤为突出,同时展示出了良好的中英文文本语义理解。开发者对于Z-Image 的热烈反馈,使得其生态展现出了类似早期StableDiffusion时代蓬勃发展的态势。ModelScope也在Day 0提供了对于Z-Image的支持,包括生图,API-Inference,以及Gallery的托管。本月同时发布的还有来自美团龙猫的Longcat-Image系列,涵盖了生图,编辑等模型。此外不同垂直领域的模型,包括来自NewBieAI的二次元图片生成模型等,都为开发者所乐见。而在图像/视频分割领域,facebook的sam系列正式推出了sam3系列,在分割能力上又上了一个全新的台阶。
在关注头部模型发布的同时,我们在开源工具链生态方面的探索也一致在稳步向前。基于ModelScope的DiffSynth框架,我们开源了业界第一个 i2L (image-to-LoRA)模型,在社区获得了较好的反馈,在ModelScope和Hugging Face上实现了trending双榜上榜。同时尾了丰富Z-Image模型生态,我们探索了一个在保留快速生成的Turbo能力,同时能保障高质量图片产出的LoRA训练方案。而在模型训练微调框架SWIFT中,我们添加了GRPO Megatron训练的支持,并持续推进新RL算法、新模型、以及新的国产化硬件的接入与支持。同时在Agent生态以及模型评估框架方面,我们也持续推进着功能的快速迭代。站点服务方面,我们依然专注于平台能力与易用性的建设,旨在为广大开发者提供最全面和最好用的开源模型平台与社区能力。
为了更好触达海外的开发者,我们也在持续丰富魔搭的国际站( modelscope.ai )的内容与平台优化。上个星期我们在韩国举办了第一次魔搭的海外线下开发者活动,收到了韩国本地开发者的热情支持。同时11月22号,伴随杭州AI开源生态大会的召开,魔搭社区的杭州线下开发者中心也正式启用。除了在大会期间和开发者线下meetup和密集讨论,开发者中心为广大社区用户提供了一个线下的长期“据点”,也为支撑开源模型和开源项目,从线上走到线下并孵化成产品提供了依托。我们期望更多的社区上的想法和创新能在这里进行转化。
· 站点更新
     1. ModelScope的社区组织页面上线:https://www.modelscope.cn/organizations,方便各个组织能在社区上有更好的入口呈现。



     2. 模型列表页,除了展示模型卡片以外,也提供 合集 卡片的混排能力,更好的支持大规模的“系列模型”发布的场景





     3. 我们在AIGC专区引入了魔粒(magicube)体系,在持续为广大开发者提供免费的生成和训练资源的同时,也鼓励大家更多参与社区互动和分享,来获得更多的算力支持。





     4. 创空间开放了基于Docker创建的能力,支持更加自由的AI应用搭建和分享





     5. 拓展API-Inference支持更多Qwen-Image等生态LoRA的支持,同时提供了LoRA页面的demo。





     6. 支持图像编辑模型,以及lora模型的基于API-Inference实现的模型页面demo,并支持在API-Inference上配置多个组合LoRA生图的能力。







     7. MCP playground (
https://modelscope.cn/mcp/playground) 完成了新版本升级,允许用户自定义模型API,包括API-Inference以及三方API





     8. AIGC专区支持了Qwen-Image-Edit-2509等模型的多图模式训练。






     9. 对于AIGC的申请制模型,在保持下载单独申请的同时,开放在线生图能力。支持开发者在维持可控的下载范围的同时,模型能力能在更广的范围内被生态用户体验和使用。



     10. 我们对于AIGC专区的模型卡片,进行了样式改版,突出模型作者KOL的id等信息,支持模型作者更好的宣传和推广




     11. 国际站支持了github登录,并在全面优化海外模型加速的同时,对于下载文案等提示进行了改进。




     12. 国际站支持了“阿里云国际”账号的绑定与解绑                                            




     13. 国际站AIGC专区能力对齐(包括多图,edit训练等)                     




     14. 模型列表页的模型卡片,支持直接透传模型参数规模信息。方便开发者更直观了解模型的规格等信息        




     15. 对于safetensors等模型文件,支持在文件详情页,直接展示meta header以及模型结构信息




     16. 为了更好支持单个repo里多样化内容存储和分享的场景,我们支持了通过链接url直接分享与访问repo内子文件夹的能力。相对应的,在Repo(模型库/数据集/创空间)中,也支持通过页面直接创建新目录的能力。




     17. SwingDeploy支持了基于sglang引擎的模型服务部署能力                                             




     18. 对于AIGC 专区的模型,支持了通过页面上传时的断点续传能力。  


· 开源SDK与工具链更新
     1. SWIFT 3.11 版本发布。






      • 支持了GRPO Megatron训练,同时在Megatron-SWIFT上提供了FP8 blockwise训练的支持,并且支持了MTP训练以及提供了对于不同版本(0.12-0.15)的megaron-core的支持




      • RL方面,提供了对于新的SAPO,CISPO等算法的支持,并引入了tree-rollout的实现。对于训推不一致的场景,提供了缓解方案。完成了对GRPO losstype的新增




      • 训练框架方面,完成了对cached dataset 的重构,来更好支持大型数据集离线 tokenize 场景。预训练场景提供了 --truncation_strategy split 新策略。




      • 国产硬件支持方面,在 Megatron-SWIFT 中提供了对昇腾 NPU的支持,同时对于昇腾NPU混合算子,支持了 Qwen2、Qwen3、Qwen3-MoE 系列模型,来实现训练过程的加速。



     2.EvalScope 1.2版本发布。支持自定义函数调用(function-call)评测,以及自定义视觉问答(VQA)评测。更新了聚合(agg)参数,优化评分聚合机制,并优化了性能测试(perf)相关参数配置。在基准测试支持方面,添加了A_OKVQA、CMMU、CMMMU、ScienceQA、V*Bench、MicroVQA 等多模态基准测试,以及 GSM8K-V、MGSM、IFBench、OpenAI MRCR 等基准测试。同时在代码评测方面 新增 了SWE-bench_Verified、SWE-bench_Lite、SWE-bench_Verified_mini、SciCode 等一系列代码能力评测。
     3. ms-agent:  Agent Skills增加依托hub探索skills reop的能力。包括Memory管理等功能完善并集成MCP Playground中,FinResaerch能力发布,并提供创空间体验:https://www.modelscope.cn/studios/ms-agent/FinResearch
     4. DiffSynth:DiffSynth 2.0整体架构重构完成,提供更完善的内存/显存管理框架,并支持Split Training,Differential LoRA Training以及FP8 training等新能力。在新框架上支持了Z-Image以及FLux.2等新模型,并发布了i2L模型,以及探索了对于蒸馏Turbo模型的训练支持。




👇点击关注ModelScope公众号获取更多技术信息~



您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

© 2001-2025 BBS.Monster