在迭代以周为单位的今天,闭源不会是技巧成长最优的选择。ROLL选择开源,选择将价值释放给社区。这半年像一场合养分育的实验:我们被锋利的issue反馈敲打,被热情的代码供献鼓舞,也被跨时区的技巧评论辩论启发,恰是这些真实的陈迹,闪开源不再是一个技巧决定计划,而是人与人世的握手典礼。即使项目还未满周岁,我们依然想用这份小结,和所有介入者一路回望,确认我们始终朝着精确的偏向前行。
Github年鉴 “从第一行代码到2000星”
运营开源项目,最最惊喜的莫过于感触感染到社区供献的力量。诚然ROCK&ROLL照样异常年青的项目,我们也在这半年里收成了第一批同路人。感激以下几位供献者的介入(显示为Github ID,排名不分先后),我们也预备了有纪念意义的周边礼品,欲望延续这份情义和承认。
5月底开源以来,ROLL一向保持着活泼的更新频次,致力于将最新的才能、最好的体验带给社区用户。以下列举了项目这段时光的关键迭代,以及社区范围的参考数据:
学术副本通关 “这些arxiv快件已签收”
RollPacker:https://arxiv.org/abs/2509.21009
技巧研究须要学术界与工业界的双手推动。以前半年,我们和上海交通大年夜学、喷鼻港科技大年夜学等高校的研究团队并肩工作,提出了3A协同优化框架、ROLLPacker筹划等实用技巧,时代产出多项论文,个中ROLLPacker筹划已被体系范畴顶会NSDI'26收录,异常感激各位高校师生的协作与支撑。等待与更多学术界、工业界伙伴一路交换、进修、进步。
2025年即将落幕,这一年对ROLL而言是充斥生命力的起点。5月30日项目正式框架开源以来,我们经历了初次外宣的忐忑,见证了第一个社区开辟者供献的PR,目睹了issue从零增长到150,更在协作中打磨出情况开辟框架ROCK。截止此刻,我们在GitHub已收成 2500+ star,越来越多的人听到并开端应用、甚至上手开辟我们的项目。这些数字背后是成员们敲下的代码,留下的建议,以及深夜调试时屏幕前执着的眼神。
Tech Report:https://arxiv.org/abs/2506.06122
LitePPO:https://arxiv.org/abs/2508.08221
ROLL Flash:https://arxiv.org/abs/2510.11345
Asymmetric Proximal Policy Optimization:https://arxiv.org/abs/2510.01656
Attention Illuminates LLM Reasoning:https://arxiv.org/abs/2510.13554
RollMux:https://arxiv.org/abs/2512.11306
开辟者联机日记 “线上到线下的108种姿势”
本年我们也测验测验了不合情势的社区活动:我们在魔搭、青稞AI、智源等技巧社群进行直播分享,累计不雅看约7k人次,很多同伙经由过程直播熟悉了我们。同时项目也拓展了一些线下渠道,走进高校,介入行业和学术会议,与一线开辟者、行业前锋面对面交换,构成了开源社区最坚实的温度。今朝ROLL社群已近1k人。
开源豪杰榜 “请各位代码侠亮个相”
已与部分供献者建联,后续会拉群通知发奖事宜,还未建联的小伙伴请添加微信:tt19960718tt
礼品包含:contributor专属卫衣、ROCK&ROLL鸭舌帽、logo魔方数据线+挂件
再次感激大年夜家对我们的存眷和承认,新的一年项目也将保持高速迭代,将ROCK&ROLL打造成更高效、文档、易用的强化进修基本举措措施。假如以上内容对你有启发和触动,异常迎接参加我们,给项目点亮细姨星,共建RL生态!
-
ROLL:https://github.com/alibaba/ROLL
-
ROCK:https://github.com/alibaba/ROCK
-
小红书:https://www.xiaohongshu.com/user/profile/69264c230000000037002315
-
X:https://x.com/FutureLab2025
-
交换群:wx添加“aiospublic”
附录——对外分享材料
-
【视频】ROLL:高效且用户友爱的大年夜模型RL练习框架
-
【视频】ROLL 3A协同优化分享
-
【技巧文章】阿里给智能体造了个实战练习训练场
-
【技巧文章】阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

发表评论 取消回复