🔥热榜:2025-04-23

微软的BitNet b1.58 2B4T 的技术报告悄然上线。其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。
近日,清华大学LeapLab团队联合上海交大,发布了一篇题为《Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?》的新论文,给最近火热的RLVR(带可验证奖励的强化学习)又“泼了一盆冷水”。
今天凌晨1点左右,华盛顿邮报最早报道了谷歌被起诉的消息。美国司法部要求法官通过强制销售Chrome来打破谷歌的搜索垄断地位。
15:46  微博  狐妖小红娘王权篇
15:46  微博  恋丑癖