08
两个多月完成全自研:大模型之争,从 GPU 卷到了...
超越 GPT-4!加州大学伯克利分校与微软研究院合作...
最优化问题中步长越大、收敛速度越快,梯度下降算...
10B 以下开源中文对话模型,谁领风骚(1)
Transformer速查宝典:模型、架构、训练方法的论文...
既是自编码器,也是RNN,DeepMind科学家八个视角剖...
通讯 | Meta 的 AI 宏图,从解散蛋白质折叠研究团队开始
GPT-4调用插件40次都没成功,果断放弃,无效调用、...
大猩猩也会玩《我的世界》了,看一遍视频就能get新技能
大模型技术太难啃?来这场论坛高效完成技术升级