10
词表的选择如何影响语言模型训练?这可能是目前见...
预训练通用神经网络CHGNet,实现基于电荷的原子模拟
试过GPT-4V后,微软写了个166页的测评报告,业内人...
从观察、思考到行动,深度强化学习大牛Pieter Abb...
将LLaMA2上下文扩展至100k,MIT、港中文有了LongLoRA方法
利用进化扩散进行蛋白生成,微软开源新型蛋白质生...
Chinchilla之死:只要训练足够长时间,小模型也能...
20多种意识理论哪个才是主导?五年了,还没有赢家
浙大团队用深度学习方法进行高效、准确的大型文库...
以3D视角洞悉矩阵乘法,这就是AI思考的样子