暂无个人介绍
13层网络拿下83%精度,华为诺亚新型神经网络架构VanillaNet「简约」到极致
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
中山大学团队使用端到端图生成架构进行分子图编辑的逆合成预测
听说 DevOps 死了
面对复杂问题时,系统思考助你理解问题本质
十五天内,阿里云用三颗子弹击穿To B围城
大型系统如何划分边界?
一次10万token!GPT4最强对手史诗升级,百页资料一分钟总结完毕
SQL开源替代品,诞生了!
高中教师养出40亿美元超级独角兽,发布ChatGPT最大平替
互联网积分任务体系架构演进
业务系统故障率居高不下:有哪些非常有效的治理大招?
马腾宇团队新出大模型预训练优化器,比Adam快2倍,成本减半
24小时内、200美元复制RLHF过程,斯坦福开源「羊驼农场」模拟器
在Transformer时代重塑RNN,RWKV将非Transformer架构扩展到数百亿参数
13948道题目,涵盖微积分、线代等52个学科,上交清华给中文大模型做了个测试集
将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案
没有RLHF,一样媲美GPT-4、Bard,Meta发布650亿参数语言模型LIMA
可组合扩散模型主打Any-to-Any生成:文本、图像、视频、音频全都行
Meta用《圣经》训练超多语言模型:识别1107种、辨认4017种语言
有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义
分割一切模型SAM首篇全面综述:28页、200+篇参考文献
分割一切模型SAM首篇全面综述:28页、200+篇参考文献
7nm制程,比GPU效率高,Meta发布第一代AI推理加速器
首个基于交互式网页搜索的中文问答开源框架,清华、人大、腾讯联合发布WebCPM
大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型
PANet、DANet、FastFCN、OneFormer…你都掌握了吗?一文总结图像分割必备经典模型(三)
PANet、DANet、FastFCN、OneFormer…你都掌握了吗?一文总结图像分割必备经典模型(三)
PANet、DANet、FastFCN、OneFormer…你都掌握了吗?一文总结图像分割必备经典模型(三)
北京出手通用人工智能:产业创新伙伴计划公布,要推动大模型产业加速落地
7 Papers | 浙大研究获SIGMOD 2023最佳论文;GPT-4拿下最难数学推理数据集新SOTA
有手就行?把大象P转身只需拖动鼠标,华人一作DragGAN爆火
有手就行?把大象P转身只需拖动鼠标,华人一作DragGAN爆火
为多模态LLM指明方向,邱锡鹏团队提出具有内生跨模态能力的SpeechGPT
语音输入、多版本答案、……这八件事Bard能而ChatGPT不能做
CVPR 2023 | 多个扩散模型相互合作,新方法实现多模态人脸生成与编辑
ChatGPT官方APP上线:速度极快且免费、增加语音识别,网友:真香
训练开销骤减,10%成本定制专属类GPT-4多模态大模型
顺序决策与基础模型如何交叉互惠?谷歌、伯克利等探讨更多可能
CVPR 2023 | 神经网络超体?新国立LV lab提出全新网络克隆技术
以大模型加速新药研发,成本降低70%:一家大厂的「云端」实战
GPT-4的32k输入框还是不够用?Unlimiformer把上下文长度拉到无限长
3.6万亿token、3400亿参数,谷歌大模型PaLM 2细节遭曝光
70多种插件加持,联网版ChatGPT评测来了
一天自动发现四大数据库100+漏洞,浙大研究获SIGMOD 2023最佳论文
一定要「分词」吗?Andrej Karpathy:是时候抛弃这个历史包袱了
一定要「分词」吗?Andrej Karpathy:是时候抛弃这个历史包袱了
大模型迎来「开源季」,盘点过去一个月那些开源的LLM和数据集
照片转视频,像航拍一样丝滑,NeRF原班人马打造Zip-NeRF
照片转视频,像航拍一样丝滑,NeRF原班人马打造Zip-NeRF