暂无个人介绍
类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练
大模型时代数据和隐私问题何解?来WAIC这场学术交流会听权威学者观点洞察
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
不到1000步微调,将LLaMA上下文扩展到32K,田渊栋团队最新研究
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力
英伟达H100用11分钟训完GPT-3,PyTorch创始人:不要只看时间
过去三个月,LLaMA系模型发展如何?指令微调的核心问题又是什么?
成本直降70%的秘密:这些企业找到了一种高性价比的AI打开方式
北工大校友Cheng Zhang获SIGGRAPH最佳博士论文奖
具身AI的实验:一个团队的Alexa Prize夺冠历程
DragGAN开源三天Star量23k,这又来一个DragDiffusion
理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度
四插槽庞大体积、功耗最高600W,英伟达RTX 4090 Ti谍照再现身
基于信息论的校准技术,CML让多模态机器学习更可靠
当医学插上人工智能的翅膀
ChatGPT时代,很想问问AI这些金融难题何解?
这场WAIC高端闭门会,我们将深度探讨大模型与智能驾驶如何碰撞
近期在招岗位:avolution.ai、京东科技、智源研究院、博世亚太研究院、IDEA研究院
大语言模型做数据助手,浙大Data-Copilot高效调用、处理、可视化数据
学习生成式大语言模型,东北大学自然语言处理实验室有一堂课
GPT-4得不到MIT学位,MIT研究团队回应「作弊」,但网友不买账
像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了
多模态大模型的下一站在哪里?
斯坦福训练Transformer替代模型:1.7亿参数,能除偏、可控可解释性强
Bert on ABSA、ASGCN、GAN、Sentic GCN…你都掌握了吗?一文总结情感分析必备经典模型
Bert on ABSA、ASGCN、GAN、Sentic GCN…你都掌握了吗?一文总结情感分析必备经典模型
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+
DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率
「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事
像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了
倾听AI领袖的声音,大模型时代AI的热点,尽在这场WAIC论坛
教科书级数据is all you need:1.3B小模型逆袭大模型的秘密
大模型也有好玩的数学? 从麦克斯韦的最低势能问题到人机对齐
结合亲和力提高了 28.7 倍,基于端到端贝叶斯语言模型的方法设计大型、多样化的高亲和力抗体库
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
ResponsibleTA提升LLM可靠性,任务完成更安全、更高效
基于Transformer的大模型是如何运行的?Meta从全局和上下文学习揭秘
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
大模型时代,一定要来讨论下数据与隐私
GPT-4是8x2200亿参数的混合模型?这个小道消息今天传疯了
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增
不写代码,一句提示生成整个代码库,GPT-Engineer项目火了
仅使用解码器实现语音翻译,字节跳动提出基于LLM的新范式PolyVoice
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
窥探他人眼中的世界:用眼睛反光重建3D场景,《黑镜》走进现实
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力