暂无个人介绍
OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息
亚马逊云科技,定义了生成式AI的生产力
类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练
大模型时代数据和隐私问题何解?来WAIC这场学术交流会听权威学者观点洞察
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
不到1000步微调,将LLaMA上下文扩展到32K,田渊栋团队最新研究
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力
英伟达H100用11分钟训完GPT-3,PyTorch创始人:不要只看时间
过去三个月,LLaMA系模型发展如何?指令微调的核心问题又是什么?
DragGAN开源三天Star量23k,这又来一个DragDiffusion
理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度
四插槽庞大体积、功耗最高600W,英伟达RTX 4090 Ti谍照再现身
基于信息论的校准技术,CML让多模态机器学习更可靠
ChatGPT时代,很想问问AI这些金融难题何解?
这场WAIC高端闭门会,我们将深度探讨大模型与智能驾驶如何碰撞
近期在招岗位:avolution.ai、京东科技、智源研究院、博世亚太研究院、IDEA研究院
大语言模型做数据助手,浙大Data-Copilot高效调用、处理、可视化数据
像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了
多模态大模型的下一站在哪里?
斯坦福训练Transformer替代模型:1.7亿参数,能除偏、可控可解释性强
Bert on ABSA、ASGCN、GAN、Sentic GCN…你都掌握了吗?一文总结情感分析必备经典模型
Bert on ABSA、ASGCN、GAN、Sentic GCN…你都掌握了吗?一文总结情感分析必备经典模型
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+
DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率
教科书级数据is all you need:1.3B小模型逆袭大模型的秘密
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
基于Transformer的大模型是如何运行的?Meta从全局和上下文学习揭秘
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
大模型时代,一定要来讨论下数据与隐私
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增
不写代码,一句提示生成整个代码库,GPT-Engineer项目火了
仅使用解码器实现语音翻译,字节跳动提出基于LLM的新范式PolyVoice
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
窥探他人眼中的世界:用眼睛反光重建3D场景,《黑镜》走进现实
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
CVPR 2023|All in UniSim:统一的自动驾驶仿真平台
专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型
超越所有开源模型,击败 Claude、Bard,专门用于编程任务的大模型来了
一文概述联邦持续学习最新研究进展
一文概述联邦持续学习最新研究进展
一文概述联邦持续学习最新研究进展
理想自研认知大模型、无图城市NOA信息曝光,纯电MEGA定价50万以上
基于扩散模型的音频驱动说话人生成,云从&上交数字人研究入选ICASSP 2023
MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型
llama.cpp作者创业,用纯C语言框架降低大模型运行成本
语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务