清华AI研究院里程碑事件:成立「智能人机交互研究中心」,发布四大开放平台

简介: 昨日(5 月 21 日),清华大学「智能人机交互研究中心」成立仪式在清华大学李兆基科技大楼举行。这是继「知识智能研究中心」、「听觉智能研究中心」、「基础理论研究中心」后,清华大学 AI 研究院第四个研究中心。

清华大学副校长、清华大学 AI 研究院管委会主任尤政院士和清华大学 AI 研究院院长张钹院士出席成立仪式,共同为中心揭牌。

尤政院士在致辞中表示,成立智能交互研究中心是清华大学推进人工智能发展的重要举措,也是清华大学 AI 研究院的里程碑事件。

微信图片_20211201005755.jpg

图说:智能交互中心成立仪式合影

「人工智能的重要需求来自人机交互。」张钹院士在致辞中表示,⼈机交互核⼼问题是⾃然⾏为的意图理解,而解决这一核心问题必须要经过跨学科的研究。

为了更好汇聚清华大学在智能人机交互方面多学科的优势研究力量,清华大学 AI 研究院决定成立智能人机交互研究中心(英文:Intelligent Human Computer Interaction Research Center,简称 THUII,以下简称「智能交互中心」)。

史元春教授(清华大学计算机系「长江学者」特聘教授、清华大学全球创新学院 GIX 院长)被聘请为智能交互中心主任,高文教授(中国工程院院士、北京大学博雅讲席教授、信息科学技术学院院长)和戴国忠研究员(中科院软件所人机交互技术与智能信息处理实验室首席研究员)被聘请为智能交互中心学术顾问。

微信图片_20211201005759.jpg

图说:尤政院士(左)、张钹院士(右)为史元春教授(中)颁发聘任证书

研究团队聚集了计算机系、心理学系、生物医学工程系、美术学院、工业工程系、社会科学学院等 6 个院系的专家学者。

三大使命

计算设备、传感器、数据和算法日益增多增强,马克•维瑟憧憬的普适计算时代已经到来。人们可能访问的计算设备和数据增多了,人机关系也变得更加丰富了。交互技术已经成为终端和应用创新的核心竞争力。

但普适计算时代下的自然交互存在诸多挑战,比如,用户心智模型的不可见性,传感器数据噪声,以及需要适应个体、环境的差异性等。

智能人机交互需要解决用户认知机理建模、用户行为的计算表征、交互意图的理解算法、自然界面生成方法以及情景感知等问题,为用户与计算设别间自然高效的信息交换提供理论基础和优化方法。

因此,智能交互中心的成立,有了三大使命:

一、开展基础理论。在人机交互、智能交互方面,探索自然交互的科学问题,建立通过智能技术实现自然交互的理论基础;

二、构建开放平台。建设典型自然交互应用中的用户心理和行为数据库,提供脑机交互实验系统,建成清华大学智能交互开放平台;

三、促进交流合作。举办开放的、国际化的与智能人机交互相关的学术活动,增进学术交流;普及智能人机交互技术,促进产学合作。

尤政院士表示,智能人机交互研究中心将以促进清华和国家人机交互研究与发展为宗旨,打造具有广泛影响力的学术研究、交流中心、智能交互平台与原创技术推广中心,更好地服务于国家和清华的人工智能发展战略。

八个研究内容

史元春教授对智能交互研究中心的八个研究内容做了介绍:

(一)自然交互行为的意图理解:在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图。

在解释用户的交互意图时,既可以使用「黑盒子」的机器学习方法,也可以利用「白盒子」的基于用户行为建模的方法。后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义。

在意图推理任务中,贝叶斯方法具有优势。

(二)多模态交互感知:多模态交互行为的智能感知是自然交互的基础。该研究内容的核心是识别具有高可用性的自然输入动作,创新成本可控、易于部署的感知技术。

(三)认知心理:认知心理学是对人类感知觉信息加工处理过程及其机制的探索,是人机交互设计与优化的基础和关键支撑。对积极心理的深入研究,有望为提升人机交互自然性提供重要的指导建议。

(四)情感计算与情感交互技术:是和谐人机交互的核心技术之一。

清华大学团队针对海量网络数据,在情感认知特性的可计算性、跨模态异构数据的情感建模、美学认知的建模、面向网络用户的情感交互等方面开展了深入研究。

(五)脑-机接口:基于大脑神经解码提供了新的智能交互方式,在残疾人康复、健康人群增强等方面具有重要的科学意义和应用前景。

(六)人因与工效学:具体包含生理人因学、认知人因学和组织人因学。

(七)人机融合的智能增强:研究人与机器两类智能体的双向耦合机制,突破阻碍人与机器智能双向沟通的技术瓶颈,构建可互相适应、协同工作的异构智能持续反馈回路,实现人与机器自然、生动、自适应的智能融合。

(八)交互设计:立足于艺术设计和人工智能技术的有机结合,从用户体验的角度出发,探索新技术所带来的可能性。

四个开放平台

智能人机交互研究中心成立仪式后,史元春教授还发布了四个智能交互开放平台:智能文本输入开发套件 ITIS、人机互启发式英文写作系统 ESODA、情感交互数据库 ACP、视觉脑机交互实验系统 VBCI。

易鑫博士、陶品副研究员、贾珈副教授、王毅军研究员分别对四个开放平台做了介绍。

(一)智能文本输入开发套件 ITIS

ITIS 针对文本输入任务中对用户输入意图的准确推理问题,从用户输入行为建模、输入意图推理算法、人机交互设计和技术评测四个方面提供数据和方法的支撑,推进文本输入这一基础而重要的人机交互任务在新一代交互场景下的体验显著提升。

其包含真实用户在多交互平台上的文本输入原始数据、智能文本输入意图推理算法、多交互界面上可直接使用的文本输入技术方案和文本输入技术评测任务集。

(二)人机互启发式英文写作系统 ESODA

「人工智能 AI『陪』您一起写作!让天下没有难写的论文!」

该产品专注于研究人机智能互启发式的 AI+Writing 全新写作交互技术,为学者从事英文学术论文写作提供智能化的新平台。

拥有 3300 万条优质英文学术论文例句,涵盖计算机、工程学、物理学、天文学、生物学、生态学、神经科学、地球科学、能源科学、医疗卫生、动物学等众多学科领域,更可根据用户自定义论文集作建立个性化学术领域,向作者提供英文写作句法、词汇搭配及替换的智能化专业建议。

通过智能化感知与交互技术,由用户向机器自然的传达英文写作意图,同时让计算机的智能计算结果优雅地为用户提供协助,实现人机智能互启发式的高效语言组织,帮助到广大学者进行更准确、更专业地完成论文写作。

(三)情感交互数据库 ACP

包含多模态情感计算数据库、心理健康数据库、美学计算数据库。

其中,多模态情感计算数据库包含语音、文本、图像情感交互数据。

  1. 语音情感交互数据库:包含 753 万句基于人机语音交互系统采集的语音情感数据,具有类别和维度的情感标签,特征包括语音、文本、用户属性和地理位置。
  2. 文本情感交互数据库:包含 178 万用户的 10 亿条文本,以情感类别为标签,特征包括文本、图像、表情符、用户属性、用户网络角色和社交关系。
  3. 图像情感交互数据库:包含约 35 万带情感的图片,特征包括图片的发布时间、标题、标签、描述等。

心理健康数据库中不仅有中文用户的数据、还有英文用户的数据。

  1. 中文用户心理健康数据库:包含 2 万用户的 50 万条文本,标注了抑郁倾向、压力源和压力水平,包括文本、图像、表情符、用户属性、社交关系等特征。
  2. 英文用户心理健康数据库:包含 2800 用户的 60 万条文本,标注了抑郁倾向,包括文本、图像、表情符、用户属性、社交关系等特征。

美学计算数据库中则涉及服装美学和图像美学。

  1. 服装美学数据库:包含男女装各分类图片 13 万张,以美学维度坐标值和美学类别为标注,数据包含颜色、材质、版型、场合、季节等特征。
  2. 图像美学数据库:包含约 12 万带有美学评价的图片,以美学评价词作为标签,特征包括图片特征和美学相关的文本描述。

(四)视觉脑机交互实验系统 VBCI

通过视觉诱发电位脑机接口技术将大脑意图转化为控制指令,为用户提供视觉神经编解码的通用软硬件系统框架,帮助用户快速实现个性化视觉脑机交互应用的方案设计、参数优化、以及性能测试验证。

VBCI 集成了视觉刺激呈现、脑电采集、脑电分析、控制反馈四大功能模块,兼容 NeuroScan、Neuracle、Wearable Sensing 等多种脑电采集设备,可根据用户需求构建个性化脑电控制指令集,提供多种视觉诱发脑电检测算法,实现脑开关、数字拨号、文字输入、机械臂控制等应用。

「除了促进我们研究院自己的分析研究、同行的交流,我们希望通过开放平台能够扩大合作的可能和成果影响的面,我们也希望能够带动产业进步。」史元春教授这样阐释发布开放平台的出发点。

她还表示,「开放平台今天是第一次,未来会有更多。」

智能交互中心官网:http://ai.tsinghua.edu.cn/thuii/



本文为机器之心报道,转载请联系本公众号获得授权

相关文章
|
24天前
|
存储 人工智能 Kubernetes
[AI OpenAI] 保护前沿AI研究基础设施的安全
概述支持OpenAI前沿AI模型安全训练的架构。
[AI OpenAI] 保护前沿AI研究基础设施的安全
|
12天前
|
人工智能 安全 网络安全
简述AI漏洞修复研究现状及发展方向
鲁军磊先生的演讲聚焦AI在网络安全中的应用,特别是自动化漏洞修复。他讨论了大模型技术的最新进展,AI如何增强漏洞发现与修复,并介绍了AI智能体的三种协作模式。传统漏洞修复流程从手工审计到智能化挖掘逐步演进,而AI技术通过智能决策和自动化执行提高效率。未来趋势包括智能化防御、跨域协同、安全合规自动化、隐私保护强化和安全技能普及,以及可持续安全生态建设。AI正重塑网络安全领域,推动更高效、精准的防御策略。
|
29天前
|
机器学习/深度学习 人工智能 数据库
克雷研究所100万美元奖金要归AI了,数学界规则大改,未来数学家如何应对海量猜想
【6月更文挑战第1天】AI在数学领域的突破正在改写数学研究规则。伦敦数学科学研究所的AI预测椭圆曲线秩,与克雷研究所的千禧年问题相关,显示AI在高风险数学问题上的潜力。AI还发现了纽结理论中的新关系,并能生成数学公式的猜想。尽管AI有助于发现模式和猜想,但它仍依赖于数学家的直觉来判断猜想的重要性。未来,AI将成为数学家的工具,加速研究进程,但人类的创造力和洞察力仍是关键。
41 7
|
26天前
|
机器学习/深度学习 人工智能
可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
【6月更文挑战第4天】AI在可控核聚变研究中实现双托卡马克装置3D磁场全自动优化,助力抑制边缘能量爆发(ELMs),提升核聚变性能90%,成果登上《自然通讯》。虽有ELMs少量出现及装置适应性问题,但这一突破为经济可行的核聚变能源发展迈出重要步伐。[论文链接](https://www.nature.com/articles/s41467-024-48415-w)
26 1
|
2月前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
48 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
清华首款AI光芯片登上Science,全球首创架构迈向AGI
【4月更文挑战第16天】清华大学研究团队开发出大规模光子芯片“太极”,在《科学》杂志发表,该芯片基于创新的光子计算架构,实现百万神经元级别的ONN,能效比高达160 TOPS/W。实验中,太极芯片成功执行1000类别分类任务,提升AI内容生成质量,为AGI发展开辟新路径。然而,光子集成电路的制造成本高、技术成熟度不足及软件支持限制了其广泛应用。
62 5
清华首款AI光芯片登上Science,全球首创架构迈向AGI
|
2月前
|
人工智能
全球人才智库报告出炉:顶尖AI研究者,中国贡献26%
MIT Tech Review报告显示,中国贡献了全球26%的顶尖AI研究者,成为重要的人才基地。中国AI研究生留存率高达90%,正快速追赶美国在AI领域的主导地位。2019至2022年间,美国顶尖AI人才比例从2/3降至1/2。尽管面临中美关系影响及部分领域差距,中国AI产业的繁荣促进了人才增长。
36 1
全球人才智库报告出炉:顶尖AI研究者,中国贡献26%
|
2月前
|
人工智能 自然语言处理 算法
创企Sakana AI发布首个研究成果
Sakana AI,由前谷歌研究员创立,利用进化算法自动化创建强大的基础模型,革新大型语言模型开发。公司研发的日语数学LLM和文化意识VLM在基准测试中表现出色,其多智能体框架提升了视频生成效率和灵活性。尽管存在局限,如视频质量和数据集问题,但其开放框架对AI社区有重大贡献,推动技术发展。
49 4
创企Sakana AI发布首个研究成果
|
2月前
|
机器学习/深度学习 人工智能 监控
面向中文大模型价值观的评估与对齐研究:“给AI的100瓶毒药”并解毒,守护AI纯净之心
面向中文大模型价值观的评估与对齐研究:“给AI的100瓶毒药”并解毒,守护AI纯净之心
面向中文大模型价值观的评估与对齐研究:“给AI的100瓶毒药”并解毒,守护AI纯净之心
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI案例研究与项目实战
探索AI实践:从智能客服到图像识别、推荐系统、语音助手,再到智能仓储和金融风控,这些案例展示AI如何解决实际问题。通过NLP、深度学习、机器学习等技术,企业如阿里巴巴、京东等改善客户服务,医疗、安防领域利用图像识别创新,而个性化推荐提升用户体验。AI不仅改变交互方式,还优化仓储物流、保障金融安全,实操项目助力技术应用能力提升。
169 3