清华AI研究院里程碑事件:成立「智能人机交互研究中心」,发布四大开放平台

简介: 昨日(5 月 21 日),清华大学「智能人机交互研究中心」成立仪式在清华大学李兆基科技大楼举行。这是继「知识智能研究中心」、「听觉智能研究中心」、「基础理论研究中心」后,清华大学 AI 研究院第四个研究中心。

清华大学副校长、清华大学 AI 研究院管委会主任尤政院士和清华大学 AI 研究院院长张钹院士出席成立仪式,共同为中心揭牌。

尤政院士在致辞中表示,成立智能交互研究中心是清华大学推进人工智能发展的重要举措,也是清华大学 AI 研究院的里程碑事件。

微信图片_20211201005755.jpg

图说:智能交互中心成立仪式合影

「人工智能的重要需求来自人机交互。」张钹院士在致辞中表示,⼈机交互核⼼问题是⾃然⾏为的意图理解,而解决这一核心问题必须要经过跨学科的研究。

为了更好汇聚清华大学在智能人机交互方面多学科的优势研究力量,清华大学 AI 研究院决定成立智能人机交互研究中心(英文:Intelligent Human Computer Interaction Research Center,简称 THUII,以下简称「智能交互中心」)。

史元春教授(清华大学计算机系「长江学者」特聘教授、清华大学全球创新学院 GIX 院长)被聘请为智能交互中心主任,高文教授(中国工程院院士、北京大学博雅讲席教授、信息科学技术学院院长)和戴国忠研究员(中科院软件所人机交互技术与智能信息处理实验室首席研究员)被聘请为智能交互中心学术顾问。

微信图片_20211201005759.jpg

图说:尤政院士(左)、张钹院士(右)为史元春教授(中)颁发聘任证书

研究团队聚集了计算机系、心理学系、生物医学工程系、美术学院、工业工程系、社会科学学院等 6 个院系的专家学者。

三大使命

计算设备、传感器、数据和算法日益增多增强,马克•维瑟憧憬的普适计算时代已经到来。人们可能访问的计算设备和数据增多了,人机关系也变得更加丰富了。交互技术已经成为终端和应用创新的核心竞争力。

但普适计算时代下的自然交互存在诸多挑战,比如,用户心智模型的不可见性,传感器数据噪声,以及需要适应个体、环境的差异性等。

智能人机交互需要解决用户认知机理建模、用户行为的计算表征、交互意图的理解算法、自然界面生成方法以及情景感知等问题,为用户与计算设别间自然高效的信息交换提供理论基础和优化方法。

因此,智能交互中心的成立,有了三大使命:

一、开展基础理论。在人机交互、智能交互方面,探索自然交互的科学问题,建立通过智能技术实现自然交互的理论基础;

二、构建开放平台。建设典型自然交互应用中的用户心理和行为数据库,提供脑机交互实验系统,建成清华大学智能交互开放平台;

三、促进交流合作。举办开放的、国际化的与智能人机交互相关的学术活动,增进学术交流;普及智能人机交互技术,促进产学合作。

尤政院士表示,智能人机交互研究中心将以促进清华和国家人机交互研究与发展为宗旨,打造具有广泛影响力的学术研究、交流中心、智能交互平台与原创技术推广中心,更好地服务于国家和清华的人工智能发展战略。

八个研究内容

史元春教授对智能交互研究中心的八个研究内容做了介绍:

(一)自然交互行为的意图理解:在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图。

在解释用户的交互意图时,既可以使用「黑盒子」的机器学习方法,也可以利用「白盒子」的基于用户行为建模的方法。后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义。

在意图推理任务中,贝叶斯方法具有优势。

(二)多模态交互感知:多模态交互行为的智能感知是自然交互的基础。该研究内容的核心是识别具有高可用性的自然输入动作,创新成本可控、易于部署的感知技术。

(三)认知心理:认知心理学是对人类感知觉信息加工处理过程及其机制的探索,是人机交互设计与优化的基础和关键支撑。对积极心理的深入研究,有望为提升人机交互自然性提供重要的指导建议。

(四)情感计算与情感交互技术:是和谐人机交互的核心技术之一。

清华大学团队针对海量网络数据,在情感认知特性的可计算性、跨模态异构数据的情感建模、美学认知的建模、面向网络用户的情感交互等方面开展了深入研究。

(五)脑-机接口:基于大脑神经解码提供了新的智能交互方式,在残疾人康复、健康人群增强等方面具有重要的科学意义和应用前景。

(六)人因与工效学:具体包含生理人因学、认知人因学和组织人因学。

(七)人机融合的智能增强:研究人与机器两类智能体的双向耦合机制,突破阻碍人与机器智能双向沟通的技术瓶颈,构建可互相适应、协同工作的异构智能持续反馈回路,实现人与机器自然、生动、自适应的智能融合。

(八)交互设计:立足于艺术设计和人工智能技术的有机结合,从用户体验的角度出发,探索新技术所带来的可能性。

四个开放平台

智能人机交互研究中心成立仪式后,史元春教授还发布了四个智能交互开放平台:智能文本输入开发套件 ITIS、人机互启发式英文写作系统 ESODA、情感交互数据库 ACP、视觉脑机交互实验系统 VBCI。

易鑫博士、陶品副研究员、贾珈副教授、王毅军研究员分别对四个开放平台做了介绍。

(一)智能文本输入开发套件 ITIS

ITIS 针对文本输入任务中对用户输入意图的准确推理问题,从用户输入行为建模、输入意图推理算法、人机交互设计和技术评测四个方面提供数据和方法的支撑,推进文本输入这一基础而重要的人机交互任务在新一代交互场景下的体验显著提升。

其包含真实用户在多交互平台上的文本输入原始数据、智能文本输入意图推理算法、多交互界面上可直接使用的文本输入技术方案和文本输入技术评测任务集。

(二)人机互启发式英文写作系统 ESODA

「人工智能 AI『陪』您一起写作!让天下没有难写的论文!」

该产品专注于研究人机智能互启发式的 AI+Writing 全新写作交互技术,为学者从事英文学术论文写作提供智能化的新平台。

拥有 3300 万条优质英文学术论文例句,涵盖计算机、工程学、物理学、天文学、生物学、生态学、神经科学、地球科学、能源科学、医疗卫生、动物学等众多学科领域,更可根据用户自定义论文集作建立个性化学术领域,向作者提供英文写作句法、词汇搭配及替换的智能化专业建议。

通过智能化感知与交互技术,由用户向机器自然的传达英文写作意图,同时让计算机的智能计算结果优雅地为用户提供协助,实现人机智能互启发式的高效语言组织,帮助到广大学者进行更准确、更专业地完成论文写作。

(三)情感交互数据库 ACP

包含多模态情感计算数据库、心理健康数据库、美学计算数据库。

其中,多模态情感计算数据库包含语音、文本、图像情感交互数据。

  1. 语音情感交互数据库:包含 753 万句基于人机语音交互系统采集的语音情感数据,具有类别和维度的情感标签,特征包括语音、文本、用户属性和地理位置。
  2. 文本情感交互数据库:包含 178 万用户的 10 亿条文本,以情感类别为标签,特征包括文本、图像、表情符、用户属性、用户网络角色和社交关系。
  3. 图像情感交互数据库:包含约 35 万带情感的图片,特征包括图片的发布时间、标题、标签、描述等。

心理健康数据库中不仅有中文用户的数据、还有英文用户的数据。

  1. 中文用户心理健康数据库:包含 2 万用户的 50 万条文本,标注了抑郁倾向、压力源和压力水平,包括文本、图像、表情符、用户属性、社交关系等特征。
  2. 英文用户心理健康数据库:包含 2800 用户的 60 万条文本,标注了抑郁倾向,包括文本、图像、表情符、用户属性、社交关系等特征。

美学计算数据库中则涉及服装美学和图像美学。

  1. 服装美学数据库:包含男女装各分类图片 13 万张,以美学维度坐标值和美学类别为标注,数据包含颜色、材质、版型、场合、季节等特征。
  2. 图像美学数据库:包含约 12 万带有美学评价的图片,以美学评价词作为标签,特征包括图片特征和美学相关的文本描述。

(四)视觉脑机交互实验系统 VBCI

通过视觉诱发电位脑机接口技术将大脑意图转化为控制指令,为用户提供视觉神经编解码的通用软硬件系统框架,帮助用户快速实现个性化视觉脑机交互应用的方案设计、参数优化、以及性能测试验证。

VBCI 集成了视觉刺激呈现、脑电采集、脑电分析、控制反馈四大功能模块,兼容 NeuroScan、Neuracle、Wearable Sensing 等多种脑电采集设备,可根据用户需求构建个性化脑电控制指令集,提供多种视觉诱发脑电检测算法,实现脑开关、数字拨号、文字输入、机械臂控制等应用。

「除了促进我们研究院自己的分析研究、同行的交流,我们希望通过开放平台能够扩大合作的可能和成果影响的面,我们也希望能够带动产业进步。」史元春教授这样阐释发布开放平台的出发点。

她还表示,「开放平台今天是第一次,未来会有更多。」

智能交互中心官网:http://ai.tsinghua.edu.cn/thuii/



本文为机器之心报道,转载请联系本公众号获得授权

相关文章
|
13天前
|
数据采集 存储 人工智能
代理IP与AI自我进化:探索未来智能的新边界
在AI快速发展的今天,数据获取成为制约其进步的关键因素。代理IP技术通过匿名性和灵活性,帮助AI突破地域限制、绕过反爬虫机制,提升数据质量和模型训练效率,促进AI自我进化。本文通过实例和代码,探讨了代理IP在AI发展中的作用及潜在价值,强调了合理使用代理IP的重要性。
22 1
|
8天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
89 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
20天前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
176 64
|
8天前
|
机器学习/深度学习 Web App开发 人工智能
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
Amurex是一款开源的AI会议助手,提供实时建议、智能摘要、快速回顾关键信息等功能,帮助用户提升会议效率。本文将详细介绍Amurex的功能、技术原理以及如何运行和使用该工具。
63 18
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
|
3天前
|
人工智能 数据库 自然语言处理
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
41 25
|
20天前
|
机器学习/深度学习 人工智能 Python
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
MuCodec是由清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学联合开发的超低比特率音乐编解码器。它能够在0.35kbps至1.35kbps的比特率下实现高效的音乐压缩和高保真重建,适用于在线音乐流媒体服务、音乐下载、语言模型建设等多个应用场景。
35 1
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
|
14天前
|
人工智能 文字识别 API
OpenSearch & AI 开放平台,实现0代码图片搜索!
本文主要介绍了如何利用阿里云的 OpenSearch 和 AI 搜索开放平台来构建一个无需编写代码就能完成的图片搜索功能。
62 12
|
17天前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
53 10
|
13天前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
83 4

热门文章

最新文章