数据可视化与人机交互技术

简介: 人机交互(HCI)是21世纪信息技术的关键领域,涉及从早期命令行到现代多模态智能交互的发展历程。其研究涵盖界面设计、可用性评估、多通道交互、智能界面、群件协作、Web与移动交互等内容,未来将在虚拟现实、语音识别、眼动追踪及脑机接口等方面持续突破,推动人机协同迈向更高层次。

image.png


人机交互技术(HumanComputer Interaction,HCI)是21世纪信息领域需要发展的重大课题。例如,美国21世纪信息技术计划中的基础研究内容定为四项,即软件、人机交互、网络、高性能计算。其目标就是要开发21世纪个性化的信息环境。其中,人机交互在信息技术中被列为与软件技术和计算机技术等并列的六项国家关键技术之一,并被认为“对计算机工业有着突出的重要性,对其他工业也很重要”。美国国防关键技术计划不仅把人机交互列为软件技术发展的重要内容之一,还专门增加了与软件技术并列的人机界面这项内容。

01、人机交互的发展历史

1959年,美国学者B.Shackel从人在操作计算机时如何才能减轻疲劳的角度出发,发表了被认为是人机界面的第一篇关于计算机控制台设计的人机工程学的论文。1960年,J.C.R.Licklider首次提出人机紧密共栖(HumanComputer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。1969年,在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业《国际人机研究杂志》(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。
1970年,成立了两个HCI研究中心: 一个是英国Loughbocough大学的HUSAT研究中心; 另一个是美国施乐(Xerox)公司的Palo Alto研究中心。
1970—1973年,学术界出版了四本与计算机相关的人机工程学专著,为人机交互界面的发展指明了方向。
20世纪80年代初期,学术界相继出版了六本专著,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。在理论体系方面,人机交互学从人机工程学独立出来,更加强调认知心理学、行为学和社会学的某些人文科学的理论指导; 在实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。“人机界面”一词被“人机交互”取代。HCI中的“I”,也由“Interface”(界面/接口)变成了“Interactive”(交互)。
自20世纪90年代后期以来,随着高速处理芯片、多媒体技术和Internet Web技术的迅速发展和普及,人机交互的研究重点放在了智能化交互、多模态(多通道)—多媒体交互、虚拟交互以及人机协同交互等方面,也就是放在以人为中心的人机交互技术方面。
人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。它经历了以下几个阶段。

  1. 早期的手工作业阶段当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来十分笨拙的计算机。
  2. 作业控制语言及交互命令语言阶段这一阶段的特点是计算机的主要使用者——程序员,他们可采用批处理操作或交互命令语言的方式与计算机打交道,虽然要记忆许多命令和熟练地使用键盘,但已可用较方便的手段来调试程序、了解计算机执行情况。
  3. 图形用户界面阶段图形用户界面(Graphical User Interface,GUI)的主要特点是桌面隐喻、WIMP技术、直接操作和“所见即所得”。由于GUI简明易学减少了使用键盘,实现了“事实上的标准化”,因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群,它的出现使信息产业得到了空前发展。
  4. 网络用户界面的出现以超文本标记语言(Hyper Text Markup Language,HTML)及超文本传输协议(HTTP)为主要基础的网络浏览器是网络用户界面的代表。由它形成的WWW已经成为当今Internet的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等。
  5. 多通道、多媒体的智能人机交互阶段以虚拟现实为代表的计算机系统的拟人化和以手持计算机、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势,而以鼠标和键盘为代表的GUI技术是影响它们发展的“瓶颈”。利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,可以提高人机交互的自然性和高效性。多通道、多媒体的智能人机交互对我们来说既是一个挑战,也是一个极好的机遇。

    02、人机交互的研究内容

  6. 人机交互界面表示模型与设计方法
    一个交互界面的好坏,直接影响到软件开发的成败。友好人机交互界面的开发离不开好的交互模型与设计方法(Model and Methodology)。因此,研究人机交互界面的交互模型与设计方法,是人机交互的重要研究内容之一。
  7. 可用性分析与评估
    可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估(Usability and Evaluation)的研究,主要涉及支持可用性的设计原则与可用性的评估方法等。
  8. 多通道交互技术
    多通道交互(MultiModal Interaction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。
    MMI是一种使用多种通道与计算机通信的人机交互方式。通道(Modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如语音、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉、味觉等。采用这种方式的计算机用户界面称为多通道用户界面。MMI的各类通道(界面)技术中,有不少已经实用化、产品化、商品化。其中,我国科技人员做出了不少优异的工作。
    多通道交互主要研究多通道交互界面的交互模型、多通道交互界面的评估方法以及多通道信息的融合等。多通道信息整合是多通道用户界面研究的重点和难点。
  9. 智能用户界面智能用户界面(Intelligent User Interface,IUI)的最终目标是使人机交互像人人交互一样自然、方便。上下文感知、眼动跟踪、手势识别、三维输入、语音识别、表情识别、手写识别、自然语言理解等都是认知与智能用户界面需要解决的重要问题。
  10. 群件群件(Groupware)是指帮助群组协同工作的计算机支持的协作环境,主要涉及个人或群组间的信息传递、群组中的信息共享、业务过程自动化与协调,以及人和过程之间的交互活动等。目前与人机交互技术相关的研究主要包括群件系统的体系结构、计算机支持交流与共享信息的方式、交流中的决策支持工具、应用程序共享以及同步实现方法等内容。
  11. Web交互Web交互(Webinteraction)重点研究Web界面的信息交互模型和结构、Web界面设计的基本思想和原则、Web界面设计的工具和技术,以及Web界面设计的可用性分析与评估方法等内容。
  12. 移动界面设计移动计算(Mobile Computing)、无处不在计算(Ubiquitous Computing)等对人机交互技术提出了更高的要求,面向移动应用的界面设计问题已成为人机交互技术研究的一个重要应用领域。针对移动设备的便携性、位置不固定性和计算能力有限性以及无线网络的低带宽/高延迟等诸多的限制,研究移动界面的设计方法、移动界面可用性与评估原则、移动界面导航技术,以及移动界面的实现技术和开发工具,是当前的人机交互技术的研究热点之一。
    随着计算机技术的发展,计算机功能也越来越强。随着模式识别,如语音识别、汉字识别等输入设备的发展,操作员与计算机在类似于自然语言或受限制的自然语言这一级上进行交互成为可能。此外,通过图形和数据可视化进行人机交互也吸引着人们去进行研究。这些人机交互可称为智能化的人机交互。这方面的研究工作正在积极开展。
    03、人机交互的前景
    人机交互技术领域热点技术的应用潜力已经开始展现,如智能手机配备的地理空间跟踪技术,应用于可穿戴式计算机、隐身技术、浸入式游戏等的动作识别技术,应用于虚拟现实、遥控机器人及远程医疗等的触觉交互技术,应用于呼叫路由、家庭自动化及语音拨号等场合的语音识别技术,对于有语言障碍的人士的无声语音识别,应用于广告、网站、产品目录、杂志效用测试的眼动跟踪技术,针对有语言和行动障碍人士开发的“意念轮椅”采用的基于脑电波的人机界面技术等。人机交互解决方案的供应商不断地推出各种创新技术,如指纹识别技术、侧边滑动指纹识别技术、压力触控技术等。热点技术的应用开发既是机遇也是挑战。基于视觉的手势识别率低、实时性差,需要研究各种算法来改善识别的精度和速度,眼睛虹膜、掌纹、笔迹、步态、语音、唇读、人脸、DNA等人类特征的研发、应用也正受到关注,多通道的整合也是人机交互的热点,另外,与“无所不在计算”“云计算”等相关技术的融合与促进也需要继续探索。
目录
相关文章
|
8月前
|
Ubuntu Linux 网络安全
如何在Linux中更改主机名?修改主机名最新方法
本期教程将指导您如何在Linux系统中更改主机名。主机名是Linux系统的常用功能,用于识别服务器,帮助区分不同服务器,并与网络进程和其他应用程序协同工作。教程涵盖显示当前主机名的方法(通过`hostname`命令),以及在CentOS 7、Debian 9和Ubuntu 16.04及以上版本中更改主机名的步骤(使用`hostnamectl set-hostname`命令)。对于其他Linux版本,可编辑`/etc/hostname`文件实现更改。记得重启相关服务或服务器以使更改生效!
1995 12
|
7月前
|
机器学习/深度学习 人工智能 算法
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
505 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
|
6月前
|
机器学习/深度学习 编解码 监控
人机融合智能 | 人智交互的神经人因学方法
本文探讨了智能时代神经人因学方法在人智交互研究和应用中的推动作用,重点介绍了内源性智能系统、面向认知的智能系统、智能穿戴可移动技术和外源性智能系统四大内容。其中,内源性智能系统以神经反馈技术为核心,涵盖多模态采集系统、脑状态解码及智能反馈控制;面向认知的智能系统涉及认知神经信号处理与特征提取;智能穿戴技术覆盖肌电、心电等外周生理数据采集;外源性智能系统则聚焦于认知功能增强新技术。文章还深入分析了神经反馈训练的发展历程、技术优势及智能化发展方向,为高级智能系统的构建提供了理论与实践支持。
145 3
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
2381 60
|
弹性计算 缓存 测试技术
阿里云ECS云服务器2核4G能支持多少人同时访问?2核4G5M并发量评测
阿里云ECS云服务器2核4G能支持多少人同时访问?2核4G5M并发量评测,2核4G服务器并发数性能测试,阿小云账号下的2核4G服务器支持20人同时在线访问,然而应用不同、类型不同、程序效率不同实际并发数也不同,2核4G服务器的在线访问人数取决于多个变量因素
|
前端开发 JavaScript 开发工具
跨域联姻:React.NET——.NET应用与React的完美融合,解锁前后端高效协作新姿势。
【8月更文挑战第28天】探索React.NET,这是将热门前端框架React与强大的.NET后端无缝集成的创新方案。React以其组件化和虚拟DOM技术著称,能构建高性能、可维护的用户界面;.NET则擅长企业级应用开发。React.NET作为桥梁,使.NET应用轻松采用React构建前端,并优化开发流程与性能。通过直接托管React组件,.NET应用简化了部署流程,同时支持服务器端渲染(SSR),提升首屏加载速度与SEO优化。
506 1
|
数据采集 资源调度 搜索推荐
Flink在实时搜索引擎索引构建中的深度应用与实践
随着数据源规模的扩大和查询请求的增加,如何优化Flink的性能和资源调度成为了一个重要的问题。Flink提供了多种性能优化手段,如并行度调整、状态后端选择、任务链优化等。同时,Flink还支持与YARN、Kubernetes等集群管理系统集成,实现资源的动态调度和弹性伸缩,以适应不同规模的业务需求。
|
Web App开发
生活小技巧:Tampermonkey 脚本(刷课,刷题)
生活小技巧:Tampermonkey 脚本(刷课,刷题)
864 0
|
存储 NoSQL Java
【Spring技术原理】分析探究RedisTemplate的序列化和反序列化+泛型机制
【Spring技术原理】分析探究RedisTemplate的序列化和反序列化+泛型机制
1346 0
|
算法 Python
NumPy 高级教程——性能优化
NumPy 高级教程——性能优化 【1月更文挑战第2篇】
693 0