Machine Interaction

Human-Computer Interface (HCI) 已经不是一个新的领域. 曾经还proof-read了一本关于HCI的本科论文, 虽然只是写关于软件方面的设计, 就是如何把软件设计的比较友善的使用. 可是, 无论如何, 那只是软件, 而且还是要依靠电脑基本硬件才能实现 (就是键盘和滑鼠). 科技是越来越发达, 后来有很多研究就往"人可以怎样和机器沟通"的方向研究. 这些方向在robotics和haptics都很活跃, 尤其在研究人在给机器施力后机器应该如何反应. 还有另一班研究着研究tactile sensing的, 就是用机器simulate不同的表面的感觉. 这个还是有点超出可以想象的. 不过其实也接近了, Microsoft新出的Zune就是有tactile sensing的科技的.
 
还是进入这则blog比较重要的主题. 会要讨论这个Machine Interaction是因为Microsoft最近准备推出的Surface Computing的新产品. 开始接触到这个科技是在Youtube上看到的Jeff Han在TED上给他的新成果的演示:
 

[youtube=http://www.youtube.com/watch?v=QKh1Rv0PlOQ]
 
就如他里面说的, multi-point sensing已经不是新的概念. 可是能够在这个multi-point sensing的概念开发出那么interactive的界面, 他可算是创始者. Jeff Han是在New York University的research scientist (如果你注意听上面的视频, 观众有人问他的affiliation的). 看了他的网页 (http://cs.nyu.edu/~jhan), 原来他也是robotics方向出来的, 尤其之前还做robot navigation和FPGA的东东, 强人. 想到multi-point interaction的研究, 就想到2004年4月到New Orleans的ICRA开会的时候, 参加了其中一个workshop就是讨论关于这个方面的. 确实让我大开眼界, 而且深深了解是个多么难的问题. Multi-point interaction在robotics上比较经典的问题就是multi-finger hand grasping, 就是要机器好像人类的手指那么灵活, 那么多功能. 要做到那么多事, 重要的就是谐调和大量的计算. 这个时候想了一想, 谐调真的是个很难的事, 尤其在敲键盘的时候, 如果注意一下, 其实你每一个时刻都只敲一个字, 而不是同时敲几个字. 因为这样电脑不了解, 或者也会有点delay什么的, 才会有两个不同的成果.
 
回来说到surface computing的话, 当然很多时候是很想要的, 因为我们的生活中都不会那么discrete的 (就好像键盘上的键那样). 握着一个杯喝水, 你会感觉到那个杯的弧度, 而且还会因为杯的温度令你感觉里面的液体的温度, 或者表面的感觉令你觉得它是玻璃还是陶瓷的. 当然那种virtual reality的概念还是在研发中的, Jeff Han演示的还算是很大的迈进了, 虽然纯粹只是平面的interface. 我喜欢他说的"this should change the way we interact with the machine onwards". 一直在想, 到底要有多强的处理器才能做那么大的运算? Parallel computing肯定是有必要的, 而且程序在这种fine grain方面的parallelization也是肯定要做得很好的 (就是同时处理很多资料的平行处理能力). 不知道他后面用了多少处理器, 希望不需要太大的"投资", 也希望他所谓的"scalability"真的是那么成熟的.
 
Microsoft把这个surface computing带到另一个领域, 虽然还是趋向娱乐界. 当然, 娱乐界也是一个很好赚钱的领域. 看看下面的teaser吧:
[youtube=http://www.youtube.com/watch?v=Cog8b8ojji0]
 
还有一个Popular Mechanics对它的介绍:
[youtube=http://www.youtube.com/watch?v=ttgx9ygMXz8]
 
Microsoft就想把"desktop"电脑的概念真的"desktop"化, 就是好像真实的桌面上, 有纸张, 照片, 地图, CD等, 就用手指这样寻找资料什么的. 当然更强的就是可以及时放大, 而且就按几下就有你要的资料, 也就是说这些资料都是整理好的, 不想你我凌乱的桌面. 我觉得很好的概念就是加以应用surface和其他peripheral的interaction, 这电脑不只可以和人的手指interact, 还能和其他电子用品如相机, 手机互相联系. 这个概念可强啊! 我想很多时候我们都很不爽电脑后面接那么多cable电线什么的, 不能全面wireless, 这种方式的联系也不错, 而且减少错误的信息. 这些概念不知道还要多少时间才能普及化, 不过已经很接近我们了. 什么时候能够衍生到3D? 差不多了, 只是我们还是需要一个简单化一点的硬件, 更强的软件和处理计算能力.
 
不知道多久前说过要写一篇Web 2.0方面的review, 到今天没有成果, 却写了一个更general的review. Web 2.0其实在说人如何和电脑交流. 其实更具体的应该说是人如何和资讯交流. 想一想, "资讯"到底是什么? 现今的科技已经有点难定义这个词了. 古时候连语言也没有, 直到语言的出现, 文字的发明, 印刷术的发明等, 人都是以文字的方式接受资讯. 现在呢? 我们不只想要看文字, 可以的话, 还要听到一些说话的. 还不只, 还要看到视频. 写这则blog的时候, 我不久穿插着视频么? 而且, 我在写blog, blog也是资讯传播的一种. 可以看到, Web 2.0科技把资讯传播的越来越有效率. 其实不应该把Web 2.0和Machine Interaction相提并论, 因为上面说的科技还是比较"monopoly"的, 就是说一个企业肯扔多少钱下去"革命化"地改变我们的生活; 而Web 2.0却是很"decentralized"的, 一个软件的出现会使另一个软件的消失, 而且在解决不同的问题. 看看这个关于Web 2.0的视频吧:
 
[youtube=http://www.youtube.com/watch?v=6gmP4nk0EOE]
 
呃, 还是会写Web 2.0的东东的, 因为还是挺感兴趣的, 至少也有很多的想法想写下来.
 
总的来说, 科技很"爽", 也很恐怖. 看看电影"Minority Report"吧, 一个一个的科技在实现了…

3 thoughts on “Machine Interaction

  1. 小幽

    沙发.
    太专业.不予评论.

  2. Kee

    It uses a lot of computational power. Just Look at the amount of movie that is running in addition to zooming in and out at a few of them at the same time. It could not be done by our house hold computer. -wwll-

  3. Chinpei

    wwll: You have your account, why not using your own account? =P Or, you’re posting your comment on behalf of Benard? Anyway, of course our current household computer is unable to make it yet. Even the infrastructure is not that enough also. If you even think about Windows Vista, quite a lot of computer don’t have the capability of getting updated to this new version as well. Of course, everything will be getting better, and hopefully will be much easier than we can think of. =)

Comments are closed.