inFORM 三维交互系统属于哪个范畴

我可以大致说一下这个思路和需要什么知识。从视频上看,这个系统本身并没有特别高深的技术。戏法说穿了就没那么神奇。实现起来有两步:第一步是把视频信息中的3D模型还原出来。这个是Computer Vision的内容。我们知道一张图片是二维平面,有上下左右,但是前后的信息就没有了。如果用坐标系表示,x轴和y轴的信息保留了,但是z轴的信息丢失了。怎样还原这个z也就是depth呢?一般是利用不同角度的两张图片来还原3D模型。这类似于人眼的工作原理。这是一个研究比较成熟的领域。不过最新的做法是用微软的kinect控制器,自带一个红外线sensor,可以直接得出depth map。从视频看,还原的质量并不是特别好,只能还原较简单的形状,因此应该是直接利用了这个depth map。第二步是把3D模型用这个机器在物理上重新实现出来。每根长方条下面应该有一个独立小电机,可以做上下运动。把长方条直接运动到和depth map一致的位置,就产生了视频里这个效果。后面用小红球或者手指做控制,要么是从视频得到信息,要么是从长方体的压力得到信息。我估计还是从kinect得到视频比较简单。这个东西牛在他的思路。因为一般人可能想不到把这两个步骤连到一起。一旦想到之后,后面的工作就相对简单了,相信比较优秀的计算机和机械工程本科生即可完成。所以这里最需要的能力是要对各方面的前沿知识有一定的了解,属于跨学科交互的领域。我不觉得这个东西复杂到一个人做不出来。如果有计算机本科的基础,自己买一个kinect controller再搞一些电机,我觉得最多花一到两年时间完全可以复制这个工作。科研工作很多时候只要做出一个样品即可。如果需要商业化,还需要很多后续工作把它进一步完善。
■网友
CS和硬件的PhD都有,然后还有学媒体艺术的。官方主页——有兴趣可以自己翻翻——都是MIT Media Lab的——Tangible Media Group(你要做这些东西,多查资料多动手就好了,做出成绩就能进去,加油吧~)构造分析如下:kinect(就是XBOX游戏机用的那种)作Computer Vision(计算机视觉),computer:计算机作为中枢发号施令pins:积木,但是还需要动力。actuators:这就是积木的动力之源至于linkages:这就是传动系统。projector:投影这种东西一般都是跨专业团队,一个人够呛,也没效率。综上, 需要Computer Scientist, Mechanical Engineer。inFORM 三维交互系统属于哪个范畴
【inFORM 三维交互系统属于哪个范畴】
鼓励人家单干花一两年,这种低效率真是一种糟糕的爱。花一年时间干这个就是赔本的买卖。跟着MIT的尾巴,这种项目paper也不好发,当然也不是不能,要有独到的改进。就算你是天才,用糟糕的方法也是糟蹋人才。


    推荐阅读