专访AR领域徐博士 如何做AR算法

2024-09-19上海AR开发专家

  • 本期嘉宾:徐泽明博士
    简介:深圳市增强显示技术有限公司(简称0glass,原“青橙视界”)首席科学家,中国科学院计算机技术研究所博士,计算机视觉、系统结构和云计算专家,负责0glass
    增强现实
    等相关技术的研发。曾任大学副教授,联想研究院研究员,国家发改委云计算重点示范工程项目第一负责人,国家超级计算深圳中心副总工程师,粤港澳云计算服务和标准专家委员会委员。在知名专业刊物发表多篇论文并有多项发明专利。拥有丰富的计算机视觉、机器学习、模式识别、计算机系统结构、大数据、云计算等实战经验。
    在公司,大家都称徐泽明为“徐博”。既是满满亲切,也饱含尊敬之意。
    01
    能文能“武”,他是幽默达人
    徐博是湖北人。湖北历史上的名人,屈原是其一,他的《离骚》,《九歌》,《天问》可谓登天之作。而徐博在朋友们的心目中,也同样是个厉害的“文人”——执笔着墨,上学时喜欢创作诗词;热爱历史,各种典故野史侃起来滔滔不绝;视角独特,即使是娱乐圈的花边八卦,也能分析得头头是道。
    但其实认真看来徐博的个人经历,不难得出,他是个理工科人士。本科念的是数学系,“大学本科所学的对人一生的影响是非常大的,我不知道别人是怎样,但是数学对我一辈子都非常有帮助,很好地锻炼了我的理性思维。”也正是这严谨的理性思维和优秀的运算能力为徐博后来走上计算机技术之路奠定了良好基础。
    在同事们眼中,徐博是一个“有趣”的人。和90后能打成一片,各种段子和网络流行语信口拈来。
    小编评价下你们心中的徐博吧程序猿   好玩的人哈哈哈设计狗   徐博=有才+幽默技术猿    讲话有意思,工作很严谨请输入文字
    徐博还当过7年的大学教授,教数学。他坦言,很喜欢听学生们谈自己对于问题的看法,思维碰撞的过程总能产生很多奇妙的火花。这种教学相长的过程,丰富了他知识储备的同时,也让他有了更多去探讨新世界的想法。
    02
    一句话概括工业4.0  刷爆朋友圈
    谈到为什么会加入0glass,徐博说的缘起,很接地气——“当时投出了英雄帖后,收到了几家公司的邀约。彼时的0glass恰巧离我住的地方近,所以就最先见了苏总。”
    不过外在因素都是浮云,最后让徐博坚定选择这家公司并肩走下去的理由,还是因为与苏总走心的交谈甚欢,以及0glass走心在做的事情踏实专业。
    “其是增强现实技术这行的公司不止一家找过我,我都没去。为什么最后选择了苏总,就是因为他做的‘专’,他把做的事情限定在特定领域(工业),才有可能做得成。”徐博说,这是他决定要与0glass一起并肩干事业的原因,“漫无边际做问题是做不好做的,做事业也一样。就好像写博士论文,最开始不知道是什么方向就混两年日子,到了最后有了主题有了方向的时候,才是实打实去思考去研究这个课题。也才会有优秀的结果。”
    工作之余徐博和苏波以及0glass的CTO王友初,时常私下相聚谈事业谈生活。而前不久徐博在饭桌上的一句话被苏波分享之后,霎时引爆了朋友圈——“什么是工业4.0?
    工业4.0就是把机器变CR,把人变成机器
    !”
    徐博这么解释这句话的含义:“把人当做一个对象,规划脚的行动路线,确定眼睛的视角,分解手的操作动作,这就可以规范化生产流程,也就是把人变成机器去看待”。这也是徐博在0glass进行软件开发时的工作思路——深入了解并思考工人在工作时每一个步骤下的行动、视线。换言之,思考工业场景中的逻辑。
    徐博举例说,就好比早年前,会计都是靠excel做报表。后来慢慢就有了办公软件来简化程序。这些软件并不是吸纳了所有的财务报表,而是设计软件的人去思考了做报表过程中的每一个步骤。
    而0glass的PSS(搭载工作辅助与培训系统)正是因为徐博以及研发人员们把自己的工作场所设定在工人的大脑中,从而研发出完全贴合工业应用场景的系统。
    03
    软件研发 用心备至
    如今,0glass的软件已经日趋完善,产品在市场上的合作反馈也非常不错。徐博也从人机交互、机器视觉两方面给我们进行了剖析。
    一、人机交互
    AR智能眼镜中,人机交互的方向主要有语音识别和手势识别,两种交互方式的侧重点不同,目的也不同。这就是所说的好的产品应该是放在具体领域中综合思考的。
    ▲手势识别
    语音识别的目的是为了解放双手,在0glass所注重的工业领域中,语音识别的重要性自然是高于其他任何一种交互方式的,在语音识别的基础上,再辅以手势交互和按键等。
    ▲0glass主要采用语音交互方式
    工业领域,实操类的工作中,AR智能眼镜必须做到的是“辅助”,决定了必须“不给使用者增加不必要的动作和麻烦”,一旦使用手势交互,增加不必要的动作,将影响工作流程和效率,所以在工业领域中语音交互是最优交互,高于手势等其他交互方式。
    二、机器视觉
    0glass AR智能眼镜为了保证通过AR产生的画面指引足够精确,必须进行图像识别,以图像识别为基础产生信息表达。这样在产业工作中,使用
    AR眼镜
    进行工作辅导才不会有偏差,比如面对着六个并排的螺丝,需要拧左数第二个螺丝,AR眼镜产生的“虚拟扳手”必须分毫不差指示在第二个螺丝上,为了不让它产生偏差而误导工作,AR眼镜就必须使用图像识别。
    与之相比,Hololens在设计的时候使用了SLAM(即时定位与地图构建)技术,并没有使用图像识别,这让行内人很诧异,因为如果仅仅是SLAM技术,那么虚拟图像与现实物体在开关机或者重新定位后将有可能产生位置的偏差;更关键的是,Hololens的SLAM技术目前并没有解决针对两个同样大小的空间的识别问题,当面对2个同样大小的空间时,Hololens极有可能产生混乱,即使他们可能是2个设备不同但大小相同的厂房。
    0glass AR智能眼镜与Hololens的区别同时也应证了“评价产品应该是放在具体领域中进行综合思考”这句话,0glass AR智能眼镜的交互乃至产品硬件设计均在工业领域完美适应,而Hololens依然希望做平台做通用型产品,需对专业领域选择妥协甚至放弃,实际上在消费者领域的部分场景也进行了妥协。
    04
    关于发展
    说到对于0glass未来发展的看法,徐博毫不犹豫地表示非常有信心。一方面,硬件设备已然是目前国内唯一可量产的双目AR智能眼镜,另一方面,就软件系统而言,每一个合作伙伴都是量身定制。无论是研发前的尽职调研,或是产品投入使用后的长期跟踪,0glass秉承的都是绝对尽责的态度。
    与此同时,徐博也表示,一个企业的发展除了自身的优势之外,市场与时机都是极大的助力因素。而这两点,0glass都完美具备。

关于AR

卓越的技术,一流的团队,为您打造专家级AR产品。
Test your infrastructure

什么是AR?

AR(Augmented Reality),即增强现实技术能将虚拟信息(图片,视频, 音频等)融入现实世界,让现实世界更加多元、丰富,为人们带来更加生动有 趣的感官体验。简单来说AR技术给人们带来的是一种信息的增强体验,它也 将成为一种“更新奇、更易传播”的新型信息传递方式。

AR的趋势

在信息技术化的时代趋势下,AR将以一种新型娱乐及信息交互方式融入人们 的生活,而对于企业来说,AR产品的广泛推广及运用也将是一项不可错失的 绝佳商机。

Test your infrastructure

AR运用的困惑

AR技术备受瞩目,然后实际运用上却让人望而止步。
成本上 往往单制作一个AR形式的内容就得花费上万元, 只有高预算的大企业或广告商才能出手
技术上 AR技术总给人一种触不可及的印象,导入AR技术 是否需要高度技术支持。
企划上 AR充满娱乐性,但是好玩之外,如何将AR良性结 合商务是难题。

选择迅速AR的八大优势

迅速AR始终以满足顾客为己任,成就AR领先品牌。

经典案例展示

我们是AR应用的领军者,专注AR技术研究与开发。

新闻动态 · 与日俱进

我们诚心邀您分享我们的成长历程。
更多动态 >

合作伙伴

整合全球产业链资源,服务超过7亿用户