智能手机正成为一款AI超算机

2024-12-23上海AR开发专家

  • 相片存储器、瞬时插画、即时翻译、仿真虚拟现实以及众多新技术即将来临。
    9月13日更新后,iPhone用户可以在任何时间寻找附近任何人、任何东西以及任何地点的图片。IOS 1O采用了类神经网络人工智能技术,可在十分之一秒内对拍摄的照片进行110亿次计算,确定照片人物的身份甚至心情。
    掌上人工智能技术日新月异,IOS 10照片APP只是最新的案例。Aipoly是今年一月份发布的APP,能够识帮助盲人识别物体并说出名字。你只需将照相机对准某一文本,谷歌翻译就可将其转换成另一种语言。这些功能即使在没有信号的情况下也能使用。
    [图片: Flickr 用户 hotrodnz]
    正如“在云端”正成为每个“工作原理”的答案一样,智能手机正变得更加独立,能够独立完成任务而无需像以前一样越狱。结果是更加自然的AI体验诞生了,再也不用担心连接数据中心的延时问题了。Aipoly的联合创始人Alberto Rizzoli称,“如果我说,‘嗨Siri,这是什么?’只需两秒它就可以将图片传送到云端并得到回应”。“这感觉好像和一个刚睡醒的人讲话”。Aipoly并不是第一款为盲人设计的APP;但它是第一款可即时识别物体的APP,而且是切断与云端的联系并在手机上独立运行AI。
    即时AI技术使AR不仅仅停留在《Pokemon GO》阶段,它能够精确绘制周围环境,并将丰富的3D物体、角色和动画插入手机或平板中的视频。同样地,运用移动AI技术的虚拟现实也会看起来更加真实。Gary Brotman是移动芯片制造商Qualcomn的产品经理,他领导了机器学习平台的开发。他说,“要想正确地完成一件事,所有东西都必须是完全实时的,因此你必须呈现视频、音频以及能够驱动眼球追踪、头部追踪、姿势追踪和立体声效果追踪的智能技术,这样才能将房间的音响效果移植到虚拟体验中”。
    [幕后视角展示了Aipoly是如何快速考虑不同选择的可能性。]
    AI也会让生活变得更加方便。Rizzoli表示,你可以看到虚拟助理使用手机相机确定你的位置,比如特定的街道或餐馆的内部,并提供相关的APP。仅此一次,这种极度便利不会让人觉得害怕。如果AI不再需要云端支持,那么云端也就不再需要你的个人数据。
    Brotman称,“无论是隐私、延迟或者其他种种原因,没有理由不在手机上使用分析和智能工具。”
    AI
    是什么将AI的功能带到掌上设备?答案是电子游戏。
    Rizzoli称,“人们希望手机或iPad上有更好玩的移动游戏,所以Apple、Qualcomn以及其他芯片制造商才这么不遗余力地提供更佳的性能。”这也促进了更多强大的移动CPU和图形处理器的发展。大多数CPU是串行工作的,但GPU是并行工作的,处理更简单但数量庞大的任务以满足快速处理3D图形的需求。AI也需要同时处理大量且简单的工作。
    卷积神经网络(CNN)是现代图像识别的主要组成部分。CNN模仿大脑视觉皮层的工作原理,将视域分为重叠磁贴,同时滤掉一些简单的细节,比如这些磁贴的边缘。随后该信息传送到另一层神经元(人体中的生物过程或软件中的虚拟过程),可能将边缘组成称线;另一层可能识别出原始形状。每一层(可能有若干层)都会增加对图像的认识。Rizzoli表示,“你正在看一张照片,你会同时辨认出图片中不同的元素。你看图像的边缘,同时也会分辨其形状。所有这些都是同时进行的。”
    谷歌翻译
    智能手机芯片已经经受了几年的考验。甚至2013年发售的iPhone 5s仍可支持IOS 10的人物、场景和物体识别功能;Aipoly也正在开发不同版本,使程序可以在iPhone 5及几年前的Android手机上运行。但程序员最新发现这方面可以好好加以利用。六月份上线的图片处理软件Prsima便是最早的采用者之一。
    25岁的Aleksey Moiseenkov开发了这款应用,可让手机照片模仿超过30种艺术画作的风格,比如《呐喊》、蒙德里安风格,许多标题十分有趣,例如“美到犯罪”、“火焰喷射器”以及“#GetUrban”。渲染效果几乎是即时的,这让人忽略了其复杂性。Instagram滤镜可以简单地调整基本参数,如色彩、对比度、亮度以及白平衡。而Prsima需要分析图像,识别不同元素,例如形状、线条、色彩以及阴影,并像Edvard Munch或Piet Mondrian一样对其进行重绘。最终呈现的图片十分精美,甚至让原本无趣的图片变得栩栩如生。
    [左边是一幅极度无趣的图片,右边是经过Prisma处理的图片。]
    起初Prism是在云上工作的,但Moiseenkov称那样会损害APP的品质。他表示,“我们在亚洲拥有众多用户,我们必须让他们拥有相同的体验,无论网络连接状况如何,无论服务器或云处理器在哪。”一款可以在iPhone上完美运行的新应用即将在八月份上线,而Moiseenkov也正在开发相同的Android版本。
    Moiseenkov表示,大概在九月份的更新后,视频也可以使用其艺术效果了。“就服务器过载等其他一些方面来说,视频版本的应用要复杂很多,因此在手机上测试这些效果是至关重要的。 ”
    [即将上线的新版Prisma可以转换视频及照片。]
    Moiseenkove和他的团队投入大量时间研究如何让AI软件在智能手机上运行,但未来的程序员可能不用这么麻烦。五月份,Qualcomn发布了为其骁龙820芯片开发的名为“神经处理引擎”的软件开发者工具包,该芯片支持2016高端Android手机,比如Samsung Galaxy S7及Note 7、Moto Z及Z Force、OnePlus 3、HTC 10以及LG G5。该软件可同时应对CPU、GPU以及芯片其他组件之间的任务,比如场景侦测、文本识别、面部识别及自然语言处理(理解对话语言而非严格的指令)。
    专业AI芯片也即将来临。一家名为Movidius的公司开发了视觉处理器(VPU),针对计算机视觉神经网络进行优化。(芯片巨擘英特尔本周承认收购该公司)。该公司最新的Myriad 2芯片可在大疆Phantom 4无人机上运行,帮助其进行观察并躲避障碍物、盘旋以及追踪运动主体,如自行车手或滑雪者。
    iBrain
    Apple一直对其AI计划含糊其辞,称在六月份预告IOS 10之前不愿意透露太多。
    AI驱动的照片应用是最大的组件,其使用神经网络进行深度学习处理,用于识别图片中的场景、物体和面部,并将它们分组,使它们可供检索。其回忆功能可依据人物、场景或任何有意义的事情(如旅行)将照片和视频作成合辑。Apple称,这样做可使个人信息保密。
    神经网络还可以支持Apple的输入预测功能,IOS 10之前AI表现很好。Apple于2014年7月将Siri转换成可在手机运行的神经网络,以提高其语音识别能力。
    目前大多数APP制造商会将Siri插入到iPhone AI中。Apple并没有像Qualcomn发布骁龙那样发布A系列芯片的AI编程工具,但名为SiriKit的工具可让开发者通过Apple的虚拟助理与
    苹果
    应用进行交互。
    但Apple并不怕在帮助第三方开发者开发AI方面落后Qualcomn。据报道,公司最近花费2亿美元创建了名为Turi的公司,为程序员提供AI工具。开发者开发起来会更加容易。iPhone 7和7 Plus的A10 Fusion芯片比前几代iPhone运行速度快40%,图形处理速度快50%。
    随着人工智能在科技界的发展,它在手机方面的应用也是大势所趋。人们越来越相信这些小东西可以知道我们的需求和想法。“我可以说大多数移动应用将会变成AI应用,”Nardo Manaloto如是说,他是一位AI工程师和顾问,专注于研发健康类应用如虚拟医疗助理。
    Alberto Rizzoli希望在一月份的CES上看到众多新应用。他说,“当更多深度学习软件工具出现,并且开发者本身也意识到其发展时,众多App开发者便会蜂拥而至。许多计算机科学专家仍认为这是黑魔法,其实并不是”。

关于AR

卓越的技术,一流的团队,为您打造专家级AR产品。
Test your infrastructure

什么是AR?

AR(Augmented Reality),即增强现实技术能将虚拟信息(图片,视频, 音频等)融入现实世界,让现实世界更加多元、丰富,为人们带来更加生动有 趣的感官体验。简单来说AR技术给人们带来的是一种信息的增强体验,它也 将成为一种“更新奇、更易传播”的新型信息传递方式。

AR的趋势

在信息技术化的时代趋势下,AR将以一种新型娱乐及信息交互方式融入人们 的生活,而对于企业来说,AR产品的广泛推广及运用也将是一项不可错失的 绝佳商机。

Test your infrastructure

AR运用的困惑

AR技术备受瞩目,然后实际运用上却让人望而止步。
成本上 往往单制作一个AR形式的内容就得花费上万元, 只有高预算的大企业或广告商才能出手
技术上 AR技术总给人一种触不可及的印象,导入AR技术 是否需要高度技术支持。
企划上 AR充满娱乐性,但是好玩之外,如何将AR良性结 合商务是难题。

选择迅速AR的八大优势

迅速AR始终以满足顾客为己任,成就AR领先品牌。

经典案例展示

我们是AR应用的领军者,专注AR技术研究与开发。

新闻动态 · 与日俱进

我们诚心邀您分享我们的成长历程。
更多动态 >

合作伙伴

整合全球产业链资源,服务超过7亿用户