火狐直播病理科信息管理系统火狐直播医院信息平台火狐直播医技统一预约整体解决方案火狐直播内镜影像管理系统火狐直播放射影像管理系统火狐直播专业超声检查系统火狐直播医学影像学网络教学系统火狐直播医疗智能决策系统火狐直播数字网络视频会诊系统产品系列解决方案智能影像云电子胶片医技统一预约新冠AI公司动态行业新闻公司简介企业文化企业荣誉发展历程联系方式加入我们客户中心

火狐直播网页:从微软Kinect到人形机器人盘点本世纪五大“划时代”产品

发表时间:2024-01-10 11:29:49 来源:火狐直播网页作者:火狐足球

  今年 8 月,微软官宣停产Azure Kinect DK,由中国3D视觉感知龙头奥比中光接手该技术产品线。这则消息,意味着“Kinect”这一颇具传奇色彩的名字正式成为历史。

  说起来,Kinect最初只是用来玩体感游戏的外设,却无意间开启了消费级机器传感设备的新纪元,带动了3D视觉技术在产业端的应用,成为了现代科学技术产品史上的一大里程碑。

  在5G、人工智能、机器学习浪潮下,本世纪的科学技术产品可谓是异彩纷呈。从微软的体感游戏鼻祖Kinect到划时代的iPhone,再到今年大火的具身智能和人形机器人。本文就来盘一盘那些具有“划时代”意义的硬核创新,如何展现出技术与产业迭代发展的脉络。

  在消费电子届,获得“最畅销消费电子设备”吉尼斯世界纪录的不是iPhone,不是Switch,而是微软第 一代Kinect。

  iPhone初代总销量 130 多万台,而微软Kinect一代2010 年上市 60 天内销量就达到了 800 万台。当时的Kinect还是个给Xbox打工的“小弟”,通过手势识别、身体骨骼检测、语音识别控制等技术,为游戏玩家提供更真实的体感游戏体验。

  虽然由于游戏开发供应不上,Kinect一代仅在市场上存活了 7 年,但在技术和应用上的开创性是毋庸置疑的。甚至后来苹果开发的Siri语音助手、亚马逊的Echo智能音响、谷歌的Project Tango,都得称Kinect为“前辈”。

  2019 年,也是Kinect一代停产的两年后,微软推出Azure Kinect 开发者工具包,为Kinect打开了更广阔的商用天地。

  Azure Kinect被称为小型AI终端,它面向研发人员提供深度、视觉、声音和方向四大类传感器SDK,还有Azure云端加持,如果说传感器能让机器“看见世界”,那Azure就可以让机器“看懂世界”。

  今年,微软宣告了Kinect的终章,但也通过与奥比中光合作,开启“中国版Kinect”新的序曲,也是新的Femto系列iToF相机。该系列目前一共三款产品,Femto Bolt、Femto Mega、Femto Mega I,三者有着各自的优势,适用于不同场景。

  Femto Bolt具有Azure Kinect相近的操作模式和性能,能轻松实现“无缝替代”;而Femto Mega性能更为强大,搭载了NVIDIA Jetson Nano深度算力平台,能摆脱相机对外设算力的依赖;Femto Mega I 则拓展了工业领域应用场景。奥比中光在高精度深度摄像头领域有着深厚的研发设计制造经验,与微软、英伟达的合作带来了新品在外观、算力、质量等多方面的提升,能更广泛地应用在机器人、工业自动化、虚拟现实、增强现实、人机交互等领域。

  HoloLens是微软 2015 年发布的可穿戴式增强现实计算设备,跟Kinect是“亲兄弟”,父母都一样(研发领军人都是Kipman)。

  Kinect负责的是把现实输入到虚拟世界,而HoloLens的作用则在于把虚拟世界输出到现实中。Kipman对HololLens的最初期望是“手机终结者”,再次革新人类与数字世界的交互方式,让人类重新再回到三维世界中去。

  HoloLens有点像“头戴式Kinect”,通过采用间接飞行时间深度传感技术,进行实时的三维信息计算和重建,前面提到的Femto系列用的也是这一技术。

  使用者带上HoloLens后,能够在现实环境中看见并直接操作各种虚拟物体,进行真正的“无实物表演”,比如在空气中弹钢琴、敲键盘、看电影……HoloLens还具备自主定位与跟踪,手势和语音控制等功能。

  虽然HoloLens能让使用者化身科幻电影主角,高昂的价格和有限的应用依旧限制了它的发展,和Kinect类似,HoloLens在商业应用中找到了自己的位置。 2017 年,福特汽车引入HoloLens进行汽车工业设计,它可以帮汽车设计师更直观地向“产品经理”进行模型展示,随后工业制造、教育、医疗保健等行业也开始应用HoloLens。 2019 年发布的HoloLens2 新加了眼球追踪功能,对处理器和HPU进行了升级,还推出了定制服务,商用优势更明显。

  曾经iPod是苹果最成功的产品,但随着手机开始提供MP3 功能,苹果感受到了危机。为增强iPod竞争力,苹果开始尝试给它“添砖加瓦”。 2004 年,有了能上网的iPod,而 2007 年,有了能听音乐的iPhone。

  这个搭载着3. 5 英寸显示屏的“手机异类”最初并不被同行看好。初代iPhone的总销量是 130 万部,远不及当时的诺基亚、摩托罗拉、索爱等。而iPhone的后劲,超乎当时的人们对手机的想象。

  初代iPhone第 一个创新就是在透明手机屏上使用多点触控技术,这个技术已彻底改变了人类与数字世界的交互方式,甚至改变了思维方法。想起前不久看的一个综艺,节目里一个三岁的小孩,看到墙上的投影后第 一反应是直接用手试图操作投影界面,节目里大人看到后不住发笑,但转念一想,这不就是增强现实在干的事吗?

  iPhone干的第二件大事,是推出了App Store软件平台,这一创新不仅改变了运营商与手机生产厂商的关系,还彻底改变了手机的角色。

  iPhone之前,大多数手机像是升级版“对讲机”,是为不同的运营商导流的无线通讯设备。尤其在欧美以及日本,用户要先和运营商签入网协议,再购买运营商提供的合约机。而App store将手机变成了游戏机、阅读器、影音娱乐设备、照相馆、购物商城……iPhone不只是改变了手机行业,更创造了新的生活方式。

  早期人类对家庭机器人的想象总是因朦胧而满怀温情,就像本世纪初的电影《机器管家》、《人工智能》里,期待着机器人成为家庭的一份子。然而 20 年过去了,想象被现实狠狠地泼了一盆冷水。

  2017 年以 899 美元发售的JIBO应该算是第 一台面向市场的家庭机器人,它的研发领军人是MIT博士Cynthia Breazeal。早在 2014 年,JIBO就上线了产品众筹平台Indiegogo。圆乎乎的身体,可爱的表情,搭载语音识别、人脸识别、机器学习技术,“智商”和“情商”兼备,基本满足了人类对家庭机器人的期待,最终项目以230%的成绩超额完成众筹目标,足以说明市场对它的期待。

  2017 年正式发售后JIBO荣登《时代周刊》封面,被评选为年度 25 大最 佳发明之一, 2018 年还获得了拉斯维加斯CES机器人类别的年度创新奖。

  然而昙花一现, 2018 年Jibo就把所有知识产权出售给了一家独立的资产管理公司, 2019 年关停服务器。

  原因有很多,不过最主要的恐怕还是市场需求问题。在 2014 年众筹到 2017 年上市最近一段时间,亚马逊推出了首 款智能音响Echo,实现了语音控制; 2017 年推出迭代后的Echo Show,搭载触控屏,能提供家庭娱乐、家电控制、家庭通讯等功能,而价格仅为为同期发售的JIBO的1/4。与此同时,各种智能家居产品迅速涌现。相比之下,JIBO价格高昂,功能也有限,实在难以找到立足之地。

  不过无论是外观还是功能,现在很多家用机器人身上还是能看到JIBO的影子,JIBO也算是当之无愧的初代家庭机器人。

  2009 年,Atlas前身——波士顿动力打造的双足机器人原型机Petman“精彩”亮相,细长的双腿在履带上摇摇晃晃弱不禁风的样子,像极了商场门口的气球人。

  4 年后,初具人类外形的Atlas原型机面世。大腿强壮了不少,还有了胳膊,但依然没有摆脱电缆的束缚。直到 2016 年,Atlas终于开始独立行走并施展了初级“职场技能”——搬砖。

  接下来Atlas的每一次亮相,都会赚取“哇声一片”。 5 年时间里Atlas先后解锁了后空翻、跑步、爬楼梯、倒立、空中一字马、跳舞、跑酷等技能,成为了人形机器人中的天花板。

  双足人形机器人的自主平衡性和运动稳定性一直是学术界研究的难题,而Atlas通过IMU、关节位置和力传感器来控制身体并感受地面获得平衡,其运动技能的进化代表着人形机器人技术的飞跃。

  而 2021 年能进行障碍跑酷的Atlas还具备了机器学习技能。之前的Atlas是通过事先编程完成运动,而 2021 年的Atlas搭载了深度相机,能感知环境,通过收集距离数据生成环境点云,进而“自行”规划行动路径。

  由于制造成本高昂,市场需求不明,人形机器人的商业化目前仍是难题。不过尽管如此,人形机器人还是代表着世界最前沿的科研与产业方向之一。国外如特斯拉、谷歌、三星等巨头早已入局人形机器人,而在国内,来自华为的“天才少年”稚晖君也选择人形机器人方向创业。人形机器人这一充满未来感的产品,或许也可以在不远的将来走进千家万户。

  特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,有关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关联的资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人觉得本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点这里就可以看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关联的内容或断开相关链接。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!

  人形机器人,大众对他的理解,往往还存在于科幻影片中,无论是《变形金刚》、《终结者》、《机械战警》等汇聚很多材料、很多类型的人形机器人火爆激战场面的电影是《人工智能》、《真实世界》、《铁甲钢拳》等将人形机器人赋予人类情感的影片,人形机器人都是科幻电影的主角,代表着未来各项尖端科技汇聚的最高成果。人形机器人被国际上视作衡量国家科学技术创新能力、高端制造业水平和产业竞争力的重要标志之一,被誉为“机器人皇冠上的明珠”。伟景智能将紧紧抓住这个跨时代的历史机遇,沉下心来认真打磨技术与产品,为梦想、为世界带来更多的关于人形机器人赛道的“iPhone时刻”!

  特斯拉Optimus,特斯拉的人形机器人,在最新的视频中展示了惊人的进步,该视频由官方特斯拉Optimus账号发布。特斯拉机器人现在运行在与特斯拉汽车相同的端到端神经网络上,该网络能处理视频输入并生成控制输出。Apptronik的机器人可能是特斯拉Optimus的潜在竞争对手,后者仍在开发中。

  在刚刚过去的周末,特斯拉Optimus官方账号上传了一段新视频,展示了旗下人形机器人最新技能。能够正常的看到它不仅仅可以依靠视觉就能给物品分类能单腿站立做出瑜伽动作,可以说进步明显,马斯克在评论区也直接表示Progress”。”能够正常的看到视频中机器人完成了按照颜色为物体分类的任务能将被故意移开的积木重新定位并放回原处,还可以在摆放的过程中纠偏”,这些说明它能适应变化的环境并随时做出调整非单纯按照设定程序执行。

  沉寂了几个月的特斯拉人形机器人擎天柱终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时Optimus展示了自由行走、灵活抓取放下物体等技能。下一次它将如何进化,我们拭目以待。

  特斯拉发布了其首款人形机器人“擎天柱”的最新进展。在最近一次更新中,该公司指出,该机器人现在能够自主分类物体,并完成瑜伽动作。这些姿势与任何实际在做的工作负载无关,但展示了该机器人怎么来控制其身体并保持其稳定性。

  AI,似乎慢慢的变成了未来互联网战场的入场券。俯瞰国内当下的AI产业高质量发展,对于互联网科技公司们来说,大致有两条入局路径。但回到现实,监管引导、伦理问题等讨论仍将持续一段时间。

  阿宁在酒店点了一份外卖,外卖员称已经放到酒店大堂,一会送上来。客房的电话响起,里面传来AI提示开门的声音。应受访者要求,文中阿宁、徐远为化名。

  Salesforce宣布了一项重大计划,计划收购Airkit.ai,这家低代码平台将帮助电子商务公司构建强大的AI客服聊天机器人。该交易的具体条款并未公开披露。这一交易对于Salesforce来说无疑是加强其AI客服代理能力的重要举措,也将进一步提升其在电子商务领域的竞争力。

  波兰一家酒精饮料公司Dictador宣布,将任命人工智能机器人为首席执行官。去年8月,此公司任命了名为米卡的机器人作为其实验性首席执行官,米卡是人工智能驱动的人形机器人,体型和身高都和人类相似,除了双脚是以轮子来移动。早在2017年,阿里巴巴创始人兼CEO马云曾做出预测:机器人非常有可能会作为30年来最好的CEO登上时代周刊的封面。

  全球商用服务机器人的领导者普渡科技宣布与软银机器人正式达成战略合作,携手共创商用服务机器人新未来。通过此次合作,普渡科技在配送机器人和清洁机器人品类的产品技术优势将与软银机器人在日本市场的专业相关知识强强联合,实现共赢。作为一家机器人集成商,我们正在利用这些无与伦比的资源,以满足所有希望机器人成功的开发者的需求,以及渴望采用机器人的用

  English Coach是一个英语学习个性化教练APP。它能支持、纠正和鼓励用户在每一个学习阶段,提供专业的人建议,帮助用户快速获得自信,并为自己的英语感到自豪。该APP内含Oxford University Press设计的100多个工作场景的英语口语和发音练习,涵盖面试、会议、演示等。关键功能包括:实时英语口语练习和接收反馈、个性化学习建议、适合用户学习进度的专业内容、模拟不同工作场景的英语对话练习等。它适用于想提高英语口语和降低口音的用户,尤其是职场人士。

  MagicVideo-V2是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成管道。其架构设计使得MagicVideo-V2能够生成外观美观、高分辨率的视频,具有非常出色的保真度和平滑性。通过大规模用户评估,它展现出比Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion等领先的文本到视频系统更优越的性能。

  Chain-of-Table是一种表格理解的推理链表框架,专门用于处理基于表格的问答和事实验证等任务。它采用了表格数据作为推理链的一部分,通过在上下文中学习的方式指导大型语言模型做相关操作生成和表格更新,从而形成一个连续的推理链,展示了给定表格问题的推理过程。这种推理链包含了中间结果的结构化信息,可以在一定程度上完成更准确可靠的预测。Chain-of-Table在WikiTQ、FeTaQA和TabFact等多个基准测试中取得了新的最先进性能。

  Naria是一款强大的故事创作AI产品,能够在一定程度上帮助用户创作插图儿童故事,并将其打印成书籍或在数字平台上分享。用户都能够通过Naria进行角色创作、文本编辑、背景翻转和更换等操作,并在三个简单步骤内完成整个故事的创作、定稿和分享流程。Naria还提供定制角色表情和拖放式建模工具,让用户完全掌控故事创作的过程。产品定价灵活,数字故事免费创作并可无限分享,而实体书籍则提供按册付费的选项。

  rabbit是一个研究项目,旨在开发可以理解和模拟人类在计算机应用中的行为的系统。这个系统被称为大型行动模型(LAM),采用神经符号编程技术,允许直接模拟各种应用程序和用户在其上执行的操作。LAM在精确度、可解释性和速度方面与最先进的方法相媲美。它的目标是为各种AI助手和操作系统的部署提供支持,帮助塑造下一代自然语言驱动的消费者体验。

  GPTEval3D是一个开源的3D生成模型评价工具,基于GPT-4V实现了对文本到3D生成模型的自动评测。它可以计算生成模型的ELO分数,并与现有模型进行对比排名。该工具简单易用,支持用户自定义评测数据集,可以充分发挥GPT-4V的评测效果,是研究3D生成任务的有力工具。

  Fotofit是一个引入全新方式来发现和购买新造型的应用!Fotofit的人工智能技术为您量身定制时尚造型,您可以在自己身上看到并从您喜爱的品牌购物!加入我们的Discord社区,成为时尚的一部分,获取更多服装灵感并帮助塑造应用的方向。通过Fotofit,您可以发现为您量身定制的全新造型,购买任何造型,看到您为任何场合或氛围打扮的样子,看到自己穿着当今最热门的潮流,保存您喜欢的造型,与朋友分享您的造型,编辑您的偏好。我们很乐意听取您的反馈和功能请求!请通过电子邮件与Masha联系,或在Discord上与我们交谈。

  Journalie是一款AI时代的日记应用,通过语音记录用户的故事,自动生成独特的页面,帮助用户发现日常情绪。它的AI能够转录用户的故事并生成独特的页面。用户能够最终靠滚动日历来回顾自己的故事,而每个故事都会被存档在日历中,用户一目了然地看到当天的主要情绪。Journalie旨在让日记记录变得简单有趣,用户都能够选择保持私密或与朋友分享。此外,Journalie还提供社交功能,方便用户分享自己的故事。它不仅仅是一个应用,更是用户表达、发现和连接的空间。

  Manja.AI是一款AI赋能的销售辅导工具,旨在帮助销售团队发掘潜力,提供个性化辅导和深度分析。其系统基于多年的销售经验,为每位销售团队成员提供个性化辅导,同时为管理层提供深入的分析。Manja.AI能够帮助您找出销售技巧和销售对话阶段的薄弱环节,让您的团队更加高效地工作。产品定位于提供个性化销售辅导和数据驱动的销售分析。

  Ballie是一个家庭助手机器人,能自主在家中行驶完成各种任务。通过连接管理家居电器,Ballie可以在很多情况下为用户提供帮助,如播放音乐,接听电话等。Ballie还能发送关爱物或家人的视频更新到用户的设备上。用户无论是在工作,锻炼还是休闲,Ballie都能给家中创造适合的氛围。

  One liner GPT是一款由Sergei、Rodion和Evan开发的产品,基于OpenAI GPT-3.5和Bytescale技术,能够帮助用户使用人工智能生成约会简介。该产品具有智能生成、个性化定制、高效便捷等特点。定价灵活,定位于个人用户和约会服务平台。

  Post BrAIner是一款AI内容生成平台,可以在几秒钟内创建新的帖子,并直接发布到您的Wordpress页面。它提供了AI内容创作、获取创意、发布博客的最佳解决方案,所有这些都可以在一个平台上完成。用户都能够使用AI快速创建文章内容,获取新文章创意,直接在Wordpress上发布,并且优化博客以在Google排名。此外,用户还可以使用AI功能为帖子提供新图片。Post BrAIner还提供了免费试用,以及客户成功案例,展示了内容创作速度提高、节省成本和获取新创意等优势。

  Items.Design是一家提供AI生成的设计资源的网站。这些设计资源包括不同的图形,图标,3D渲染等等。每周都会有新的资源更新。设计师可以在商业项目、广告、移动应用、网站中自由使用这些资源,无论是商业项目、广告、投资汇报、移动应用还是网站,都能找到你需要的设计元素。

  Transvribe是一款由Zahid开发的AI视频搜索工具,通过AI嵌入技术,用户可以粘贴YouTube视频链接或搜索热门视频,快速获取视频内容的文字转录。这款产品旨在提高在YouTube上的学习效率,使用户可以更快速地获取所需信息。Transvribe的优势在于快速准确地转录视频内容,为用户节省时间,提高学习效率。目前Transvribe提供免费使用,未来可能会推出更多增值服务。

  PaintPotion是一款AI辅助的矢量插图生成工具,通过输入提示语并选择风格,即可在30秒内生成4幅保持一致风格的矢量插图。对于忙碌的网络机构和创意个人来说,它简化并加快了设计流程。产品采用按次付费模式,用户可以根据需求选择不同的套餐,每幅插图消耗一定的积分。

  Kippy 是一个帮助你通过真实对话来掌握第二语言的应用。你可以测试和改善发音,提高口语自信。

  IP Author 是一款由人工智能驱动的专利起草软件,帮助知识产权律所和企业专利团队自动化专利起草流程。它可以无缝生成专利权项,提供详实的先前技术参考,为全面审查消除任何不确定性。同时,IP Author 还能快速生成简明扼要的背景和发明说明,让您在几个小时内完成专利申请。通过 Dolcera PCS 的先前技术搜索引擎,您可以轻松分析先前技术并在几分钟内修改专利草案。IP Author 还提供不同的定价方案,以满足不同用户的需求。

  Sama是一款个性化的人工智能应用,可以帮助用户反思、成长,通过与Sama的交流,捕捉用户的日常对话并提供反馈,帮助用户成为最好的自己。该应用具有记忆、反馈、保护隐私等功能。

  Galileo AI是一款文本转UI平台,通过人工智能技术,让用户能够以超高速度设计出超乎想象的界面。其主打功能包括快速生成UI界面、提供丰富的设计元素、支持定制化设计等。Galileo AI的定价灵活多样,适用于个人用户和企业用户,定位于为用户更好的提供高效、便捷的界面设计解决方案。

客服服务热线
4008-360-666(周一至周日:9:00-22:00)
公司地址:深圳市南山区学苑大道1001号南山智园A3栋6楼 邮政编码:518000 客服邮箱:market@www.njdahao.com