每個人都用一雙眼睛觀看世界。如果閉上一只眼睛,你的左手食指和右手食指同時相對伸出,都難以“相遇”。如果睜開雙眼,這個任務就變得非常簡單。這是百度三維視覺首席科學家楊睿剛在百度大腦論壇上給大家分享的小實驗。“實際上,這是人類通過一雙眼睛以三維視覺對周圍的環(huán)境進行精確的定位,今天我想跟大家分享的就是如何讓機器也能夠擁有像人類一樣觀察世界的能力。”他表示。

DuMix AR開放業(yè)內(nèi)首個AR視頻特效解決方案

無論是人還是機器,三維視覺都是他們了解世界的重要途徑。現(xiàn)場,楊睿剛介紹了百度視覺技術的開放進展,并詳細解讀了三維視覺解決方案及其應用案例。他表示,百度視覺技術繼從看清到看懂后再次實現(xiàn)了新突破——看透。基于百度三維視覺技術,機器可以像人一樣看透世界,從而更好地在AR、新零售、工程機械等領域施展才能。

距今年7月百度大腦3.0版本發(fā)布,開放視覺語義化僅4個月,百度視覺語義化技術平臺開放再次重磅升級。

楊睿剛介紹,在底層依賴上,百度研發(fā)了適用于三維視覺的立體視覺AI傳感器。硬件層面,立體視覺AI傳感器采用了三維AI視覺模組,成本大大降低。而且傳感器通過端上運算縮減了99%云端傳輸量,效率也進一步提升。軟件層面,百度針對立體視覺開發(fā)了從實時端上運算到大規(guī)模云端分布式計算等多種算法,其中一些算法在國際公開數(shù)據(jù)集排行榜KITTI-Stereo上包攬了第一、二名。

在圖片分析上,百度將三維視覺應用在人臉識別上,從而使活體識別正確率從95.26%提升至99.55%。此外,百度三維視覺技術還通過整合場景分類、圖像分割、SLAM等核心能力創(chuàng)新打造了智能化場景的感知能力。而且百度三維視覺將這些能力集成到了移動端上,為手機端的AR特效提供了技術保障。

在視頻分析上,通過引入多角度視頻的標定,三維視覺技術促使人體檢測和跟蹤準確率達到了95%以上。

基于在底層依賴、圖片分析和視頻分析等技術上的突破,百度升級了可視化展現(xiàn)、機器人SDK、新零售和工程機械的解決方案。

AR是當前最熱門的交互方式。百度推出的可視化展示產(chǎn)品方案DuMix AR 3.0結合了人臉特效、美化特效、環(huán)境特效和人體特效等20多項AR能力,為用戶和開發(fā)者提供了豐富的交互體驗。不僅如此,借助這些開放基礎能力和相互疊加的組合玩法還能形成一套完整的AR視頻解決方案。

AR視頻解決方案涵蓋四大技術應用方向的全面能力矩陣、整合百度AI+AR多重能力、更加易用的平臺工具和完善的服務體系,為開發(fā)者與行業(yè)合作伙伴提供了高效、低成本的內(nèi)容制作服務;同時結合百度強大分發(fā)優(yōu)勢,助力合作伙伴實現(xiàn)業(yè)務創(chuàng)新、創(chuàng)造巨大的用戶價值。目前,百度AR視頻特效解決方案已經(jīng)陸續(xù)與全民小視頻、百度貼吧、好看視頻等多個垂直內(nèi)容合作伙伴開展探索合作,將持續(xù)推動AR視頻制作成為AR技術應用的又一常態(tài)化新場景,吸引越來越多的優(yōu)質(zhì)內(nèi)容生產(chǎn)者加入百度AR生態(tài)。

除了聽和看的能力,機器人最重要的還有行走能力。當前機器人動作能力非常有限,大部分機器人都是固定不動,一些機器人能在靜態(tài)環(huán)境中運動,而在復雜環(huán)境中機器人行動就會非常緩慢。針對這些情況,百度動態(tài)復雜環(huán)境下新導航算法可以創(chuàng)建仿真環(huán)境,并讓機器人在這個仿真的環(huán)境中做各種各樣行走的嘗試,并從中找到一個最優(yōu)的路徑。即使在人流密集的商場里,基于該算法的機器人也能輕松行走,這背后的算法與Alpha Go是一樣的。

在日常應用中,百度融合視覺語義化與AR等能力打造出全新的AI零售解決方案。這套方案通過人流抓拍會員管理、客流計數(shù)、人流動線與熱力圖統(tǒng)計,能夠提高客戶轉(zhuǎn)化率,提升整體收益,實現(xiàn)更便捷地管理,同時還能通過分析獲取數(shù)據(jù)結構,為商家提供策略指導。據(jù)悉,百度與海信合作打造的AI零售體驗店隨后將會面向公眾開放,為用戶提供即拿即走的便捷購物體驗。

除零售外,三維視覺也為工程機械帶來了煥然一新的智能化體驗。以往常說“挖掘機技術哪家強,中國山東找藍翔”,不過注入AI的百度無人挖掘機技術可不遜于藍翔。百度開發(fā)的無人挖掘技術方案,是世界上首套基于視覺技術開發(fā)的低成本、可量產(chǎn)、適用工程挖掘裝備的人工智能解決方案。在工程項目中,無人挖掘機與無人機、自動駕駛工程運載車默契配合,從制作作業(yè)方案、精準施工、轉(zhuǎn)運、卸載全流程自主完成,從而可以達到作業(yè)與管理的少人化/無人化,降低安全風險,實現(xiàn)設備全天候智能施工,不僅大幅提升了施工效率,而且顯著降低人力成本,將助力企業(yè)實現(xiàn)收益倍增。

楊睿剛表示,“百度視覺從最初的單張圖片分析開始,進入視頻,進入三維,不斷地向更高緯度的發(fā)展。這都是為了更好地讓機器看清、看懂、看透我們的世界,從而更好地為我們服務。”百度視覺還將持續(xù)創(chuàng)新,不斷突破,為開發(fā)者和合作伙伴提供更多的AI技術和解決方案的支持。隨著百度AI生態(tài)的勢能不斷增加,越來越多的行業(yè)將進入AI變革,也正在給我們帶來更智能更便捷的生活。