隨著中國(guó)人工智能的飛速發(fā)展,中國(guó)企業(yè)及學(xué)術(shù)界人士在世界頂級(jí)學(xué)術(shù)會(huì)議上扮演著越來(lái)越舉足輕重的角色。6月18日,全球計(jì)算機(jī)視覺及模式識(shí)別領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議CVPR 2018(Conference on Computer Vision and Pattern Recognition)在美國(guó)鹽湖城召開,國(guó)內(nèi)人工智能技術(shù)領(lǐng)跑者百度作為重要支持者亮相本屆大會(huì),聯(lián)合舉辦了大會(huì)唯一一場(chǎng)自動(dòng)駕駛研討會(huì)(Workshop on Autonomous Driving-WAD)。此外,基于大規(guī)模自動(dòng)駕駛數(shù)據(jù)集ApolloScape展開的Video Segmentation Challenge(視頻場(chǎng)景解析挑戰(zhàn)賽)也成為本屆CVPR的最受關(guān)注的挑戰(zhàn)賽之一,集結(jié)了全球100多家高校及機(jī)構(gòu)團(tuán)隊(duì)參加。
此次自動(dòng)駕駛研討會(huì)上行業(yè)大咖云集、干貨滿滿。特斯拉人工智能部門主管Andrej Karpathy、KITTI數(shù)據(jù)集創(chuàng)始人Andreas Geiger、Lyft工程副總裁Luc Vincent、Waymo技術(shù)主管Congcong Li和Chen Wu、Uber自動(dòng)駕駛部門(ATG)主管Raquel Urtasun、加州大學(xué)伯克利分校教授,BDD研究中心副主任Kurt Keutzer等重量級(jí)專家同臺(tái)交鋒,就自動(dòng)駕駛未來(lái)發(fā)展進(jìn)行了前沿分享和深入探討,搭建了自動(dòng)駕駛產(chǎn)學(xué)研界溝通的橋梁。此外,ApolloScape還在6月18日晚上舉辦一場(chǎng)精致的晚宴,邀請(qǐng)計(jì)算機(jī)視覺界極具創(chuàng)新想法和實(shí)踐精神的研究人員、開發(fā)者和合作伙伴出席,進(jìn)行進(jìn)一步的分享交流。
(活動(dòng)現(xiàn)場(chǎng),百度機(jī)器人與自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人楊睿剛,Lyft工程副總裁Luc Vincent,南加州大學(xué)教授/Amazon Director of Research Gerard Medioni,康納爾大學(xué)教授/Computer Vision Foundation主席Ramin Zabih)
自動(dòng)駕駛研討會(huì)聯(lián)合主席,百度機(jī)器人與自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人楊睿剛教授介紹到,在自動(dòng)駕駛開發(fā)測(cè)試中,海量、高質(zhì)的真實(shí)數(shù)據(jù)是必不可缺的“原料”。但是,少有團(tuán)隊(duì)有能力開發(fā)并維持一個(gè)適用的自動(dòng)駕駛平臺(tái),長(zhǎng)期的,系統(tǒng)的收集和標(biāo)注新數(shù)據(jù),因此行業(yè)亟需一個(gè)數(shù)據(jù)量充沛、標(biāo)注詳實(shí)的自動(dòng)駕駛專用數(shù)據(jù)平臺(tái)。今年3月,百度大規(guī)模自動(dòng)駕駛數(shù)據(jù)集ApolloScape應(yīng)需開放,致力于為全世界自動(dòng)駕駛技術(shù)研究者提供更為實(shí)用的數(shù)據(jù)資源及評(píng)估標(biāo)準(zhǔn)。據(jù)介紹,ApolloScape目前行業(yè)內(nèi)環(huán)境最復(fù)雜、標(biāo)注最精準(zhǔn)、數(shù)據(jù)量最大的三維自動(dòng)駕駛公開數(shù)據(jù)集。
(ApolloScape 活動(dòng)現(xiàn)場(chǎng))
感知能力是自動(dòng)駕駛亟待攻克的方向之一,而語(yǔ)義理解則能幫助更加準(zhǔn)確地解析目標(biāo)場(chǎng)景對(duì)象。但是,圖像的語(yǔ)義標(biāo)注需要耗費(fèi)大量的財(cái)力和人力,因此業(yè)內(nèi)目前能夠用于語(yǔ)義分割的標(biāo)注圖像數(shù)據(jù)極其有限。因此,被標(biāo)注的圖像數(shù)據(jù)量和場(chǎng)景組合成為衡量一個(gè)數(shù)據(jù)集復(fù)雜性和實(shí)用性的重要依據(jù)。目前,ApolloScape已經(jīng)開放了14.7萬(wàn)幀的像素級(jí)語(yǔ)義標(biāo)注圖像,包括感知分類和路網(wǎng)數(shù)據(jù)等數(shù)十萬(wàn)幀逐像素語(yǔ)義分割標(biāo)注的高分辨率圖像數(shù)據(jù),以及與其對(duì)應(yīng)的逐像素語(yǔ)義標(biāo)注, 并將進(jìn)一步涵蓋更復(fù)雜的環(huán)境、天氣和交通狀況,添加更多的傳感器來(lái)擴(kuò)充數(shù)據(jù)的多樣性。并且,ApolloScape的標(biāo)注精細(xì)度上超過(guò)同類型的KITTI,Cityscapes數(shù)據(jù)集,也超過(guò)UC Berkley最新發(fā)布的BDD100K。因?yàn)閷?duì)于任何數(shù)據(jù)集,標(biāo)注數(shù)據(jù)量和場(chǎng)景組成,共同決定了數(shù)據(jù)復(fù)雜度和實(shí)際的可用性。
自動(dòng)駕駛公開數(shù)據(jù)集比較(*表示第三方標(biāo)注不計(jì)算在內(nèi))
除了研討會(huì),每屆大會(huì)的挑戰(zhàn)賽也備受關(guān)注,可謂是全球計(jì)算機(jī)視覺研發(fā)人員踴躍參與的極客“世界杯”。在CVPR自動(dòng)駕駛研討會(huì)上,百度和BDD合作發(fā)起了4項(xiàng)任務(wù)挑戰(zhàn)賽,其中,基于ApolloScape數(shù)據(jù)集,在國(guó)外知名機(jī)器學(xué)習(xí)競(jìng)賽平臺(tái)Kaggle上線Video Segmentation Challenge(視頻場(chǎng)景解析挑戰(zhàn)賽),成為本屆CVPR的最受關(guān)注的挑戰(zhàn)賽之一。據(jù)悉,本屆CVPR僅挑選了4個(gè)挑戰(zhàn)賽與Kaggle進(jìn)行合作,ApolloScape的Video Segmentation Challenge便是其中之一,吸引了145只國(guó)內(nèi)外隊(duì)伍參賽。據(jù)悉,挑戰(zhàn)賽獲獎(jiǎng)隊(duì)伍會(huì)在美國(guó)時(shí)間22日的自動(dòng)駕駛研討會(huì)現(xiàn)場(chǎng)進(jìn)行成果分享。
據(jù)悉,ApolloSpace接下來(lái)將為數(shù)據(jù)集拓展更多類型、更多屬性的數(shù)據(jù):通過(guò)添加紅外圖像,幫助自動(dòng)駕駛算法更容易進(jìn)行夜間檢測(cè);提取更稠密的軌跡信息,用于對(duì)駕駛行為進(jìn)行建模;以及通過(guò)眾包模式采集立體視覺的駕駛特殊事件圖像。此外,ApolloScape未來(lái)還將增加美國(guó)的相關(guān)數(shù)據(jù)。
隨著合作伙伴以及開發(fā)者絡(luò)繹不絕地加入,作為世界上唯一的像素級(jí)的、連續(xù)視頻三維數(shù)據(jù)集,ApolloSpace將成規(guī)模地獲取更多數(shù)據(jù)并從中汲取經(jīng)驗(yàn),涵蓋更為豐富、復(fù)雜的全球化場(chǎng)景,支持自動(dòng)駕駛技術(shù)的落地應(yīng)用及產(chǎn)業(yè)發(fā)展。同時(shí),Apollo也正聯(lián)手越來(lái)越多的合作伙伴和開發(fā)者,持續(xù)創(chuàng)新,將自動(dòng)駕駛、智能網(wǎng)聯(lián)技術(shù)滲透、落地至各個(gè)場(chǎng)景之中,掀起汽車產(chǎn)業(yè)的智能化革命。