上海2021年12月22日 /美通社/ -- 微信公眾號“高工智能汽車”最近對澳鵬Appen進(jìn)行了報(bào)道,下面是報(bào)道原文:
在自動駕駛時代,無論是對于汽車制造商、零部件廠商還是自動駕駛服務(wù)提供商來說,數(shù)據(jù)都相當(dāng)于金錢,身處其中的企業(yè)都非常清楚這個公式。
去年,滴滴出行與比亞迪合作,推出全球首款定制網(wǎng)約車。該公司CEO程維表示,滴滴計(jì)劃于2025年推出D3,普及100萬輛搭載自動駕駛功能網(wǎng)約車;2030年希望去掉駕駛艙,計(jì)劃實(shí)現(xiàn)完全自動駕駛。
今年初,百度和吉利宣布合資成立一家全新的聯(lián)網(wǎng)智能汽車公司,基于后者的開放動力底盤平臺,結(jié)合百度的人工智能、Apollo自動駕駛、小度車載、百度地圖等軟件,目標(biāo)是讓所有人都能使用自動駕駛汽車。
按照這家合資公司(集度汽車)首席執(zhí)行官夏一平的話說,公司打算以合理的成本向千家萬戶提供4級自動駕駛技術(shù),“就像別人希望普及電動汽車一樣,我們也希望普及自動駕駛技術(shù)?!?/p>
而這些企業(yè),不管以何種方式入局“造車”,目的只有一個,希望打造自己的大規(guī)模數(shù)據(jù)訓(xùn)練、功能迭代閉環(huán)。
正如行業(yè)領(lǐng)頭羊特斯拉的玩法一樣,在量產(chǎn)中結(jié)合車端的智能處理能力識別出不智能的場景,將數(shù)據(jù)回傳,以此迭代算法,不斷提高自動駕駛的能力,逐步構(gòu)建自己的車輛規(guī)模和技術(shù)壁壘。
另一方面,對于確保自動駕駛行車安全運(yùn)行方面,高質(zhì)量的訓(xùn)練數(shù)據(jù)極其關(guān)鍵。這就要求行業(yè)加強(qiáng)審核,避免“garbage in, garbage out”的情況發(fā)生。
這就要求,負(fù)責(zé)訓(xùn)練模型的團(tuán)隊(duì)不僅要面對自身專業(yè)度的挑戰(zhàn),而且要面對確保數(shù)據(jù)標(biāo)注過程質(zhì)量的巨大挑戰(zhàn)。
在這方面,澳鵬可以說是當(dāng)之無愧的模范生。
破解市場困局
相關(guān)研究發(fā)現(xiàn),在AI行業(yè)中,有兩個層面符合二八法則。
首先,同一個算法的應(yīng)用中,同樣類型技術(shù)方案的公司差異會很大。其中的關(guān)鍵就在于數(shù)據(jù)量。同一個算法對于最后結(jié)果的影響,80%來源于數(shù)據(jù),20%來源于技術(shù)。
簡單來說,算法模型本身的優(yōu)化對于提升AI應(yīng)用輸出的準(zhǔn)確率十分有限,而不同AI應(yīng)用準(zhǔn)確率的關(guān)鍵差別在于其中是否有大量的、高質(zhì)量的訓(xùn)練數(shù)據(jù)。
其次,很多AI或算法公司在做研發(fā)時,80%的時間或人力需要用于處理數(shù)據(jù),只有20%用于處理算法與代碼。而實(shí)際上,這種做法并不合理。要想精進(jìn)整體系統(tǒng)的魯棒性,工程師應(yīng)該將更多的精力集中于算法或應(yīng)用層面,而針對數(shù)據(jù)層面,則可以讓更專業(yè)的供應(yīng)商幫助他們提升質(zhì)量和效率。
另一方面,目前人工智能研究應(yīng)用的算法,基本基于機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法,實(shí)戰(zhàn)中對訓(xùn)練數(shù)據(jù)的準(zhǔn)確率要求起碼要到達(dá)90%以上,甚至有的項(xiàng)目要求能夠做到99.9%準(zhǔn)確率。而更難的地方在于,這不僅是對某一批數(shù)據(jù)的要求,而是要持續(xù)達(dá)到這個要求。
有行業(yè)人員表示,自動駕駛領(lǐng)域的AI部署需要大量的高質(zhì)量訓(xùn)練數(shù)據(jù),需求增長極快,且需求和場景越來越多樣、難度越來越大。隨業(yè)內(nèi)需求從2D平面圖像轉(zhuǎn)向3D LiDAR數(shù)據(jù)為主,行業(yè)對于標(biāo)注人員專業(yè)度的要求也隨之水漲船高。
而標(biāo)注人員在完成這些數(shù)據(jù)任務(wù)時,可能面臨諸多挑戰(zhàn),其中包括:內(nèi)部標(biāo)注人員不足和引入的偏差問題、時間限制下難以達(dá)到所需的數(shù)量規(guī)模及準(zhǔn)確率。
此外,當(dāng)前數(shù)據(jù)行業(yè)各個服務(wù)商的水平參差不齊,優(yōu)質(zhì)頭部數(shù)據(jù)服務(wù)商的服務(wù)資源稀缺,CR5的集中只有20~30%。業(yè)內(nèi)也普遍缺乏進(jìn)行復(fù)雜標(biāo)注項(xiàng)目所需的專業(yè)工具。這無疑為數(shù)據(jù)質(zhì)量帶來了更多挑戰(zhàn)。
“這也是澳鵬本身創(chuàng)立的初衷?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。
作為澳大利亞的一家上市公司,澳鵬自1996年創(chuàng)建至今,始終專注于人工智能訓(xùn)練數(shù)據(jù)的領(lǐng)域,目前在語音、文字、圖像和視頻等標(biāo)注領(lǐng)域已積累了25+年的經(jīng)驗(yàn)。服務(wù)范圍覆蓋170多個國家,235+種語言。全球正式員工 1100+,擁有100萬+全球眾包資源。截至2020年,公司營收已達(dá)4.1億的美金。
其中國分公司成立于2019年,總部位于上海,在無錫、大連、北京設(shè)有交付中心和分公司,業(yè)務(wù)廣泛覆蓋全中國及亞太地區(qū),擁有1000+名交付人員。目前,澳鵬合作客戶已遍及國內(nèi)領(lǐng)先大型互聯(lián)網(wǎng)公司與高科技企業(yè)。
作為數(shù)據(jù)行業(yè)的優(yōu)質(zhì)典范,澳鵬擁有強(qiáng)大的交付產(chǎn)能及資源管理優(yōu)勢,服務(wù)的客戶和項(xiàng)目數(shù)以百計(jì)。澳鵬無錫、大連交付中心經(jīng)驗(yàn)豐富的交付團(tuán)隊(duì),處理過2D、3DLiDAR等各種數(shù)據(jù)和不同客戶的業(yè)務(wù)需求,汽車2D和3D點(diǎn)云的周交付能力超過百萬幀;卓越運(yùn)營中心的管理模式可保證持續(xù)的高質(zhì)量交付。
在自動駕駛領(lǐng)域,澳鵬高精度高性能的自動駕駛工具套裝也是其為客戶構(gòu)筑海量數(shù)據(jù)資產(chǎn)的利器,這也是澳鵬的核心優(yōu)勢之一。
全面保障數(shù)據(jù)質(zhì)量
為了適應(yīng)高速變化的市場形式,澳鵬構(gòu)建了完整的數(shù)據(jù)質(zhì)量全生命周期管理體系,可以從數(shù)據(jù)的采集、標(biāo)注、模型訓(xùn)練、數(shù)據(jù)可視化、模型的部署及再訓(xùn)練等全過程,實(shí)現(xiàn)實(shí)時自動的模型再訓(xùn)練和改裝。
其自主研發(fā)的人工智能輔助數(shù)據(jù)標(biāo)注平臺可支持像素級語義分割、2D圖像復(fù)合標(biāo)注、3D點(diǎn)云拉框及語義分割等功能。采標(biāo)一體的任務(wù)能夠?qū)崿F(xiàn)采集-質(zhì)檢-標(biāo)注-質(zhì)檢-客戶驗(yàn)收的雙向協(xié)同流程,讓整個數(shù)據(jù)生產(chǎn)線上的各個環(huán)節(jié)實(shí)現(xiàn)無縫銜接。內(nèi)置的多輪質(zhì)檢模塊可以按需配置,滿足不同復(fù)雜度項(xiàng)目的需求。
2D圖像復(fù)合標(biāo)注是全結(jié)構(gòu)化的模型訓(xùn)練利器,支持點(diǎn)、線、框、多邊型融合標(biāo)注(常見工具是單模式的,點(diǎn)、線or折線,多邊形)與連續(xù)幀;另外,此工具還支持像素級語義分割,可將圖片中目標(biāo)對象實(shí)例標(biāo)記出來,并保證像素級的質(zhì)量。其中豐富的可配置選項(xiàng)可靈活進(jìn)行id處理,實(shí)戰(zhàn)中可以做到10分鐘/張圖。
澳鵬Appen中國區(qū)市場拓展高級總監(jiān) 董成介紹,澳鵬利用ML輔助標(biāo)注等技術(shù)手段提高數(shù)據(jù)質(zhì)量,通過預(yù)識別系統(tǒng),讓算法先進(jìn)行預(yù)識別,再根據(jù)結(jié)果進(jìn)行人為調(diào)整,最終在成本控制和質(zhì)量上實(shí)現(xiàn)顯著提升。
比如在3D點(diǎn)云數(shù)據(jù)中,由于車道線本身的多樣性(環(huán)島、交叉線)以及外界光照、車輛遮擋等影響,3D點(diǎn)云數(shù)據(jù)中的車道線標(biāo)注一直是一個困難且耗時的課題。澳鵬3D點(diǎn)云車道線自動識別的研發(fā)是解決這一難題的重大突破。
“我們3D點(diǎn)云拉框可支持自動貼合、連續(xù)幀映射,及3D/2D的融合標(biāo)注,具備目標(biāo)預(yù)識別功能,能靈活配置數(shù)據(jù)有效性驗(yàn)證規(guī)則,可直接在線上讓客戶做最低交付粒度的驗(yàn)收且可無縫打回。實(shí)戰(zhàn)中能夠做到99.9%準(zhǔn)確率, 1秒/幀的極速質(zhì)檢?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。
此外,澳鵬的每個項(xiàng)目中除了配備專職的項(xiàng)目經(jīng)理,還有專門的QA/質(zhì)檢人員,Team Leader、等層層把關(guān)質(zhì)量控制;大多數(shù)項(xiàng)目都采用多輪質(zhì)檢的方案,保障數(shù)據(jù)質(zhì)量無限接近完美。
值得一提的是,澳鵬內(nèi)部對于安全合規(guī)的要求非常高,除了有健全的數(shù)據(jù)安全管理流程外,澳鵬還為了保障數(shù)據(jù)安全專門設(shè)置了DPO(Data Privacy Officer,數(shù)據(jù)合規(guī)官)。
所有的項(xiàng)目在簽單、立項(xiàng)前都需要通過數(shù)據(jù)合規(guī)官的審核、批準(zhǔn),并根據(jù)數(shù)據(jù)合規(guī)的要求在項(xiàng)目執(zhí)行中采取相應(yīng)的數(shù)據(jù)保障措施。
“我們對人工智能模型所使用的數(shù)據(jù)給予最大限度的關(guān)注和保護(hù),致力于為客戶提供最高級別的數(shù)據(jù)安全標(biāo)準(zhǔn),符合全球多項(xiàng)嚴(yán)格的數(shù)據(jù)安全資質(zhì)認(rèn)證。同時,我們的平臺每天都會進(jìn)行漏洞掃描,最大限度的保證客戶數(shù)據(jù)資產(chǎn)安全?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。
平臺中設(shè)有權(quán)限管控、數(shù)據(jù)加密傳輸、PII信息加密存儲等嚴(yán)格的數(shù)據(jù)安全管控策略,交付管理具體包括:平臺進(jìn)行周期性系統(tǒng)漏洞掃描以免受惡意代碼/病毒攻擊; 24x7的全球IT支持團(tuán)隊(duì)和緊急響應(yīng)小組確保對IT事件及時響應(yīng)等等。
目前,澳鵬已在全球獲得ISO 27001安全認(rèn)證,包括位于上海的商務(wù)和研發(fā)總部、以及無錫和大連的數(shù)據(jù)服務(wù)交付中心。全球范圍內(nèi),澳鵬亦通過了GDPR,SOC 2 Type II,HIPAA等全球不同國家和地區(qū)的數(shù)據(jù)安全合規(guī)認(rèn)證。
某位與澳鵬合作的客戶負(fù)責(zé)人表示:“澳鵬與我們團(tuán)隊(duì)的合作非常順利,其平臺有助于我們確保流程根據(jù)項(xiàng)目需求不斷被優(yōu)化。我們也期待這一試點(diǎn)項(xiàng)目能盡快投入生產(chǎn)。”
原文鏈接:https://mp.weixin.qq.com/s/xquKbVJUPUZfHEIZqj3VTA