行業(yè)資訊
AI大數(shù)據(jù)背景下,智能家居如何巧用場(chǎng)景化數(shù)據(jù)?
如果把人類探索人工智能的歷程比作是征服汪洋大海的過(guò)程,那算力、算法和數(shù)據(jù)就分別代表著船舶、動(dòng)力和航海圖。算力決定了船舶的種類,比如它是郵輪、艦艇還是航母;算法決定了船舶的航行速度,因?yàn)樗鼪Q定船舶是使用蒸汽、柴油還是核動(dòng)力;數(shù)據(jù)則是一張航海圖,越豐富和精準(zhǔn)的數(shù)據(jù)動(dòng)力,才能越拉近我們和目的地之間的距離。
近幾年,得益于物聯(lián)網(wǎng)、人工智能、5G等新型技術(shù)的飛速發(fā)展,智能家居在短短數(shù)年間就已經(jīng)相繼渡過(guò)了“自動(dòng)化”、單品智能化”、“物聯(lián)網(wǎng)+家居場(chǎng)景”三個(gè)階段,進(jìn)入了當(dāng)前的“人工智能+家居場(chǎng)景”的“智能”階段,開(kāi)啟了智能家居對(duì)人的思維和意識(shí)的學(xué)習(xí)與探索。
在電影《鋼鐵俠》中,托尼·史塔克的人工智能管家賈斯維就幾乎滿足了觀眾們對(duì)“智能家居”的一切美好幻想。然而,當(dāng)“它”真正走進(jìn)現(xiàn)實(shí)時(shí),雖然也在一定程度上便利了我們的生活,但離理想中的“完美”還差有一大段距離。
根據(jù)相關(guān)從業(yè)者的調(diào)查,智能家居技術(shù)人員與市場(chǎng)之間并沒(méi)有形成良好的互動(dòng)關(guān)系,雖然他們開(kāi)發(fā)的產(chǎn)品在技術(shù)上具有先進(jìn)性,但真實(shí)的實(shí)用性差、操作復(fù)雜,與市場(chǎng)需求脫節(jié)的現(xiàn)實(shí)問(wèn)題仍舊普遍存在。據(jù)公開(kāi)數(shù)據(jù)顯示,目前市面上的產(chǎn)品中,因人機(jī)交互體驗(yàn)差造成消費(fèi)者消費(fèi)熱情不高漲的原因占比達(dá)到了12.7%,而造成這些現(xiàn)象的原因正是由于缺乏豐富且精準(zhǔn)的場(chǎng)景數(shù)據(jù)支持。
就像本文開(kāi)篇所說(shuō),我們對(duì)人工智能的探索就是一次征服汪洋大海的過(guò)程。從上世紀(jì)中期人工智能起步,到如今探索人工智能與應(yīng)用場(chǎng)景的深度結(jié)合,在“船舶”和“動(dòng)力”已經(jīng)得到極大保障的前提下,“航海圖”中一旦出現(xiàn)訓(xùn)練數(shù)據(jù)偏差或者缺少數(shù)據(jù)支持,那我們與目的地只會(huì)背道而馳,相距愈遠(yuǎn)。
一、AI數(shù)據(jù)之于智能家居落地,亦如航海圖之于航海
鋼鐵俠之友——賈斯維,或可以看作是人工智能應(yīng)用于智能家居的最高目標(biāo)了,它不僅在日常生活中可以跟史塔克上演拌嘴逗趣的經(jīng)典名場(chǎng)面,也可以跟史塔克進(jìn)行“人機(jī)協(xié)作”,默契的配合工作。
這其中都體現(xiàn)了人工智能技術(shù)在智能家居領(lǐng)域中的本質(zhì),一場(chǎng)AI的交互革命。
而這場(chǎng)革命之中,以語(yǔ)音交互、視覺(jué)交互等交互技術(shù)為主,以自然語(yǔ)言處理、機(jī)器視覺(jué)處理等AI能力為支撐。同時(shí),這也就意味著人工智能對(duì)場(chǎng)景數(shù)據(jù)需求幾乎全面的覆蓋到語(yǔ)音、圖像、文本、視頻等領(lǐng)域。
在AI體系中,算力、算法和數(shù)據(jù)是拉動(dòng)人工智能奔跑的“三駕馬車”,分別承擔(dān)著基礎(chǔ)設(shè)施能力、指導(dǎo)方法和算法依據(jù)的作用。而經(jīng)過(guò)采集和標(biāo)注的精準(zhǔn)數(shù)據(jù)(語(yǔ)音、圖像、文本、視頻等),反哺用于算法的迭代訓(xùn)練當(dāng)中,才能輸出一套完整的人工智能數(shù)據(jù)解決方案。賈宇航將此三者的關(guān)系定義為“相互制約、相互促進(jìn)”。
由此觀之,應(yīng)用于智能家居場(chǎng)景下的AI數(shù)據(jù)自然是反哺出解決方案的“源頭活水”,要想AI技術(shù)在智能家居應(yīng)用中達(dá)到最高目標(biāo),AI數(shù)據(jù)自然不可忽視,而且要包含豐富性與準(zhǔn)確性兩個(gè)標(biāo)準(zhǔn),這也就涉及到人工智能的數(shù)據(jù)采集與數(shù)據(jù)標(biāo)注問(wèn)題。
其實(shí),人工智能玩家對(duì)于AI數(shù)據(jù)的態(tài)度還是比較一致的,包括國(guó)外的谷歌、微軟、亞馬遜,國(guó)內(nèi)的百度、阿里等巨頭,都在AI數(shù)據(jù)上有所建樹(shù)。除此外,云測(cè)數(shù)據(jù)作為國(guó)內(nèi)數(shù)據(jù)采集與標(biāo)注方面的領(lǐng)軍者,被媒體與商湯、曠視、涂鴉、地平線稱之為“人工智能五強(qiáng)”。這也是因?yàn)闃I(yè)界深知高質(zhì)量的數(shù)據(jù)對(duì)AI應(yīng)用的重要性,才將在算法、算力、數(shù)據(jù)不同領(lǐng)域各有建樹(shù)的企業(yè)進(jìn)行“組合”,或者說(shuō)這也是業(yè)界對(duì)人工智能發(fā)展寄托的一個(gè)表達(dá)方式。
從語(yǔ)音識(shí)別角度來(lái)看,比如最近某貓精靈宣布上線了四川話,用戶可以在使用鬧鐘、天氣、你想我猜等日常生活及娛樂(lè)功能時(shí),使用四川方言與其進(jìn)行對(duì)話。
但其實(shí)除了方言之外,性別、年齡、講話人語(yǔ)速、說(shuō)話背景、噪音、情緒、語(yǔ)言種類等等因素,都是構(gòu)成一個(gè)豐富的、真實(shí)的交互樣本的關(guān)鍵。這就需要通過(guò)將一些特定的數(shù)據(jù)交給人工智能去強(qiáng)行總結(jié)一個(gè)特定的規(guī)律,這個(gè)規(guī)律具有一定的適用性,讓真正的用戶在使用過(guò)程中,能夠達(dá)到一個(gè)真實(shí)的應(yīng)用體驗(yàn)。
又或者從語(yǔ)義識(shí)別的角度看,當(dāng)我們需要打開(kāi)空調(diào)時(shí),通過(guò)說(shuō)出一個(gè)命令,機(jī)器或許可以理解并打開(kāi)空調(diào)。但涉及到富有邏輯的深層次含義時(shí),機(jī)器是否能“聽(tīng)懂”?特別在對(duì)應(yīng)的功能越來(lái)越豐富后,會(huì)拆分出越來(lái)越多的子類,比如空調(diào)打開(kāi)之后的溫度調(diào)整、風(fēng)速調(diào)整等等不同的屬性。
因而,智能家居要想真正實(shí)現(xiàn)落地,必須要依靠豐富的、高質(zhì)量的AI數(shù)據(jù),以此來(lái)反哺AI算法,以幫助智能家居行業(yè)企業(yè)在發(fā)掘AI潛力的道路上提升用戶的體驗(yàn),同時(shí)達(dá)到自身的降本增效。就像航海的船舶要到達(dá)目的地,必須要求一張數(shù)據(jù)完整且精準(zhǔn)的航海圖一樣。
二、AI大數(shù)據(jù),助力行業(yè)航向成功的彼岸
目前,AI大數(shù)據(jù)依托場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地兩大實(shí)力支撐,為除了智能家居領(lǐng)域之外的智能駕駛、智慧城市、智慧金融等領(lǐng)域提供高質(zhì)量的場(chǎng)景化AI數(shù)據(jù)服務(wù),全方位支持文本、語(yǔ)音、圖像、視頻等各類型數(shù)據(jù)的處理。
面向智能家居行業(yè),AI數(shù)據(jù)的數(shù)據(jù)采集核心能力包括喚醒詞采集、控制詞采集、指定語(yǔ)料采集、人臉采集、情緒類型采集、中英文、國(guó)內(nèi)各地方言、東南亞及歐洲、非洲小語(yǔ)種等采集類型,支持智能音箱、智能電視、智能掃地機(jī)器人等場(chǎng)景數(shù)據(jù)采集;數(shù)據(jù)標(biāo)注核心能力包括人物語(yǔ)音轉(zhuǎn)寫(xiě)、行為意圖、聲紋識(shí)別、領(lǐng)域識(shí)別、語(yǔ)句泛化、語(yǔ)義分割等標(biāo)注類型,支持智能音箱、智能電視、智能掃地機(jī)器人等場(chǎng)景數(shù)據(jù)標(biāo)注。
賈宇航認(rèn)為AI數(shù)據(jù)在智能家居領(lǐng)域的發(fā)展趨勢(shì)正向多模態(tài)、情感化、細(xì)分領(lǐng)域三大方向發(fā)展,對(duì)此AI大數(shù)據(jù)也建立了自己的服務(wù)體系,以持續(xù)滿足智能家居領(lǐng)域的企業(yè)對(duì)AI數(shù)據(jù)服務(wù)的需求。
首先是專業(yè)化、定制化和場(chǎng)景化。AI數(shù)據(jù)伴隨著AI的發(fā)展已經(jīng)經(jīng)歷了較為混亂的發(fā)展期,并衍生出了不同的業(yè)態(tài)。比如通過(guò)爬蟲(chóng)技術(shù)進(jìn)行數(shù)據(jù)抓取的“史前階段”,又或者在人工智能技術(shù)成長(zhǎng)早期,通用數(shù)據(jù)集也“獨(dú)有一片天下”。而現(xiàn)在,AI數(shù)據(jù)通過(guò)提供場(chǎng)景化的數(shù)據(jù)采集和數(shù)據(jù)標(biāo)注服務(wù),以此為當(dāng)下AI產(chǎn)業(yè)中即將落地的企業(yè)提供服務(wù)。
場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地便是AI數(shù)據(jù)的兩大“法寶”:首先是數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室,為應(yīng)對(duì)智能家居場(chǎng)景中可能出現(xiàn)的一切場(chǎng)景,比如像光線、噪音、背景等環(huán)境條件,以及針對(duì)不同的人種、語(yǔ)言、年齡、性別等因素,AI數(shù)據(jù)可以搭建和模擬針對(duì)不同需求的“真實(shí)場(chǎng)景”,進(jìn)而對(duì)智能家居領(lǐng)域的客戶提供還原場(chǎng)景的數(shù)據(jù)采集;其次是數(shù)據(jù)標(biāo)注基地,通過(guò)對(duì)人工智能訓(xùn)練師進(jìn)行專業(yè)的培訓(xùn),并且配合自有的數(shù)據(jù)平臺(tái),進(jìn)行持續(xù)迭代,確保整個(gè)數(shù)據(jù)精準(zhǔn)的輸出,能為安防、家居、駕駛、金融、互聯(lián)網(wǎng)、零售、教育等領(lǐng)域客戶提供專業(yè)的定制化服務(wù)。
其次是高效率、高精準(zhǔn)、高質(zhì)量。在人工智能領(lǐng)域中有著這樣一句話:garbage in,garbage out。換而言之,數(shù)據(jù)的好壞是可以通過(guò)算法的“錘煉”直接體現(xiàn)在最終的結(jié)果上的。這實(shí)際上也是對(duì)一家AI數(shù)據(jù)服務(wù)商對(duì)數(shù)據(jù)精準(zhǔn)度控制、數(shù)據(jù)流程把控、數(shù)據(jù)質(zhì)量篩查能力的考驗(yàn)。只有高質(zhì)量的AI數(shù)據(jù),才能最大限度的加速人工智能應(yīng)用落地,幫助企業(yè)降本增效,同時(shí)實(shí)現(xiàn)市場(chǎng)良幣驅(qū)逐劣幣。
AI數(shù)據(jù)的人工智能數(shù)據(jù)服務(wù)團(tuán)隊(duì)已經(jīng)形成了一套包含任務(wù)分配、需求分析、需求確認(rèn)、數(shù)據(jù)清洗、試標(biāo)確認(rèn)、進(jìn)度控制、質(zhì)量保障等流程的完整作業(yè)體系。比如云AI數(shù)據(jù)在語(yǔ)音、文本、圖片、視頻等類別標(biāo)注上都設(shè)置了底層規(guī)則,并設(shè)有多次審核機(jī)制,再加上專業(yè)標(biāo)注邏輯、思維和思考能力以及相關(guān)領(lǐng)域知識(shí),從而高效輸出成一套高質(zhì)、精準(zhǔn)的智能家居數(shù)據(jù)解決方案。
最后是重中之重的數(shù)據(jù)隱私安全。AI數(shù)據(jù)對(duì)此有著深刻的認(rèn)識(shí),企業(yè)的數(shù)據(jù)安全是一個(gè)企業(yè)構(gòu)成核心競(jìng)爭(zhēng)壁壘的重要要素之一。
三、智能家居迸發(fā)美麗火花
咨詢公司AT Kearney的一項(xiàng)預(yù)測(cè)顯示,到2022年,亞洲的智能家居市場(chǎng)將增長(zhǎng)到260億美元,到2030年將增長(zhǎng)到1150億美元,占全球市場(chǎng)的30%以上。中國(guó)將成為亞洲增長(zhǎng)的關(guān)鍵。而就智能家居現(xiàn)階段而言,“人工智能+家居場(chǎng)景”的智能化階段將呈現(xiàn)持續(xù)且長(zhǎng)期的發(fā)展后勁。AI數(shù)據(jù)助力下,智能家居行業(yè)必定迎來(lái)強(qiáng)勁的增長(zhǎng),迸發(fā)出絢麗的火花。
希望在已有的領(lǐng)域能夠越走越深,同時(shí)拓展到更多領(lǐng)域,為更多人工智能企業(yè)服務(wù),也希望更多人工智能企業(yè)的產(chǎn)品和項(xiàng)目可以更快落地、讓人們?cè)谌粘I钪腥ナ褂?;真真正正讓用戶感受到理解和溫暖。如果這個(gè)愿景達(dá)到了,提供數(shù)據(jù)標(biāo)注和數(shù)據(jù)采集服務(wù)的我們也就心滿意足了。
注:部分圖片內(nèi)容來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除。
- 返回頂部