大道至簡(jiǎn):極智嘉聯(lián)合馬來西亞大學(xué)、英國Surrey大學(xué)提出全新數(shù)據(jù)哈希檢索算法
大道至簡(jiǎn):極智嘉聯(lián)合馬來西亞大學(xué)、英國Surrey大學(xué)提出全新數(shù)據(jù)哈希檢索算法
近日,人工智能領(lǐng)域全球頂級(jí)旗艦會(huì)議NeurIPS 2021最終接收論文名單重磅公布。極智嘉AI研究院聯(lián)合馬來西亞大學(xué)、英國Surrey大學(xué)的研究成果在人工智能頂級(jí)學(xué)術(shù)會(huì)議NeurIPS 2021上成功發(fā)表,充分印證了極智嘉在AI領(lǐng)域的強(qiáng)勁實(shí)力備受學(xué)術(shù)權(quán)威認(rèn)可!
國際神經(jīng)信息處理系統(tǒng)大會(huì)NeurIPS (Conference and Workshop on Neural Information Processing Systems)是人工智能領(lǐng)域全球頂級(jí)的旗艦會(huì)議,會(huì)議的競(jìng)賽也是全球最高水平的人工智能算法競(jìng)賽。該會(huì)議主要展示機(jī)器學(xué)習(xí)與計(jì)算神經(jīng)科學(xué)領(lǐng)域的最新研究進(jìn)展,其細(xì)分主題包括深度學(xué)習(xí)、計(jì)算機(jī)視覺和優(yōu)化稀疏等眾多理論方向。
作為全球AMR引領(lǐng)者,極智嘉憑借著穩(wěn)定可靠的機(jī)器人及系統(tǒng),結(jié)合優(yōu)秀的軟件和AI算法,持續(xù)領(lǐng)跑行業(yè)智慧物流變革。在每年的“雙11”、6·18及黑色星期五等大促活動(dòng)中,如何在海量庫存列表中快速匹配訂單洪峰的需求是每個(gè)商家都面臨的挑戰(zhàn),因此高效準(zhǔn)確的庫存和訂單存儲(chǔ)、查詢系統(tǒng)必不可缺。
極智嘉AI研究院入選論文《One Loss for All: Deep Hashing with a Single Cosine Similarity based Learning Objective》提出了全新數(shù)據(jù)哈希檢索算法,可以高效保障“雙11”等大促極限場(chǎng)景下的庫存和訂單查詢匹配。除此之外,該算法還可以將海量數(shù)據(jù)進(jìn)行哈?;瘔嚎s,節(jié)約數(shù)據(jù)存儲(chǔ)空間,降低企業(yè)IT運(yùn)維成本。
哈希檢索算法的具體流程如圖1所示。首先,利用骨架網(wǎng)絡(luò)提取數(shù)據(jù)特征,進(jìn)行數(shù)據(jù)維度轉(zhuǎn)換。然后,利用二值正交化標(biāo)簽與特征數(shù)據(jù)進(jìn)行坐標(biāo)變換,使得歐式空間的特征能夠在哈??臻g進(jìn)行比較。最后,利用交叉熵來進(jìn)行數(shù)據(jù)分類處理,完成數(shù)據(jù)哈希化過程。
▲圖1 算法流程及余弦相似度計(jì)算
傳統(tǒng)算法在歐式空間將數(shù)據(jù)變換到哈??臻g,之后進(jìn)行數(shù)據(jù)間的比較或進(jìn)行哈?;?,為此需要使用不同的損失函數(shù)來組合評(píng)價(jià)。與此相比,新算法以余弦相似度為基礎(chǔ)提出一種全新的優(yōu)化方案,僅使用一種損失函數(shù)進(jìn)行評(píng)價(jià),同時(shí)不要求特殊網(wǎng)絡(luò)設(shè)計(jì)與訓(xùn)練技巧,以一種大道至簡(jiǎn)的方式實(shí)現(xiàn)。具體來說,本算法將原始數(shù)據(jù)通過特征變換,重新在單位化的歐氏空間進(jìn)行余弦相似度比較。通過利用余弦相似度打通了哈??臻g與歐氏空間的聯(lián)系。
如下面公式所示,左側(cè)為哈??臻g表示了數(shù)據(jù)點(diǎn)在哈??臻g的相似度,公式右側(cè)為相同數(shù)據(jù)點(diǎn)在單位化后的歐氏空間的余弦相似度。因此,該算法可以直接通過在歐式空間的操作完成數(shù)據(jù)在哈??臻g的轉(zhuǎn)換與比較,清晰的反應(yīng)了數(shù)據(jù)在變換后哈??臻g的情況,并且對(duì)計(jì)算機(jī)在歐式空間的計(jì)算更加有利。因此,極大的優(yōu)化了計(jì)算效力與檢索精度,化繁為簡(jiǎn)。
新算法的分類顯著性可由圖2所示。左側(cè)為直接基于歐式空間的優(yōu)化模型,中間及右側(cè)為論文提出方案??梢钥闯鲈谑褂糜嘞蚁嗨贫仍u(píng)估之后,類比之間的差異被放大,并且在新空間內(nèi)具備方向性。
▲圖2 交叉熵與余弦相似度的特征分離程度比較
哈希檢索算法在ImageNet、COCO、WIDE等公開數(shù)據(jù)集上性能表現(xiàn)大幅提升,其中部分?jǐn)?shù)據(jù)集比之前的算法檢索精度提升20%左右。新算法預(yù)期將大幅提升極智嘉處理海量數(shù)據(jù)及數(shù)據(jù)挖掘的能力,更好的服務(wù)客戶的實(shí)際業(yè)務(wù)運(yùn)轉(zhuǎn)。
▲實(shí)驗(yàn)結(jié)果與對(duì)比
論文鏈接:https://arxiv.org/abs/2109.14449
工程代碼:https://github.com/kamwoh/orthohash
提交
極智嘉 x 柯爾柏: 賦能美國知名鞋服品牌Ariat實(shí)現(xiàn)供應(yīng)鏈數(shù)智化升級(jí)
更強(qiáng)感知和定位能力!極智嘉聯(lián)合卡耐基梅隆大學(xué)提出全新提取對(duì)象描述符算法
極智嘉攜手盈智科技率先落地?zé)o人化港口冷鏈智慧倉
訂單額超20億!極智嘉2021年成績(jī)單出爐!
極智嘉與緯創(chuàng)資通達(dá)成戰(zhàn)略合作,領(lǐng)跑電子制造業(yè)全流程柔性“智”造升級(jí)