一、項目編號:()(招標(biāo)文件編號:())
二、項目名稱:海關(guān)查驗異常智能分類二期子模型技術(shù)服務(wù)(二次)
三、中標(biāo)(成交)信息
供應(yīng)商名稱:北京魔帶互聯(lián)科技有限公司
供應(yīng)商地址:北京市豐臺區(qū)廣安路幢-層
中標(biāo)(成交)金額:.(萬元)
四、主要標(biāo)的信息
序號
供應(yīng)商名稱
服務(wù)名稱
服務(wù)范圍
服務(wù)要求
服務(wù)時間
服務(wù)標(biāo)準(zhǔn)
北京魔帶互聯(lián)科技有限公司
海關(guān)查驗異常智能分類二期子模型技術(shù)服務(wù)(二次)
目前,海關(guān)檢查作業(yè)的人工記錄往往是一鍵生成的大段文本,并且每份報關(guān)單的檢查記錄會包含多項檢查內(nèi)容、多條商品項的檢查結(jié)果描述,其中包含的信息量非常龐雜且不規(guī)范。雖然現(xiàn)在已經(jīng)有標(biāo)準(zhǔn)的四級查獲類型分類規(guī)范,但是無法直接與檢查記錄這樣的非結(jié)構(gòu)化文本數(shù)據(jù)建立對應(yīng)關(guān)系,考慮到海關(guān)的海量檢查查獲數(shù)據(jù),僅通過人工查看并分類的方式難以實現(xiàn)。 為貫徹落實智慧海關(guān)建設(shè)要求,在大數(shù)據(jù)智能布控模型體系下,風(fēng)控司針對進(jìn)口檢查異常報關(guān)單開發(fā)了一期分類模型,該模型三級分類準(zhǔn)確率大概為%-%,四級分類缺失的比較嚴(yán)重,分類水平與專家還存在差距,還有較大提升空間。因此,為進(jìn)一步提升模型在異常報關(guān)單的自動分類準(zhǔn)確率,需小步快跑加快新模型建設(shè),盡早完成自動分類模型輔助。
通過對歷史進(jìn)出口異常報關(guān)單數(shù)據(jù)的總結(jié)分析,結(jié)合人工經(jīng)驗和模型等有監(jiān)督機(jī)器學(xué)習(xí)算法與無監(jiān)督機(jī)器學(xué)習(xí)算法,圍繞異常報關(guān)單的自動查獲類型分類進(jìn)行數(shù)據(jù)挖掘和建模,整體架構(gòu)包括訓(xùn)練和預(yù)測兩個部分。 訓(xùn)練部分,主要針對歷史數(shù)據(jù)進(jìn)行訓(xùn)練。查獲類型為最新定義的四級分類,其中三級分類個。通過對海量的歷史數(shù)據(jù)進(jìn)行特征工程,發(fā)現(xiàn)規(guī)律,提取語義特征。在此基礎(chǔ)上基于業(yè)務(wù)人工標(biāo)記的樣本建立多分類算法模型并進(jìn)行訓(xùn)練,實現(xiàn)機(jī)器對異常報關(guān)單查獲類別的自動分類。模型的分類結(jié)果,結(jié)合實驗系統(tǒng)等進(jìn)行報關(guān)單號匹配,以及查獲結(jié)果的文字相似性匹配,用外部系統(tǒng)的準(zhǔn)確結(jié)果對模型進(jìn)行校對修正。另外通過每日的數(shù)據(jù)更新,以及樣本量的增長,結(jié)合人工反饋,持續(xù)對模型進(jìn)行修正。 預(yù)測部分,包括數(shù)據(jù)處理與模型計算兩個模塊。以+的處理方....
快捷閱讀