注:SAP Classification為SAP產品中的一個分類系統,它支持以有序的結構將特定對象(例如,文章和站點)組合在一起。它的基本功能是為各種不同類型對象的所有屬性特征提供存儲庫。然后將相似特征的對象分組到類中(“分類”對象),以便系統可以更容易地在事務中找到它們。
那數據標簽到底是什么?它與數據分類體系相比,是“真的香”,還是“弱爆了”?
01. 概念的澄清
無(wu)論是在數據中(zhong)臺,還是傳統產品設計中(zhong),繞不開的幾個概念:分類、屬性、標簽(qian)。
1、什么是分類
分類,就是指按照種類、等級、性質或特征的歸類。也就是把相(xiang)同屬性或特征的(de)“對(dui)(dui)象(xiang)(xiang)”歸集在一(yi)起,形成(cheng)不同的(de)類(lei)別(bie),方(fang)便人們(men)通過類(lei)別(bie)來對(dui)(dui)“對(dui)(dui)象(xiang)(xiang)”進行的(de)查(cha)詢、識別(bie)、管理(li)和使(shi)用。“對(dui)(dui)象(xiang)(xiang)”可以是人、產品、物料或其他實體,例如:人可以分(fen)為男人、女人,也可以分(fen)為老年(nian)人、中年(nian)人、青少(shao)年(nian)。
2、什么是屬性
屬性是事物所具有的性質或特征,重點強調的是事物本身,例(li)如(ru):人(ren)(ren)的(de)性別、身高、胖(pang)瘦、年(nian)齡、性格等都是人(ren)(ren)的(de)屬(shu)(shu)性。可以將(jiang)某個(ge)事(shi)物(wu)的(de)屬(shu)(shu)性抽象出來(lai)作為事(shi)物(wu)的(de)分(fen)類(lei)(lei)(lei)(lei),如(ru)我們(men)上邊舉的(de)例(li)子,男人(ren)(ren)、女人(ren)(ren)是按(an)照性別屬(shu)(shu)性對人(ren)(ren)的(de)分(fen)類(lei)(lei)(lei)(lei);老年(nian)人(ren)(ren)、中年(nian)人(ren)(ren)、青少(shao)年(nian)是按(an)照年(nian)齡屬(shu)(shu)性對人(ren)(ren)的(de)分(fen)類(lei)(lei)(lei)(lei)。事(shi)物(wu)可以按(an)照屬(shu)(shu)性來(lai)分(fen)類(lei)(lei)(lei)(lei),分(fen)類(lei)(lei)(lei)(lei)也是事(shi)物(wu)的(de)屬(shu)(shu)性之一。
3、什么是標簽
標簽,原意是標明物品的品名、重量、體積、用途等信息的簡要標牌,例如:商品標簽、圖書標簽、車檢標簽、文件標簽、服裝吊牌等。從這個概念衍生到網絡標簽,是人工或系統自動或用戶自發的,通過相關性很強的關鍵字對事物或內容進行描述,幫助人們分類內容,以便于檢索和分享。例如:我們也可以給“人”這個對象打上男人或女人,老人或青年的標簽。可見,標簽也有維度或分類,而屬性也是一種標簽。
02. 分類VS標簽,到底有啥區別?
前邊(bian)的(de)例子中,男人(ren)、女(nv)人(ren),老人(ren)、青年,這既可以是對人(ren)的(de)分(fen)(fen)(fen)類(lei)(lei),也可以是人(ren)的(de)標(biao)簽(qian)。分(fen)(fen)(fen)類(lei)(lei)和標(biao)簽(qian)有時候沒有明確的(de)分(fen)(fen)(fen)界線,分(fen)(fen)(fen)類(lei)(lei)可以作為(wei)一(yi)個(ge)標(biao)簽(qian),標(biao)簽(qian)也可以抽象出(chu)分(fen)(fen)(fen)類(lei)(lei)。那么,分(fen)(fen)(fen)類(lei)(lei)和標(biao)簽(qian)到底有什么不同?
關于(yu)這個問題,知乎(hu)上網友的(de)一個回答挺有意思的(de):
分類由于只能隸屬于一個,所以往往帶有武斷和不恰當的色彩,它是一個“is a”的問題,屬于本質論的范疇,而對事物的“本質”的認定,嚴格來說,這事只有上帝才能做,換句話說,誰做都不合適。標簽則不同,它是一個“has a”的問題,說某(mou)個東西有某(mou)種屬(shu)性,要求就沒那么嚴格(ge)了。
筆者理解:分類是一種嚴謹的數據組織方式,一般按照一個或多個維度自上而下、從整體到明細的窮舉,遵循“相互獨立,完全窮舉”的原則。而標簽是一種靈活的數據組織方式,放棄大而全的框架,基于業務場景自下而上地倒推標簽需求。
除此(ci)之(zhi)外,分類和標簽還存在如下(xia)不同點(dian):
1、分類一般是面向團隊或組織的,注重標準化;而標簽可以面向組織,也可以是面向個人,注重的是個性化。
2、分類具有排他性,分類之間是獨立的、不能交叉;而標簽允許交叉,標簽之間可以相互關聯、相互依賴。
3、分類體系需要事先規劃,在標準化的框架下進行使用;而標簽可以靜態的,也可以是動態的,允許隨時添加。
4、分類注重結構化,具有層級控制,是一個樹狀結構;而標簽的結構是松散、靈活、開放的,整體看是一個網狀結構。
03. 分類VS標簽,哪個“香”?
在數字化應(ying)用中(zhong),分(fen)(fen)類和(he)標簽其(qi)實根本無法分(fen)(fen)出個(ge)伯仲(zhong)。標簽體(ti)系也需(xu)要一定的分(fen)(fen)類,而基于某個(ge)維度的分(fen)(fen)類也可(ke)以作為一種標簽,只是他們支持的應(ying)用場景或有不同(tong)。
分(fen)類一直(zhi)存在(zai),它源(yuan)于人的(de)認知,可以(yi)追(zhui)溯到(dao)人類的(de)起源(yuan)。
在幾百萬(wan)年前的原(yuan)始部(bu)落,人(ren)們將打回來(lai)的獵物、采集回來(lai)的種(zhong)子進行分(fen)(fen)類存(cun)放,以(yi)便(bian)存(cun)儲和管(guan)理(li)。分(fen)(fen)類的作(zuo)用自然不必多說,它可以(yi)讓(rang)我們條理(li)清(qing)晰(xi),層次清(qing)晰(xi),一目了然的識別和管(guan)理(li)事物。
即使在當今由互聯網、計算機構成的數字化世界中,分類體系也一直是我們組織數據、處理數據、查詢數據、管理數據的一個重要的手段。
在傳統企業的信息化建設中,使用更多的是分類,例如:ERP中的物料分類、人員分類、客商分類等。一套科學、嚴謹的分類體系是企業的“人、財、物、進、銷、存”等業務流程有效管理的基礎,在企業管理中發揮著重要的作用。一家企(qi)業的(de)“物(wu)料分類(lei)”科不(bu)(bu)科學、規(gui)不(bu)(bu)規(gui)范(fan),在很(hen)大(da)程(cheng)度上能(neng)夠反映這(zhe)家企(qi)業的(de)管理(li)的(de)規(gui)范(fan)性(xing)情況和精細化程(cheng)度。上文我們提到(dao)的(de)SAP Classification就是這(zhe)樣一個可以根據(ju)事物(wu)屬性(xing)特征進(jin)行多維(wei)分類(lei)體系的(de)系統。不(bu)(bu)僅SAP,像Oracle、用友、金蝶等ERP大(da)廠,同樣也有類(lei)似的(de)多維(wei)數據(ju)分類(lei)體系。
標簽(網絡標簽)是隨著互聯網發展產生的,最早用在博客、文章的內容分類中,方便用戶管理和聚合內容。隨著大數據的發展,標簽體系的作用也越來越大,被互聯網企業廣泛使用,通過特征集合并關聯打標簽的對象,對分析對象生成畫像,挖掘對象的價值。例如:各大(da)互聯網APP(淘(tao)寶、今(jin)日頭(tou)條、抖音等(deng))都有一個基于標(biao)簽體系的推(tui)薦(jian)引擎模塊,通過用(yong)戶(hu)(hu)(hu)靜態屬性和行為屬性給(gei)用(yong)戶(hu)(hu)(hu)打(da)標(biao)簽,形成360度用(yong)戶(hu)(hu)(hu)畫(hua)像,然后(hou)根據用(yong)戶(hu)(hu)(hu)的偏好將(jiang)信息或(huo)產品推(tui)送給(gei)用(yong)戶(hu)(hu)(hu)。
因此,分類VS標簽,根本無法(fa)區別那個(ge)(ge)更“強”或(huo)哪個(ge)(ge)更“弱”,根據(ju)不同的(de)應用場景選擇不同的(de)體系就好了(le)。
在企(qi)業的數(shu)字化建設中,需要分類和標簽結(jie)合使(shi)用,才能最大(da)化發揮數(shu)據效能、挖掘數(shu)據價值(zhi)。
04. 數據中臺為什么需要標簽體系
上文中我們說過,傳(chuan)統企業的(de)信息化(hua)使用更多的(de)是分類體系(xi),而標簽體系(xi)是互(hu)聯(lian)網(wang)企業的(de)“致勝(sheng)法寶”。
隨著數字化時代的到來,掀起了傳統企業數字化轉型的浪潮。從技術側來看,轉型就是擁抱互聯網,戰略性的使用數據和IT。在這場數字化的變革中,數據中臺被認為是賦能企業數字化轉型,實現降本增效的新引擎。
數據中臺的概念:數據中臺是數據+技術+產品+組織的有機組合,是快、準、全、統、通的智能大數據體系。與數據(ju)倉庫等傳統數據(ju)工具(ju)相比(bi),數據(ju)中(zhong)臺是一種新(xin)的(de)理念,以“技術+業務”為(wei)雙驅動(dong),是企業開展(zhan)新(xin)型(xing)運營(ying)的(de)一個中(zhong)樞(shu)系統。
因此,如果你將數據中臺定位成一個存數據、管數據的技術平臺,那或許有“分類體系”就可以了。如果你的數據中臺定位的是企業數字化轉型的運營中樞系統,要實現對前端業務的支持和賦能,那“標簽體系”就是數據中臺一個標配。原(yuan)因前邊介紹過,分(fen)類是自上(shang)而下的規劃,側重標準化,標簽(qian)是自下而上(shang)的倒推,注(zhu)重業務場景。
“數字轉型,場景為王”,在“技術+業務”雙驅模式的數據中臺中,標簽體系、數據萃取將助力企業運營轉型升級。
05. 數據中臺生產數據標簽的四個步驟
在經歷(li)過“追捧”和“質疑”等(deng)種(zhong)種(zhong)考驗后,數據中臺在基于業務驅動的(de)標(biao)簽體系助力下,正在用(yong)事實驗證其(qi)價(jia)值。
下面(mian)我們簡單介紹下數(shu)據中(zhong)臺如何通過加(jia)工和生產數(shu)據標簽,從而助力企業(ye)實現數(shu)字化轉(zhuan)型(xing)的,這個過程(cheng)大致可分為四個步驟(zou):
第(di)一,需(xu)要從業務視(shi)角對企業數(shu)據(ju)進行梳理,并將各業務域(yu)、各渠道、各類型的數(shu)據(ju)進行采集和匯聚。
第二,通過對數據進行分類處理,從中提煉出可復用的行為元素(業務線、實體對象、實體屬性、動作等),通(tong)過沉淀行為元素(su),可以更好地(di)規范來源(yuan)數據。這里業(ye)務線(xian)是在不同業(ye)務運(yun)(yun)營(ying)線(xian),例如(ru)(ru)(ru):某造紙(zhi)(zhi)公司有生活(huo)紙(zhi)(zhi)運(yun)(yun)營(ying)線(xian),文化(hua)紙(zhi)(zhi)運(yun)(yun)營(ying)線(xian)、工業(ye)紙(zhi)(zhi)運(yun)(yun)營(ying)線(xian)、特種紙(zhi)(zhi)運(yun)(yun)營(ying)線(xian)等。實(shi)體(ti)對象是指(zhi)操(cao)作(zuo)(zuo)和被操(cao)作(zuo)(zuo)的各(ge)商(shang)業(ye)主(zhu)體(ti),例如(ru)(ru)(ru):用戶、產品等。實(shi)體(ti)屬(shu)性(xing)是指(zhi)實(shi)體(ti)對象的屬(shu)性(xing)特征(zheng)信息,例如(ru)(ru)(ru):用戶的年齡、性(xing)別(bie)、喜好等。動作(zuo)(zuo)就是主(zhu)體(ti)發出的操(cao)作(zuo)(zuo),例如(ru)(ru)(ru):詢價、購買(mai)、瀏覽等。
第三,根據對象的行為元素給對象打上相應的“標簽”,以支持信息查詢、信息推送等應用。與傳統(tong)博客、CMS(文章管理系統(tong))的(de)(de)手動給內容打(da)(da)標(biao)簽(qian)(qian)不(bu)(bu)同(tong)(tong),數(shu)據中臺是根據對象的(de)(de)行為(wei)(wei)規則自動給對象打(da)(da)標(biao)簽(qian)(qian),并且可以(yi)設置行為(wei)(wei)數(shu)據的(de)(de)時間衰減算法,為(wei)(wei)不(bu)(bu)同(tong)(tong)標(biao)簽(qian)(qian)分配不(bu)(bu)同(tong)(tong)的(de)(de)權(quan)重(zhong),形成全面的(de)(de)“用(yong)戶畫像”,做到“比(bi)用(yong)戶自己還了(le)解他(ta)自己”。
第四(si),各相關(guan)應用直(zhi)接調用數據中臺的(de)標簽體系、畫像服(fu)務(wu),支持(chi)企業的(de)精準營銷(xiao)、個性推薦、渠道優化、產品創(chuang)新等應用場景。
其中,執行第二、第三個步驟的前提就是要做好標簽類目體系的規劃。也就是說,標簽體系也是具有一定的分類結構的。例如:用戶標(biao)簽(qian)(qian)(qian)(qian)可以(yi)按照(zhao)標(biao)簽(qian)(qian)(qian)(qian)的控制深(shen)度劃分為(wei)基本屬性(xing)標(biao)簽(qian)(qian)(qian)(qian)、行(xing)為(wei)屬性(xing)標(biao)簽(qian)(qian)(qian)(qian)、商業屬性(xing)標(biao)簽(qian)(qian)(qian)(qian)等(deng);也可以(yi)按照(zhao)數據中臺的數據分層結(jie)構,分為(wei)事(shi)實(shi)標(biao)簽(qian)(qian)(qian)(qian)、模(mo)型(xing)標(biao)簽(qian)(qian)(qian)(qian)、預測標(biao)簽(qian)(qian)(qian)(qian)等(deng)。
寫在最后的話
分類(lei)體(ti)系(xi)(xi)和(he)標簽體(ti)系(xi)(xi)雖各有各的(de)適(shi)用場景(jing)和(he)側重,但它們都是企(qi)(qi)業(ye)數據中(zhong)臺(tai)理念落(luo)地的(de)關鍵(jian)要素,幫助企(qi)(qi)業(ye)沉淀(dian)數據資產(chan)化,優化數據服務,助力企(qi)(qi)業(ye)落(luo)地數字(zi)化轉型(xing)。分類(lei)體(ti)系(xi)(xi)能夠(gou)幫助企(qi)(qi)業(ye)科學、有效的(de)組織數據,規(gui)劃標簽類(lei)目;標簽體(ti)系(xi)(xi)能夠(gou)萃取和(he)精煉數據服務,并對數據分類(lei)進(jin)行(xing)反向優化。在(zai)企(qi)(qi)業(ye)數據的(de)管理和(he)應用中(zhong),它們相互(hu)配合、互(hu)為支撐(cheng),不僅能夠(gou)讓企(qi)(qi)業(ye)有數可(ke)(ke)查,有數可(ke)(ke)用,而且(qie)能夠(gou)讓企(qi)(qi)業(ye)的(de)數據用的(de)更好。
免責聲明:本(ben)網(wang)(wang)站(zhan)所(suo)發(fa)布的(de)文(wen)章為本(ben)網(wang)(wang)站(zhan)原創(chuang),或(huo)者是在(zai)網(wang)(wang)絡搜索到(dao)的(de)優秀(xiu)文(wen)章進(jin)行的(de)編輯整理,文(wen)章版權(quan)歸原作(zuo)者所(suo)有,僅供讀者朋(peng)友們(men)學習、參考(kao)。對于分享的(de)非原創(chuang)文(wen)章,有些因為無法找到(dao)真正來(lai)源(yuan),如(ru)果(guo)標錯來(lai)源(yuan)或(huo)者對于文(wen)章中所(suo)使用(yong)的(de)圖片、鏈接(jie)等所(suo)包含但不限(xian)于軟件、資料等,如(ru)有侵權(quan),請(qing)直(zhi)接(jie)致電聯系,說明具體的(de)文(wen)章,后臺(tai)會盡快(kuai)刪除。給您帶(dai)來(lai)的(de)不便,深表(biao)歉意(yi)。