今天跟大家分享一下淘寶的分詞算法,分詞我想大家都不陌生,當(dāng)然我們講的是淘寶的分詞技術(shù),我們知道淘寶中的每一個(gè)寶貝都有一個(gè)標(biāo)題,而標(biāo)題是由很多的詞或者說(shuō)字組成的,那么對(duì)于這些詞和字我們?nèi)绾蔚弥詫毷侨绾尾鸱趾妥R(shí)別的呢?今天我們跟大家簡(jiǎn)單談?wù)勌詫毜南到y(tǒng)是如何拆分關(guān)鍵詞的。
-------------------------------華麗的分割----------------------------------------------------
分詞;
我們先拿出一個(gè)標(biāo)題這里我準(zhǔn)備了一個(gè):
2013秋冬pu短裙女包臀裙子水洗pu皮裙A字裙顯瘦修身前開(kāi)叉半身裙
我們先不說(shuō)這個(gè)標(biāo)題的好壞,我們來(lái)看下淘寶是如何去拆分這個(gè)標(biāo)題的,上圖:

OK,這張圖是淘寶的系統(tǒng)給標(biāo)題進(jìn)行了拆分的結(jié)果:
原標(biāo)題:2013秋冬pu短裙女包臀裙子水洗pu皮裙A字裙顯瘦修身前開(kāi)叉半身裙
拆分后:2013/秋冬/pu/短裙/女包/臀/裙子/水洗/pu/皮裙/A/字/裙/顯瘦/修身/前/開(kāi)叉/半身/裙
細(xì)心的淘友們發(fā)現(xiàn)了淘寶在拆分的時(shí)候出現(xiàn)了一個(gè)詞“女包”,很是納悶,我們一眼就知道這款寶貝我們賣(mài)的裙子怎么變成女包了額,所以我們從淘寶的拆詞系統(tǒng)中我們可以知道標(biāo)題的關(guān)鍵詞的組合是很重要的,而且淘寶的拆詞算法是機(jī)器去做的,而并非是人工去拆分的,
所以在寫(xiě)標(biāo)題的時(shí)候就一定要注意下這些細(xì)小的組成部分。不然的話就出現(xiàn)了誤識(shí)別導(dǎo)致寶貝失去了原有的流量基礎(chǔ)。
那么針對(duì)這類(lèi)問(wèn)題如何進(jìn)行修改呢?
修改后:2013秋冬pu短裙包臀裙子水洗pu皮裙A字裙顯瘦修身前開(kāi)叉半身裙
我們來(lái)看下淘寶是如何拆分的?

很顯然已經(jīng)非常正確的識(shí)別出來(lái)了,這里有的人就會(huì)很好奇的問(wèn)::淘寶的拆詞是如何進(jìn)行的,因?yàn)槲覀兡軌蚩吹降膫€(gè)體也就是我展示的圖片是淘寶拆分后的一個(gè)結(jié)果圖,那么如果我們知道了淘寶拆詞的步驟和方法是不是說(shuō)我們就很有效的讓淘寶更好的識(shí)別我們的關(guān)鍵詞呢,也就可以知道我們標(biāo)題的權(quán)重指標(biāo)是不是這樣的呢?
好,不說(shuō)廢話,上標(biāo)題:
迎/51/特價(jià)/鏡面/全棉/平頂/帽子/男女/帽子/遮陽(yáng)/軍帽/男女/帽子/男/帽子
這是一款帽子的標(biāo)題,標(biāo)題的拆分結(jié)果我們已經(jīng)用“/”表示出來(lái),好,我們來(lái)看下淘寶的一個(gè)識(shí)別情況:
通過(guò)數(shù)據(jù)采集采樣,我做了一個(gè)識(shí)別的結(jié)果(這個(gè)是我個(gè)人收集整理的,大家僅供參考):

我們看A類(lèi):是標(biāo)題拆分后的一個(gè)結(jié)果,B類(lèi)是詞性,C類(lèi)是最優(yōu)類(lèi)目,D類(lèi)是該寶貝的最優(yōu)類(lèi)目的包含情況,以上數(shù)據(jù)采集來(lái)自數(shù)據(jù)魔方。
好了,我們簡(jiǎn)單看到的一個(gè)結(jié)果是“鏡面這個(gè)詞”是不包含所在的類(lèi)目的,從利潤(rùn)上來(lái)說(shuō)單詞的索引是可以識(shí)別的,但是我們標(biāo)出了紅色,表示不可用。好了我們先分析結(jié)果數(shù)據(jù)再來(lái)看這個(gè)推理,

OK,這是我們看到這款產(chǎn)品可以被識(shí)別的一些關(guān)鍵詞從上到下是單詞和組合詞,我們簡(jiǎn)單來(lái)看下這兩個(gè)小的概念,
單詞:就是指拆分的最小單位
組合詞:由最小單位兩個(gè)及以上的組合形式
這里有人會(huì)問(wèn)為什么很多的組合詞沒(méi)有出現(xiàn),沒(méi)有出現(xiàn)不代表沒(méi)有,由于權(quán)重和人氣不同識(shí)別的也是不同的,我們自己采集的時(shí)候就這么多了,所以大家將就看下,最重要的是了解其中的含義。
OK,我們標(biāo)紅的詞我們看下上上面的那張表格,發(fā)現(xiàn)了木有,都是神馬詞?沒(méi)錯(cuò)都是名詞,對(duì)于這兩個(gè)名詞我們?cè)賮?lái)看下,“帽子”是類(lèi)目詞,“軍帽”是名詞但不是類(lèi)目詞。OK,這里我們就知道了淘寶第一識(shí)別的是什么,沒(méi)錯(cuò)就是名詞且是類(lèi)目詞優(yōu)先識(shí)別,是不是有點(diǎn)像我們買(mǎi)家買(mǎi)東西一樣,進(jìn)入類(lèi)目先點(diǎn)擊一些關(guān)鍵詞再輸入一些關(guān)鍵詞,模式是相通的哦!
好了,我們把剛剛標(biāo)題去重一下:
特價(jià)/全棉/平頂/男女/遮陽(yáng)/軍帽/男/帽子
為什么很多關(guān)鍵詞都木有了呢?包括鏡面這個(gè)詞,OK
其實(shí)呢去重也是淘寶的一個(gè)關(guān)鍵的步驟,所以做標(biāo)題的時(shí)候注意了哦,親
OK,我們來(lái)觀察下這組詞:
軍帽 男
帽子 男
特價(jià) 男
平頂帽子
平頂帽子 男
帽子特價(jià)
帽子 軍帽
男 帽子 遮陽(yáng)
遮陽(yáng) 帽子
遮陽(yáng)軍帽
男女 帽子
全棉 特價(jià)
帽子 全棉
帽子 男特價(jià)
帽子 男 軍帽
是不是又發(fā)現(xiàn)了一個(gè)秘密,什么秘密呢?第一系統(tǒng)很小去打破標(biāo)題的順序,雖然說(shuō)標(biāo)題中的順序不是非常大的影響標(biāo)題的識(shí)別,但是通過(guò)第一個(gè)例子和這里的樣本,我們很顯然知道是有影響的,OK,繼續(xù)我們還可以知道這些組合詞的組成基本上都是由靠近的鄰詞組成的,是不是大家可以自己去看下哦!
-------------------------------------------------華麗的分割-----------------------------------------------
好了,我們來(lái)看下“鏡面”這個(gè)詞的組成,

OK,知道為什么不被單詞識(shí)別了吧?

這個(gè)圖又告訴我們什么呢,一些特殊的詞,單詞是不被索引,但是組合詞是可以被索引的。
在我們平常書(shū)寫(xiě)標(biāo)題的時(shí)候我們是不是也是值得注意的,此類(lèi)詞,本人建議最后不要去書(shū)寫(xiě)在標(biāo)題中,如果一定要書(shū)寫(xiě)就記得合理的利用空格。
OK,我們來(lái)總結(jié)一下:
關(guān)鍵詞的拆分
拆成多個(gè)單詞
關(guān)鍵詞的識(shí)別順序
類(lèi)目詞優(yōu)先,名詞,組合詞
標(biāo)題組合詞的規(guī)律
單詞到多詞組合
最小滑動(dòng)組合
特殊詞如何組合,以免誤識(shí)別
合理利用空格技術(shù)
樂(lè)發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購(gòu)進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購(gòu)信息和超市加盟信息.打造國(guó)內(nèi)超市采購(gòu)商與批發(fā)市場(chǎng)供應(yīng)廠商搭建網(wǎng)上批發(fā)市場(chǎng)平臺(tái),是全國(guó)批發(fā)市場(chǎng)行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺(tái)規(guī)則
本文來(lái)源: 如何利用淘寶分詞來(lái)做好標(biāo)題優(yōu)化