济南

点击搜索

发布

关键词聚类杂谈:这些年我做过的关键词聚类!-网络营

区域:
济南 > 市中区 > 七里山
类别:
其他电脑培训
地址:
山东省济南市市中区英雄山路147号 祥泰广场5#1401
 看到知乎有这样的问题,如何做词聚类,恰好我以前做过,但是想想内容太多,还是单独写一篇说一下。
    首先,如果单纯拿出一堆词就让我分类,这个我真做不到,我不知道有没有人能做到,反正我做不到。做关键词分类,对我而言,一定有一些基础信息,基础数据作为背景
    案例1:百度商业词聚类模型
    现在看,大家经常讨论一个话题,百度医疗行业的收入贡献比是多少,其实,我爆个大料给大家,在2005年甚至2006年之前,百度自己都不掌握这类数据。
    当时百度有一个简单的客户分类,是客服提交的,然后我们看了一下消费的行业分布,结果显示超过50%属于其他分类,这个结果基本上就没法看了。
然后我就琢磨,用商业词能不能直接聚类为行业,当时我在产品部门,合作反欺诈点击的工程师是张怀亭(此人似乎现在还在百度),这是个算法高手,他当年的毕业论文就是关联规则和聚类算法,我就去请教他,他说了一堆,我大部分没听懂,但大概要点知道了一些,然后找他要了论文看了看,也没太看明白,凭借自己粗浅的理解我就动手了,然后这个还真做成了。继续查看点击3w点蜘蛛园点com。
查看更多济南电脑/网络信息

免责声明:此信息系发布者(UID:269659)自行发布,本站是服务平台,仅提供信息存储空间服务,该信息内容的真实性及合法性由该发布者完全负责。

© lieju.com 联系我们