上海

点击搜索

发布

智能数据算法确实存在匹配关系

区域:
上海 > 黄浦 > 南京东路

  机器学习学术领域每天都有大量的算法被发明出来,然而大部分发明在实践中是没用的。学者坐在自己的办公室里,守着那些有限的公开数据不断调试算法,直到那些小小的可爱的公开数据向炼丹手屈服。有句话说的好,“Notoriously torture the data until it confessed”,不断给数据上刑直到它屈服。许多算法无法应用,主要因为没在真实数据中练兵。真实的数据往往极其复杂,需要简单强壮的算法去征服它们。

  所谓好算法,就是不浪费数据。能大化数据价值的算法,是基于不同数据结构而发挥数据价值的。换句话说,不同的数据结构和不同的算法确实存在匹配关系,没有算法,只有适合的算法。例如,决策树算法效率非常高,也易于解释,但却不适合在高维度数据中做建模。而即使预测能力非常强的GBDT算法,在文本挖掘中也难显示其威力。

  近兴起的深度学习算法,也并不是钥匙。深度学习技术可以让特征工程自动化,于是数据科学家再不用花大量时间去抽取特征。然而,深度学习算法一般都有许许多多参数。于是乎,深度学习算法表示,呵呵,我们不过是把你们用来抽特征的时间,拿来调参数了。
本文来源:http://www.chi***.cn/solutions/data_cloud
查看更多上海其他物品信息

免责声明:此信息系发布者(UID:78774)自行发布,本站是服务平台,仅提供信息存储空间服务,该信息内容的真实性及合法性由该发布者完全负责。

© lieju.com 联系我们