伪标签:教你玩转无标签数据的半监督学习方法
对于机器学习项目而言,数据是根本,但是往往我们拿到的是无标签数据,对于这些数据,我们该如何更好的利用它们呢?在本文中,作者提出了一个名为伪标签的半监督学习方法,通过这个方法,我们就可以使用无标签数据来提高机器学习模型的性能,也会让你在更多像Kaggle一样的比赛中受益。
基于DNN+GBDT的Query类目预测融合模型
用户搜索意图的理解在搜索排序体系下有着重要的作用。在搜索引擎中,分析用户的搜索Query和哪些文档类目的意图更相关,被称为Query的类目预测。本文通过集合Query的语义和行为等特征,计算得到与Query最相关的类目,并在线上得到了相关性的体验的提升。
用51单片机做一个物联网温度计+远程开关
纵览整个物联网开发的架构,可以发现这个是团队协作的事情。
做事情一定要抱团,物联网项目开发也不例外。底层硬件和单片机程序的维护需要一位工程师,服务器端的逻辑代码需要至少一位工程师,数据可视化和数据加工以及UI界面的设计需要至少一名工程师。
机器学习-异常检测算法(二):Local Outlier Factor
Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et.al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。