0关注
0粉丝
暂时未有相关云产品技术能力~
暂无个人介绍
文本点击率预估挑战赛-冠亚季军方案总结(上)
NLP比赛-小布助手对话短文本语义匹配
比赛-以企业为服务目标的政策大数据应用
神策杯 2018高校算法大师赛(个人、top2、top6)方案总结(下)
神策杯 2018高校算法大师赛(个人、top2、top6)方案总结(上)
Kaggle Jigsaw文本分类比赛方案总结
利用AI的力量将新闻内容转化为解释性的分析报告。Event Registry是世界领先的新闻情报平台,使组织能够跟踪世界事件并分析其影响。
【CheatSheets】AI速查表集合 一图胜千言
中移集成-首届OneCity编程大赛复盘
教程:如何直接从可视化CNN layers中的特征
【DataFountain-CV训练赛】
PCA综合指南
基于LSTM的美国大选的新闻真假分类【NLP 新年开胃菜】
比赛背景 Background
如何对集成树进行解释?(下)
如何对集成树进行解释?(中)
如何对集成树进行解释?(上)
DataFountain训练赛汇总,成长在于不断学习(下)
DataFountain训练赛汇总,成长在于不断学习(中)
DataFountain训练赛汇总,成长在于不断学习(上)
【sklearn】KFold、StratifiedKFold、GroupKFold的区别
Booking.com机器学习比赛
NLP数据集列表
文本分类资料综述总结
【转】XGBoost和LGB参数对比
新网银行金融科技挑战赛 AI算法赛道 亚军方案
老子研究文献知识发现数据竞赛
在ML中,有3种机器学习方法-监督学习、无监督学习和强化学习技术。 我们所知道的监督学习是指数据带有标签的情况, 无监督学习是仅存在数据而没有标签的情况,强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步“强化”这种策略,以期继续取得较好的结果。
CCF复赛 docker踩坑记 为明年踩坑做准备
转 Target Encoding之Smoothing
Keras-TextClassification 文本分类工具包
【干货】pandas相关工具包
表格数据深度学习框架-DeepTables
现实生活或者比赛中,我们会经常见到表格数据,其中包含了各种类别特征。 本文将简单介绍利用神经网络来表示类别特征的方法-Entity Embedding,这个方法首先出现在kaggle上的《Rossmann Store Sales》中的rank 3的解决方案,作者在比赛完后为此方法整理一篇论文放在了arXiv,文章名:《Entity Embeddings of Categorical Variables》。
[转]NLP关键词提取方法总结及实现
山东省第二届数据应用创新创业大赛-算法赛(下)
山东省第二届数据应用创新创业大赛-算法赛(上)
Single-Pass算法又称单通道法或单遍法,是流式数据聚类的经典方法。对于依次到达的数据流,该方法按输入顺序每次处理一个数据,依据当前数据与已有类的匹配度大小,将该数据判为已有类或者创建一个新的数据类,实现流式数据的增量和动态聚类,适合对流数据进行挖掘,而且算法的时间效率高;不足之处主要表现在该方法具有输入次序依赖特性,即对于同一聚类对象按不同的次序输入,会出现不同的聚类结果。
中文分词工具 MiNLP-Tokenizer
新上线比赛,赶快上车~
Kaggle新赛一览
零基础入门NLP - 新闻文本分类 方案整理
贷款违约预测-Task5 模型融合
LTP 4来了!
贷款违约预测-Task3 特征工程(下)
贷款违约预测-Task3 特征工程(中)
贷款违约预测-Task3 特征工程(上)
贷款违约预测-Task2 数据分析(下)
贷款违约预测-Task2 数据分析(中)
贷款违约预测-Task2 数据分析(上)