暂时未有相关云产品技术能力~
『为AI硬核资料库(cool)而生!』构建AI解决方案,用知识加速每一次技术成长!网站:https://www.showmeai.tech/ 公众号:ShowMeAI研究中心
本文基于Airbnb在大曼彻斯特地区的房源数据,构建机器学习模型,进行数据分析与挖掘建模,预测民宿房源的价格走势。当然,同样的方法模式也可以应用在国内平台。
亚马逊提出的TabTransformer网络结构,颠覆了NLP/CV,为各种非结构化数据业务带来了巨大突破。当然,TabTransformer也擅于捕捉传统结构化表格数据中不同类型的数据信息,并将其结合以完成预估任务。本文就讲解如何构建TabTransformer并将其应用于结构化数据。
吴恩达与助教在斯坦福开设的深度学习课程,内容覆盖基础知识、各类神经网络、实际应用等排,是很多人的深度学习入门课。
Disco Diffusion 是一款AI数字艺术创作的工具,将给出的 Prompts 文字信息变成图像信息,可以在 Google Drive 直接运行,也可以部署到本地,是 Dall-E2 和 MidJourney 的完美免费替代!
本文讲解 Hugging Face 发布的专注于 diffuser 模型的开源库,仅仅通过几行代码就开始生成自己的艺术作画,并对比相同文本提示下各大厂商业产品生成的结果。
课程结合了最新的研究进展,讲解深度强化学习领域的前沿知识和实践,覆盖了使用深度学习神经网络进行强化学习的各类方法模型。
研究生级课程,围绕无监督学习的场景展开,包括深度生成模型和自监督学习两大主题,涵盖了许多当前的最新研究和模型。
课程以实战为主,讲解了不同场景下应用深度学习解决问题的工具、过程和方法:从问题理解,方法选择、数据管理、选择 GPU 到 Web 部署、监控和再训练。
课程以深度学习的典型方法、模型设计、可视化与模型理解为主题,讲解了自然语言处理、计算机视觉、强化学习等领域的AI模型全域知识。
课程对于graph方向的数据挖掘、机器学习(神经网络)有全面的知识覆盖。如果想学习非结构化的图数据上的各类算法,这是最权威的课程之一。
课程是面向研究生的研究研讨会,围绕多个议题展开理论讲解,并邀请多位著名研究人员和行业从业人员进行特邀讲座,讲解知识图谱在行业的实际应用。
聚焦文本类数据与信息挖掘应用,课程主题内容涉猎非常广,包含算法+应用,对于帮助构建NLP中的全域概念、理解不同应用板块的算法非常有帮助。
课程为强化学习领域提供了坚实的介绍。通过讲座、书面和编码作业的结合,学生将精通强化学习的关键思想和技术。
循序渐进地介绍了计算机方向的大部分基础知识,包括计算设备的工作原理、诸多实用技能(包括网页开发等),适合初学者构建对计算机科学的全面认知。
快速补充线性代数的必选课程!课程用了非常多的例子和图标,来直观地表示向量、矩阵与复杂世界的关系,并将数学转化为解决工程问题的能力。
计算机图形学方向专业课程,围绕图形学垂直领域,全面介绍了计算机图形学基本概念和技术,以及它们与相关领域的一些知识(包括渲染、动画、几何、成像)的交叉关系。
课程以多模态(MMML)为主题,讲解基本概念、多种数据形态联合建模方法,并回顾近期MMML概率模型和计算算法的论文,讨论当前面临的挑战。
数据库进阶课程,讨论了很多数据库方向的新技术,适合有数据库基础又想在该方向有深入研究的同学。
数据库方向的专业课程,详尽介绍了数据库的基本知识、底层原理、效率优化、查询优化、新数据库等,是数据库管理系统设计与实施方向的权威好课。
深度学习入门首选!课程可以帮助学习者掌握知识和技能,并邀请工业界与学术界的深度学习专家为大家提供职业发展建议,提供一条迈向 AI 世界的清晰途径。
SQL与Pandas都可以完成大部分数据分析需求。本文用SQL与Pands逐一实现10类核心数据分析需求,轻松进行对比学习:数据选择、限制、统计计数、排序、新字段生成、数据选择、数据分组、统计均值、方差、极差/范围。
本文将基于保险欺诈场景案例讲解如何进行有效的图挖掘,并将挖掘到的信息提供给AI模型,辅助精准检测和识别商业保险欺诈。
气候是全球性的话题,本文基于owid co2数据集,分析了世界各地的二氧化碳排放量,并将二氧化碳排放的主要国家以及二氧化碳排放来源进行了可视化。
本文使用tf-idf(词频-逆文件频率)、lsi(潜在语义索引)和 doc2vec(文档向量化嵌入)这3种最基础的NLP文档嵌入技术,对文本进行嵌入操作(即构建语义向量)并完成比对检索,构建一个基础版的文本搜索引擎。
真实面试题分享!本文基于餐饮业数据,使用SQL分析挖掘客户的就餐模式、点餐花费和菜品喜好等,以提升餐厅的业务经营水平。
本文讲解音频检索技术及其广泛的应用场景。以『听曲识歌』为例,技术流程为具对已知歌曲抽取特征并构建特征向量库,而对于待检索的歌曲音频,同样做特征抽取后进行比对和快速匹配。
本文通过数据科学和AI的方法,分析挖掘人力资源流失问题,构建基于机器学习的解决方案,并通过对AI模型的反向解释,深入理解导致人员流失的主要因素。
本文从常见的推荐系统方法(基于内容、协同过滤等近邻算法、基于知识等)讲起,一直覆盖到前沿的新式推荐系统,不仅详细讲解原理,还手把手教大家如何用代码实现。
本文介绍AI模型适用于小型本地设备上的方法技术:压缩模型参数量,设计更小的模型结构,知识蒸馏,调整数据格式,数据复用等,并介绍移动小处理设备的类型、适用移动设备的模型框架等。
音乐领域,借助于歌曲相关信息,模型可以根据歌曲的音频和歌词特征,将歌曲精准进行流派分类。本文讲解如何基于机器学习完成对音乐的识别分类。
如何在海量用户中精准预测哪些客户即将流失?本文结合音乐流媒体平台 Sparkify 数据,详细讲解一个客户流失建模预测案例的全流程:探索性数据分析 EDA、数据处理、进一步数据探索、建模优化、结果评估。【代码与数据集亲测可运行】
Pandas 是数据科学领域最受欢迎的 Python 工具库之一,函数与功能极其丰富。本文将数据科学家常用的二三十个功能函数总结为10类,熟练掌握就能轻松解决80%以上的数据处理问题!
本文结合 6000 颗钻石的数据,通过克拉重量、切工、颜色和其他特征等属性来预测钻石价格。这是一个完整的企业级建模案例,包含从探索性数据分析、数据准备、模型选择/训练/调优、模型保存和部署的全流程。案例用到的 PyCaret 和 FastAPI 是非常高效的工具,推荐!【代码与数据集亲测可运行】
单行代码(one-liner)是一种编程技巧,指将大段代码写成非常简短的形式,更加紧凑,也更加高级!本文总结了 Python 中常用的 9 个 one-linear 技巧:单行 if-else 语句、列表推导式、字典推导式、合并词典、删除列表重复元素、单行多变量赋值、列表元素筛选、字典排序(按key/按value)
运动穿戴设备(比如小米手环、华为手表、fitbit、Apple Watch)中记录了大量的运动数据,也记录着佩戴者的身体状况。本文结合 Kaggle fitbit 数据集,分析运动规律和卡路里的消耗情况。【代码与数据集亲测可运行】
二手车交易越发繁荣的当下,如何科学定价时买卖&平台三方都关心的问题。本文结合汽车价格预测数据集,讲解『二手车价格预估模型』构建和部署的全过程:数据分析处理 & 特征工程、机器学习建模、Web应用开发等。【代码与数据集亲测可运行】
为了让计算机理解、处理和表征非结构化数据,我们通常将其转换为密集向量,而海量向量数据的存储、管理和查询并不简单。本文介绍 Milvus 这个开源向量数据库管理平台的优势、架构和使用案例,了解其在简化『机器学习操作(MLOps)』流程中的应用
U-Net是一种卷积网络架构,用于快速、精确地分割生物医学图像。本文讲解使用 U-Net 进行肺部影像分割的案例全过程:工具库&环境准备、数据读取、数据切分、TensorFlow IO准备、U-Net 网络构建、评估准则&损失函数、超参数设置&模型编译、回调函数&模型训练、模型加载&新数据预估。【代码与数据集亲测可运行】
朋友刚刚拿到了 Google 数据分析师的 Offer!跟她详聊了面试的3道SQL题目,把思路和参考答案一并奉上!各位近期在面试的朋友,可以拿来自测一下~【代码与数据集亲测可运行】
机器学习建模过程如何提速?本文提供 Intel 针对 Scikit-Learn 工具库做的加速补丁,是一种硬件层面的解决方案,支持多种算法,并可以将建模时间压缩为常规方式的 1/5
Mito 和 Bamboolib 是 Python 库,可以快速流畅地处理大文件表格,功能性与易用性与 Excel 不相上下,但是可以避免出现 Excel 中的卡顿和崩溃。二者的安装和调用都非常简单,绝对值得一试~【代码与数据集亲测可运行】
通过 Styler API 的设置,Pandas 也能像 Excel 那样进行『条件选择』和 『文本框颜色』设置,一眼获取最关键信息!本文讲解 Pandas 使用单色(或渐变色)高亮显示缺失值、最大值、最小值、范围值等【数据与代码亲测可运行】
AI识万物:从0搭建和部署手语识别系统,检测手语并将翻译!搭建和部署完成后,你可以通过摄像头,轻松测试模型啦~
太难了!xdm!哄女朋友太难了!本文手把手带大家构建一个处理和分类语音检测情绪的系统,完成求生欲max的「语音情感识别任务」
一学就会!小白的终极神经网络搭建实战教程!环境设置、神经网络拆解、深度神经网络、模型搭建、神经网络结构可视化、训练和测试评估、模型可解释性!
全自动化机器学习建模!效果吊打初级炼丹师!本文汇总了常见开源库,PyCaret、H2O AutoML、TPOT、Auto-sklearn、FLAML、EvalML、AutoKeras、Auto-ViML、AutoGluon、MLBox,一起用起来吧!
机器学习建模高级用法!构建企业级AI建模流水线,不同环节有序地构建成工作流(pipeline)。本文以『客户流失』为例,讲解如何构建 SKLearn 流水线。
股市预测,销量预测,病毒传播...使用 Merlion 时间序列建模搞定全部!本文详解全部流程:加载和转换数据、建立和训练模型、模型结果后处理、评估模型性能。
2022了你还不知道“低代码”?一起看看数据分析、机器学习、深度学习领域最受欢迎的 Python 低代码工具:D-Tale、AutoViz、Lux、Pandas-Profiling、PyCaret、PyTorch Lightning、Hugging Face Transformers。
资深工程师最常用的 Pandas 显示设置技巧!Pandas数据显示不全?快来了解这些设置技巧,自定义显示的行数、列数、列宽,使浮点列之间的小数位精度保持一致、禁用科学记数法…