备案控制台

开发者社区> 问答> 正文

python做数据挖掘会不会有那种算法来的容易，效率却被降得很低的情况？

python做数据挖掘会不会有那种算法来的容易，效率却被降得很低的情况？

展开

收起

OSC开源社区 2024-05-14 09:49:33 27 0

1 条回答

写回答

取消提交回答

OSC小助手
我对您问题的理解是，Python代码落地的简便性带来的弊端是速度慢。如果在数据量大的情况下，单机运行效率肯定会很低，如果在配置较高的服务器端问题就不大了。当然，如果你对Spark比较熟悉的话，也可以在Spark环境里面编写Python代码，那是最理想的，就不存在效率问题了呢。

虽然Python的执行速度可能较慢，但其强大的生态系统、易用性和可读性使得它成为数据挖掘和机器学习项目的首选。在实际工作中，如果确实遇到性能问题，可以考虑以下策略：
1. 数据预处理：优化数据清洗和转换步骤，减少不必要的计算。
2. 特征选择：减少特征数量，降低计算复杂度。
3. 并行计算：使用multiprocessing库或分布式计算框架如Apache Spark来并行化任务。
4. 库的优化版本：使用NumPy和Pandas的优化版本，如Dask，它可以在大型数据集上提供类似Pandas的接口。
5. 硬件加速：利用GPU进行计算，特别是在深度学习中。
2024-05-23 19:34:31

赞同展开评论打赏

问答分类：

算法 Python 数据挖掘

问答标签：

算法python Python算法数据挖掘python

问答地址：

开发者社区 > 人工智能 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

机器学习PAI这个算法python版本的一直报错可以看一下吗？

58

0

0

dataworks 的算法节点有说明文档嘛，可以写python模型脚本嘛？

22

1

0

如果已经用其它语言实现了某一算法，还有必要用Python再实现一遍吗？

7

1

0

python的优势在于方法库很多，而且有很多方便的算法库。但直接调用是否反而会影响了自己算法的理解？

12

1

0

机器学习PAI平台上的算法自定义，请帮忙看下有什么方式能解决这个问题？

48

1

0

阿里云OpenAPI这块自行实现签名有提供对应python的签名算法么？

24

1

0

机器学习PAI-Designer算法组件自定义Python脚本组件不能保存提示文件上传失败

235

1

0

怎么用python机器学习的KNN算法实现对鸢尾花数据集的分类？求详细代码

662

1

0

Python数据挖掘中的数据质量有哪些常见问题吗？

704

1

0

Python数据挖掘中的数据质量需要考虑哪些问题呢？

582

1

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699851

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818298

3 据说在家办公的程序员是这样写代码的？ 1792304

4 阿里云开放端口权限 689900

5 《阿里云服务器从入门到精通》—论坛精华帖汇总（2013.8.21更新） 599488

6 如何升级配置 536065

7 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522438

8 【精品问答】python技术1000问(1) 513994

9 Flink Forward Asia 2021 有奖问答 512800

10 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456918

11 OceanBase 使用动画（持续更新） 359259

12 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329720

13 OSS存储服务-客户端工具 321327

14 为体验实验室取一个新名字。 307302

15 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303844

16 Win Server 2003-2016 加密勒索事件必打补丁合集 295154

17 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283610

18 安全组详解，新手必看教程 277253

19 写code还是做管理，开发者如何进行职业规划？ 268435

20 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255824

1 一键部署3D卡通风格模型，分享部署过程及使用体验 234

2 展示你通过AI修饰的自然风光照片，并讲述你的拍摄和编辑过程 292

3 机器学习PAI现在一直在重试，怎样停掉？ 101

4 你知道APP是怎么开发的吗？ 589

5 如何提高企业的业务稳定性？ 458

6 百问求答 | 回答问题即有机会得米家落地扇 250

7 分享AI代码助手的使用体验 594

8 分享一张AI生成的“老照片”，讲讲你与它的故事 801

9 阿里云百炼这个问题怎么解决？ 126

10 阿里云百炼第一次询问能触发 prompt；第二次为啥就触发不了？ 164

11 阿里云百炼模型调优需要的数据有什么要求么？ 187

12 在机器学习PAI为什么有的空间看不到数据源：FeautureDB？ 362

13 在iTAG想用PAI实现根据我上传的文档生成我想要的问答对的这种功能可以实现吗？ 336

14 函数计算一键部署ComfyUI绘画平台的优势有哪些？ 1260

15 域名控制台 713

16 如何调用通义千问API 144

17 2024过半，AI技术发展到哪个阶段了？ 1869

18 二维码全球每天使用量达 100 多亿，会被用完吗？ 788

19 机器学习PAI有没有pyalink 机器学习实战的开源项目？ 320

20 请教下机器学习PAI 金融云的dataworkd可以调度公共云的pai DLC吗？ 315

相关课程

更多

Python语言基础 - 语法入门

98207

57

去学习

Python语言基础 - 列表、元组、字典、集合

54109

20

去学习

Python网络编程

33912

3

去学习

Python Web 框架 Flask 快速入门

30937

31

去学习

Python Web 框架 Django 快速入门

30685

4

去学习

神经网络概览及算法详解

1203

36

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

数据+算法定义新世界 立即下载

袋鼠云基于实时计算的反黄牛算法 立即下载

Alink：基于Apache Flink的算法平台 立即下载

相关实验场景

更多