Python[10] mongodb模块

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介:

今天和大家分享一个python入库mongodb的脚本。。。

涉及到python和mongodb,那么安装相应的模块四必不可少的,最简单的安装方法,或者非pip不可了。

1
# pip install pymongo==3.0.4

顺便也记录下源码安装的方式

1
2
3
4
# wget https://pypi.python.org/packages/source/p/pymongo/pymongo-2.8.tar.gz#md5=23100361c9af1904eb2d7722f2658114 --no-check-certificate
# tar xf pymongo-2.8.tar.gz
# cd pymongo-2.8
# python setup.py install


摘自一则日志

1
35783   s100    android 47  5   192.168.1.100   2015-09-05 08:03:19    strengthenHeroByHeroes  { "consume_gold" :{ "ogold" :2893821, "cgold" :1700, "gold" :2892121, "tag" : "strengthenHeroByHeroes" }, "taskInfo" :[{ "id" :2310033, "progress" :2, "status" :0}], "delHeroList" :{ "id" :102014, "id" :102014, "id" :102014, "id" :102010, "id" :102010}, "id" :100026, "olevel" :46, "oexp" :1700, "cexp" :1700, "level" :46, "exp" :3400} 865982021462182     XiaoMi


入库mongodb的python脚本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
[root@localhost opt] # cat analytical.py 
#!/usr/bin/env python
#coding:utf8
 
import  os,sys,json
from  datetime  import  * 
from  pymongo  import  MongoClient
 
def  ConMongo(host,port,cur_db,username,password):
     client  =  MongoClient(host,port)
     db  =  client[cur_db]
     db.authenticate(username,password)
     table  =  db.gamelogs
     return  table
 
def  parseLog(logfile,table):
     dic  =  {}
     dl  =  []
     with  open (file_log) as fd:
         for  line  in  fd:
         try :
             tokens  =  line.strip().split( '\t' )
             uid  =  tokens[ 0 ]
             server  =  tokens[ 1 ]
             system  =  tokens[ 2 ]
             level  =  int (tokens[ 3 ])
             vip_level  =  tokens[ 4 ]
             ip  =  tokens[ 5 ]
             time  =  datetime.strptime(tokens[ 6 ],  "%Y-%m-%d %H:%M:%S" )         #将时间字符串转换成时间格式
             action  =  tokens[ 7 ]
             result  =  json.loads(tokens[ 8 ])                         #特殊字符串转换成json格式
             uuid  =  tokens[ 9 ]
         if  len (tokens)  = =  12 :
             channel  =  tokens[ 11 ]
         else :
             channel  =  ''
             dic  =  { 'uid' :uid, 'server' :server, 'system' :system, 'level' :level, 'vip_level' :vip_level, 'ip' :ip, 'time' :time, 'action' :action, 'result' :result, 'uuid' :uuid, 'channel' :channel}
         dl.append(dic)
         if  len (dl)  = =  10000 :
             table.insert_many(dl)
             dl  =  []
         except  Exception,e:
             print  e, line
     if  len (dl) >  0 :
         table.insert_many(dl)
 
if  __name__  = =  '__main__' :
     table  =  ConMongo( 'localhost' , 27017 , 'talefundb' , 'talefun' , '123456' )
     try :
         logfile  =  sys.argv[ 1 ]
         parseLog(logfile,table)
     except  IndexError,e:
         print  e

注意事项:

1
2
3
(1)insert_many参数是mongodb 3.0.4中新加的,允许你将一个大列表直接insert到mongodb数据库中
(2)脚本中做了限制,如果字典中有2000个值,就向mongodb插入一次数据,这样在效率上得到了保证
(3)不建议直接复制脚本测试,很多粘贴出来后,很多制表符等会出现问题。我会吧脚本放在云盘上大家可以下载,测试用。


wKioL1X6vqHgz6F8AAHb0c8Iosc628.jpg


点击可下载:http://pan.baidu.com/s/1qWtbgjq








     本文转自zys467754239 51CTO博客,原文链接:http://blog.51cto.com/467754239/1692088,如需转载请自行联系原作者

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
5天前
|
NoSQL MongoDB 微服务
微服务——MongoDB实战演练——文章微服务模块搭建
本节介绍文章微服务模块的搭建过程,主要包括以下步骤:(1)创建项目工程 *article*,并在 *pom.xml* 中引入依赖;(2)配置 *application.yml* 文件;(3)创建启动类 *cn.itcast.article.ArticleApplication*;(4)启动项目,确保控制台无错误提示。通过以上步骤,完成文章微服务模块的基础构建与验证。
16 0
|
4月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
181 62
|
25天前
|
人工智能 自然语言处理 Shell
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
38 8
|
23天前
|
缓存 Shell 开发工具
[oeasy]python071_我可以自己做一个模块吗_自定义模块_引入模块_import_diy
本文介绍了 Python 中模块的导入与自定义模块的创建。首先,我们回忆了模块的概念,即封装好功能的部件,并通过导入 `__hello__` 模块实现了输出 "hello world!" 的功能。接着,尝试创建并编辑自己的模块 `my_file.py`,引入 `time` 模块以获取当前时间,并在其中添加自定义输出。
24 4
|
3月前
|
Python
Python Internet 模块
Python Internet 模块。
143 74
|
4月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
158 63
|
4月前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
146 61
|
4月前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
4月前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
4月前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。