Python[10] mongodb模块

简介:

今天和大家分享一个python入库mongodb的脚本。。。

涉及到python和mongodb,那么安装相应的模块四必不可少的,最简单的安装方法,或者非pip不可了。

1
# pip install pymongo==3.0.4

顺便也记录下源码安装的方式

1
2
3
4
# wget https://pypi.python.org/packages/source/p/pymongo/pymongo-2.8.tar.gz#md5=23100361c9af1904eb2d7722f2658114 --no-check-certificate
# tar xf pymongo-2.8.tar.gz
# cd pymongo-2.8
# python setup.py install


摘自一则日志

1
35783   s100    android 47  5   192.168.1.100   2015-09-05 08:03:19    strengthenHeroByHeroes  { "consume_gold" :{ "ogold" :2893821, "cgold" :1700, "gold" :2892121, "tag" : "strengthenHeroByHeroes" }, "taskInfo" :[{ "id" :2310033, "progress" :2, "status" :0}], "delHeroList" :{ "id" :102014, "id" :102014, "id" :102014, "id" :102010, "id" :102010}, "id" :100026, "olevel" :46, "oexp" :1700, "cexp" :1700, "level" :46, "exp" :3400} 865982021462182     XiaoMi


入库mongodb的python脚本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
[root@localhost opt] # cat analytical.py 
#!/usr/bin/env python
#coding:utf8
 
import  os,sys,json
from  datetime  import  * 
from  pymongo  import  MongoClient
 
def  ConMongo(host,port,cur_db,username,password):
     client  =  MongoClient(host,port)
     db  =  client[cur_db]
     db.authenticate(username,password)
     table  =  db.gamelogs
     return  table
 
def  parseLog(logfile,table):
     dic  =  {}
     dl  =  []
     with  open (file_log) as fd:
         for  line  in  fd:
         try :
             tokens  =  line.strip().split( '\t' )
             uid  =  tokens[ 0 ]
             server  =  tokens[ 1 ]
             system  =  tokens[ 2 ]
             level  =  int (tokens[ 3 ])
             vip_level  =  tokens[ 4 ]
             ip  =  tokens[ 5 ]
             time  =  datetime.strptime(tokens[ 6 ],  "%Y-%m-%d %H:%M:%S" )         #将时间字符串转换成时间格式
             action  =  tokens[ 7 ]
             result  =  json.loads(tokens[ 8 ])                         #特殊字符串转换成json格式
             uuid  =  tokens[ 9 ]
         if  len (tokens)  = =  12 :
             channel  =  tokens[ 11 ]
         else :
             channel  =  ''
             dic  =  { 'uid' :uid, 'server' :server, 'system' :system, 'level' :level, 'vip_level' :vip_level, 'ip' :ip, 'time' :time, 'action' :action, 'result' :result, 'uuid' :uuid, 'channel' :channel}
         dl.append(dic)
         if  len (dl)  = =  10000 :
             table.insert_many(dl)
             dl  =  []
         except  Exception,e:
             print  e, line
     if  len (dl) >  0 :
         table.insert_many(dl)
 
if  __name__  = =  '__main__' :
     table  =  ConMongo( 'localhost' , 27017 , 'talefundb' , 'talefun' , '123456' )
     try :
         logfile  =  sys.argv[ 1 ]
         parseLog(logfile,table)
     except  IndexError,e:
         print  e

注意事项:

1
2
3
(1)insert_many参数是mongodb 3.0.4中新加的,允许你将一个大列表直接insert到mongodb数据库中
(2)脚本中做了限制,如果字典中有2000个值,就向mongodb插入一次数据,这样在效率上得到了保证
(3)不建议直接复制脚本测试,很多粘贴出来后,很多制表符等会出现问题。我会吧脚本放在云盘上大家可以下载,测试用。


wKioL1X6vqHgz6F8AAHb0c8Iosc628.jpg


点击可下载:http://pan.baidu.com/s/1qWtbgjq








     本文转自zys467754239 51CTO博客,原文链接:http://blog.51cto.com/467754239/1692088,如需转载请自行联系原作者

相关文章
|
7月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
864 7
|
7月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
588 0
|
7月前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
606 4
|
8月前
|
安全 大数据 程序员
Python operator模块的methodcaller:一行代码搞定对象方法调用的黑科技
`operator.methodcaller`是Python中处理对象方法调用的高效工具,替代冗长Lambda,提升代码可读性与性能。适用于数据过滤、排序、转换等场景,支持参数传递与链式调用,是函数式编程的隐藏利器。
249 4
|
7月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
693 0
|
7月前
|
XML JSON 数据处理
超越JSON:Python结构化数据处理模块全解析
本文深入解析Python中12个核心数据处理模块,涵盖csv、pandas、pickle、shelve、struct、configparser、xml、numpy、array、sqlite3和msgpack,覆盖表格处理、序列化、配置管理、科学计算等六大场景,结合真实案例与决策树,助你高效应对各类数据挑战。(238字)
969 0
|
NoSQL MongoDB 微服务
微服务——MongoDB实战演练——文章微服务模块搭建
本节介绍文章微服务模块的搭建过程,主要包括以下步骤:(1)创建项目工程 *article*,并在 *pom.xml* 中引入依赖;(2)配置 *application.yml* 文件;(3)创建启动类 *cn.itcast.article.ArticleApplication*;(4)启动项目,确保控制台无错误提示。通过以上步骤,完成文章微服务模块的基础构建与验证。
196 0
|
8月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
703 0
|
9月前
|
存储 安全 数据处理
Python 内置模块 collections 详解
`collections` 是 Python 内置模块,提供多种高效数据类型,如 `namedtuple`、`deque`、`Counter` 等,帮助开发者优化数据处理流程,提升代码可读性与性能,适用于复杂数据结构管理与高效操作场景。
552 0
|
10月前
|
数据安全/隐私保护 Python
抖音私信脚本app,协议私信群发工具,抖音python私信模块
这个实现包含三个主要模块:抖音私信核心功能类、辅助工具类和主程序入口。核心功能包括登录