自动统计知网数据

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: http://blog.csdn.net/twosecond/archive/2009/06/22/4289052.aspx
http://blog.csdn.net/twosecond/archive/2009/06/22/4289052.aspx
<?php

    function inDB($words,$year){
        $mysql_server_name="localhost"; //数据库服务器名称
        $mysql_username="root"; // 连接数据库用户名
        $mysql_password=""; // 连接数据库密码
        $mysql_database="ljj"; // 数据库的名字
        // 连接到数据库
        $conn=mysql_connect($mysql_server_name, $mysql_username,$mysql_password);
        // 执行sql查询
        foreach($words as $word){
            // 从表中提取信息的sql语句
            $strsql = "INSERT INTO `ljj`.`tongji` ( `id` , `word` , `year` ) VALUES ( NULL , '".$word[$i]."', '".$year."' )";
            $result = mysql_db_query($mysql_database, $strsql, $conn);
        }
        
    }

    echo "starttime is".date("Y-m-d H:i:s").'
';
    $url_o[] = 'http://epub.cnki.net/grid2008/detail.aspx?filename=GFJM200905030&dbname=CJFD2009';
//    $i = 1;
//    while($i     //    $url[] = $url_o."$i";
    //}
    foreach($url_o as $link){
        $flag = 0;
        while( ( $contents = file($link)) == FALSE ){
            $flag++;echo "flag=$flag
";
            if($flag > 3) return 0;
        }
        foreach($contents as $string){
            if(($tmp = trim(strip_tags($string))) == '')continue;
            $result[] = $tmp;
        }
    }
        //提取关键词
        $start = array_search("【中文关键词】",$result);
        $end = array_search("【英文关键词】",$result)-1;
       
        while($start++             $keywords[] = substr($result[$start],0,strlen($result[$start])-1).'
';
        }

        //提取年份
        $start = array_search("【文献出处】",$result);
        $end = array_search("【中文关键词】",$result)-1;
        $paperyear = substr($result[$end],0,4).'
';
       
        if(count($keywords) == 0 || $paperyear ';}
        else{
            inDB($keywords,$paperyear);
            echo '保存成功
';
         }
    echo "endtime is".date("Y-m-d H:i:s");
?>
 
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
JSON Java Maven
如何批量查询自己的CSDN博客质量分
如何批量查询自己的CSDN博客质量分
295 0
分页最好的作用是做好统计,可以用来基本条件列表的统计,可以用来统计多平台,使之呈现列表,预算统计,以及必要的技术,项目名称,常用链接
分页最好的作用是做好统计,可以用来基本条件列表的统计,可以用来统计多平台,使之呈现列表,预算统计,以及必要的技术,项目名称,常用链接
|
8月前
|
存储 数据采集 数据挖掘
python数据分析——数据分类汇总与统计
数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳,然后对这些数据进行统计分析,以便于更好地了解数据的特点和规律。
408 1
|
存储 并行计算 算法
GWAS结果自动批量整理算法(下)
GWAS结果自动批量整理算法(下)
|
存储 算法 Serverless
GWAS结果自动批量整理算法(上)
GWAS结果自动批量整理算法
|
自然语言处理
两份数据基于文本和住房信息的分词统计 tfidf 数分作业
两份数据基于文本和住房信息的分词统计 tfidf 数分作业
83 0
两份数据基于文本和住房信息的分词统计 tfidf 数分作业
|
数据采集 消息中间件 大数据
爬虫识别-不同行程统计-需求及实现思路|学习笔记
快速学习爬虫识别-不同行程统计-需求及实现思路
|
数据采集 分布式计算 大数据
爬虫识别-不同行程统计-代码实现及效果|学习笔记
快速学习爬虫识别-不同行程统计-代码实现及效果。
121 0
|
机器学习/深度学习 SQL 分布式计算
【玩转数据系列一】人口普查统计案例
玩转数据系列文章通过简单地案例搭建,介绍如何通过阿里云机器学习平台进行数据挖掘。
16390 1

热门文章

最新文章