自动统计知网数据

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: http://blog.csdn.net/twosecond/archive/2009/06/22/4289052.aspx
http://blog.csdn.net/twosecond/archive/2009/06/22/4289052.aspx
<?php

    function inDB($words,$year){
        $mysql_server_name="localhost"; //数据库服务器名称
        $mysql_username="root"; // 连接数据库用户名
        $mysql_password=""; // 连接数据库密码
        $mysql_database="ljj"; // 数据库的名字
        // 连接到数据库
        $conn=mysql_connect($mysql_server_name, $mysql_username,$mysql_password);
        // 执行sql查询
        foreach($words as $word){
            // 从表中提取信息的sql语句
            $strsql = "INSERT INTO `ljj`.`tongji` ( `id` , `word` , `year` ) VALUES ( NULL , '".$word[$i]."', '".$year."' )";
            $result = mysql_db_query($mysql_database, $strsql, $conn);
        }
        
    }

    echo "starttime is".date("Y-m-d H:i:s").'
';
    $url_o[] = 'http://epub.cnki.net/grid2008/detail.aspx?filename=GFJM200905030&dbname=CJFD2009';
//    $i = 1;
//    while($i     //    $url[] = $url_o."$i";
    //}
    foreach($url_o as $link){
        $flag = 0;
        while( ( $contents = file($link)) == FALSE ){
            $flag++;echo "flag=$flag
";
            if($flag > 3) return 0;
        }
        foreach($contents as $string){
            if(($tmp = trim(strip_tags($string))) == '')continue;
            $result[] = $tmp;
        }
    }
        //提取关键词
        $start = array_search("【中文关键词】",$result);
        $end = array_search("【英文关键词】",$result)-1;
       
        while($start++             $keywords[] = substr($result[$start],0,strlen($result[$start])-1).'
';
        }

        //提取年份
        $start = array_search("【文献出处】",$result);
        $end = array_search("【中文关键词】",$result)-1;
        $paperyear = substr($result[$end],0,4).'
';
       
        if(count($keywords) == 0 || $paperyear ';}
        else{
            inDB($keywords,$paperyear);
            echo '保存成功
';
         }
    echo "endtime is".date("Y-m-d H:i:s");
?>
 
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
JSON Java Maven
如何批量查询自己的CSDN博客质量分
如何批量查询自己的CSDN博客质量分
276 0
|
2月前
|
Python
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
分页最好的作用是做好统计,可以用来基本条件列表的统计,可以用来统计多平台,使之呈现列表,预算统计,以及必要的技术,项目名称,常用链接
分页最好的作用是做好统计,可以用来基本条件列表的统计,可以用来统计多平台,使之呈现列表,预算统计,以及必要的技术,项目名称,常用链接
|
5月前
|
数据采集 存储 NoSQL
Java爬虫-爬取疫苗批次信息
为了解决疫苗批号查询难题,作者因个人情况需查询脊髓灰质炎灭活疫苗信息,发现官网查询系统不便使用。于是,技术大展身手,编写了一个Java爬虫,利用Hutool、Jsoup和Spring Boot的MongoDB库,抓取并存储了中国食品药品检定研究院等多家机构近十年的疫苗批次信息。代码示例展示了如何爬取数据并存入MongoDB,方便按需查询。
81 0
|
存储 并行计算 算法
GWAS结果自动批量整理算法(下)
GWAS结果自动批量整理算法(下)
|
存储 算法 Serverless
GWAS结果自动批量整理算法(上)
GWAS结果自动批量整理算法
|
数据挖掘
白话Elasticsearch41-深入聚合数据分析之案例实战__过滤+聚合:统计价格大于2000的电视平均价格
白话Elasticsearch41-深入聚合数据分析之案例实战__过滤+聚合:统计价格大于2000的电视平均价格
93 0
|
SQL 数据挖掘
白话Elasticsearch39-深入聚合数据分析之案例实战_搜索+聚合: 统计指定品牌下每个颜色的销量
白话Elasticsearch39-深入聚合数据分析之案例实战_搜索+聚合: 统计指定品牌下每个颜色的销量
140 0
|
自然语言处理
两份数据基于文本和住房信息的分词统计 tfidf 数分作业
两份数据基于文本和住房信息的分词统计 tfidf 数分作业
76 0
两份数据基于文本和住房信息的分词统计 tfidf 数分作业