开发者社区> 五岳之巅> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

网页文本分词的PHP版本操作过程

简介: 一、分词    SCWS 中文分词v1.2.2 开源免费的中文分词系统,PHP分词的上乘之选!http://www.xunsearch.com/scws/download.php#dll    首先,根据PHP的版本下载php_scws.dll文件,进行安装: 1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。
+关注继续查看
一、分词
    SCWS 中文分词v1.2.2 开源免费的中文分词系统,PHP分词的上乘之选!
http://www.xunsearch.com/scws/download.php#dll
    首先,根据PHP的版本下载php_scws.dll文件,进行安装:
1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。

2. 将下载后的  php_scws.dll 放到 php 安装目录的
   extensions/ 目录中去(通常为:X:/php/extensions/或 X:/php/ext/)。我用的XAMPP,所以



3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc

4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中


5. 从 scws 主页上下载规则集文件,解压后将 *.ini 放到第 3 步建立的目录
   规则集文件压缩包:http://www.xunsearch.com/scws/down/rules.tgz
   解压后有三个文件分别为 rules.ini  rules.utf8.ini rules_cht.utf8.ini
   将三件文件拷到第 3 步所述的目录中


6. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
   在 php.ini 的末尾加入以下几行:
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 php_scws.dll 指定为绝对路径。
;
extension = php_scws.dll
scws.default.charset = gbk
scws.default.fpath = "c:/program files/scws/etc"

5. 重开 web 服务器即可完成。

   以上都是按照官方文档照办,照猫画虎即可。在phpinfo()中可以看到:

   嗯,这就是SCWS装好了。接下来就看看如何用PHP调用它。

二、PHP下分词工具SCWS的使用

  1. ?php
  2.     header('Content-Type:text/html; charset=utf-8');

  3.     $so = scws_new();
  4.     $so->set_charset('utf8');

  5.     $so->send_text("2、我一向理解不了母亲不同意儿子找的对象是一种什么心理。嫌身高?嫌体重?嫌长相?嫌学历?嫌单亲家庭?");
  6.     $i = 0;
  7.     while ($tmp = $so->get_result())
  8.     {
  9.         foreach($tmp as $K=>$val){
  10.             echo $val['word'].'  '.$val['attr']."
    "
    ;
  11.         }
  12.     }
  13.     $so->close();

  14. ?>

    主要是用scws_new()实例化一个对象so,然后用so的send_text()方法接收字符串,并通过关键的get_result()得到返回的结果。

   关于中文词的词性缩写,请参考如下介绍:
n.名词
v.动词
adj.形容词
adv.副词
clas.量词
echo.拟声词
stru.结构助词
aux.助词
coor.并列连词
conj.连词
suffix.后缀
prefix.前缀
prep.介词
pron.代词
ques.疑问词
num.数词
idiom.成语




版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
PHP关于VC9和VC6以及Thread Safe和Non Thread Safe版本选择的问题
  一直想自己搭建个人博客,看重了当前最流行的WordPress,于是开始捣鼓起PHP来。去官方网站下载的时候发现有好多版本,一时弄不清该下哪个,于是去网上搜索帮助,找到了很满意的答案,特转来和学PHP的新手分享:   一、如何选择PHP5.3的VC9版本和VC6版本       VC6版本是使用Visual Studio 6编译器编译的,如果你的PHP是用Apache来架设的,那你就选择VC6版本。
791 0
PHP连接MySQL 8.0报错的解决办法
PHP连接MySQL 8.0报错的解决办法
193 0
Nginx和php安装及配置:mysql安装教程
Nginx和php安装及配置:mysql安装教程http://www.bieryun.com/3052.html 一、mysql简介 说到数据库,我们大多想到的是关系型数据库,比如mysql、oracle、sqlserver等等,这些数据库软件在windows上安装都非常的方便,在Linux上如果要安装数据库,咱不得不首先推荐的是mysql数据库了,而且Mysql数据库的第一个版本就是发行在Linux系统上的。
1811 0
在 Windows 上运行 Nginx、MySQL 和 PHP
本文是关于Wnmp开发环境的快速部署方案,以方便在 Windows 上运行 NGINX、MySQL 和 PHP。本文所涉及的相关文件请移步到我的 github(请点击下面蓝色标题“Wnmp by DocTam”)。
1673 0
centos下 Apache、php、mysql默认安装路径
apache: 如果采用RPM包安装,安装路径应在 /etc/httpd目录下 apache配置文件:/etc/httpd/conf/httpd.conf Apache模块路径:/usr/sbin/apachectl web目录:/var/www/html 如果采用源代码安装,一般默认安装在/usr/local/apache2目录下 php: 如果采用RPM包安装,安装路
3025 0
+关注
262
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载