网页文本分词的PHP版本操作过程

简介: 一、分词    SCWS 中文分词v1.2.2 开源免费的中文分词系统,PHP分词的上乘之选!http://www.xunsearch.com/scws/download.php#dll    首先,根据PHP的版本下载php_scws.dll文件,进行安装: 1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。
一、分词
    SCWS 中文分词v1.2.2 开源免费的中文分词系统,PHP分词的上乘之选!
http://www.xunsearch.com/scws/download.php#dll
    首先,根据PHP的版本下载php_scws.dll文件,进行安装:
1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。

2. 将下载后的  php_scws.dll 放到 php 安装目录的
   extensions/ 目录中去(通常为:X:/php/extensions/或 X:/php/ext/)。我用的XAMPP,所以



3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc

4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中


5. 从 scws 主页上下载规则集文件,解压后将 *.ini 放到第 3 步建立的目录
   规则集文件压缩包:http://www.xunsearch.com/scws/down/rules.tgz
   解压后有三个文件分别为 rules.ini  rules.utf8.ini rules_cht.utf8.ini
   将三件文件拷到第 3 步所述的目录中


6. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
   在 php.ini 的末尾加入以下几行:
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 php_scws.dll 指定为绝对路径。
;
extension = php_scws.dll
scws.default.charset = gbk
scws.default.fpath = "c:/program files/scws/etc"

5. 重开 web 服务器即可完成。

   以上都是按照官方文档照办,照猫画虎即可。在phpinfo()中可以看到:

   嗯,这就是SCWS装好了。接下来就看看如何用PHP调用它。

二、PHP下分词工具SCWS的 使用

  1. ?php
  2.     header('Content-Type:text/html; charset=utf-8');

  3.     $so = scws_new();
  4.     $so->set_charset('utf8');

  5.     $so->send_text("2、我一向理解不了母亲不同意儿子找的对象是一种什么心理。嫌身高?嫌体重?嫌长相?嫌学历?嫌单亲家庭?");
  6.     $i = 0;
  7.     while ($tmp = $so->get_result())
  8.     {
  9.         foreach($tmp as $K=>$val){
  10.             echo $val['word'].'  '.$val['attr']."
    "
    ;
  11.         }
  12.     }
  13.     $so->close();

  14. ?>

    主要是用scws_new()实例化一个对象so,然后用so的send_text()方法接收字符串,并通过关键的get_result()得到返回的结果。

   关于中文词的词性缩写,请参考如下介绍:
n.名词
v.动词
adj.形容词
adv.副词
clas.量词
echo.拟声词
stru.结构助词
aux.助词
coor.并列连词
conj.连词
suffix.后缀
prefix.前缀
prep.介词
pron.代词
ques.疑问词
num.数词
idiom.成语




相关文章
|
3月前
|
PHP Apache
centos7.9 安装php7.0以上版本
centos7.9 安装php7.0以上版本
71 2
|
7天前
|
安全 编译器 PHP
PHP 8.1版本发布:引领Web开发新潮流
PHP编程语言一直是Web开发的主力军,而最新发布的PHP 8.1版本则为开发者们带来了更多创新和便利。本文将介绍PHP 8.1版本的主要特性,包括更快的性能、新的语言功能和增强的安全性,以及如何利用这些功能来提升Web应用程序的质量和效率。
|
1月前
|
监控 前端开发 安全
PHP脚本:实现实时监控电脑屏幕并生成网页截图
在当今数字化时代,实时监控和数据收集变得越来越重要。有时候,我们需要监视某些活动,例如员工的工作情况、儿童的网络活动等等。在这篇文章中,我们将探讨如何使用PHP脚本实现实时监控电脑屏幕,并将监控到的数据自动提交到网站。
119 2
|
5月前
|
弹性计算 监控 Java
阿里云国际站代理商:如何在阿里云上升级PHP版本?
@luotuoemo飞机@TG 阿里云国际站代理商:如何在阿里云上升级PHP版本?在所选实例右侧的操作栏中,点击“更多”>“实例管理”,进入实例管理页面。在这里,您可以看到实例的详细信息,包括当前的PHP版本、操作系统类型等。
|
6月前
|
小程序 PHP
[微擎]多系统共用accesstoken修复wifi小程序文本敏感词汇检测+图片检测原生php(可用)
[微擎]多系统共用accesstoken修复wifi小程序文本敏感词汇检测+图片检测原生php(可用)