关于手机等品牌型号搜索与采集的中文分词分离

简介:

很久以前,写过一个手机的搜索查询,这里要涉及到手机类型和型号的分离。

很久之后前,有人问起这个问题,于是,写点说明就把这函数的草稿发布了,并写下了这一些说明。

函数说明,如搜索输入:诺基亚N95,将被拆分成品牌:诺基亚 型号:N95

对于手机数据采集,也可以用这函数分离出品牌和型号。

SetSearchKey( " 诺基亚N95 " , out  诺基亚, out  N95);

 

函数代码如下:

 

复制代码
protected   void  SetSearchKey( string  keyword,  out   string  goodsName,  out   string  goodsModel)
        {
            keyword 
=  keyword.ToLower().Trim();
            
if  (keyword.Contains( "   " )) // 带空格,分离
            {
                goodsName 
=  keyword.Split( '   ' )[ 0 ].Trim();
                goodsModel 
=  keyword.Split( '   ' )[ 1 ].Trim();
            }
            
else   if  (Regex.Match(keyword,  @" ^[\u4E00-\u9FA5]+[\w\d]+ " ).Success) // 以中文开头,包含英文,分离
            {
                goodsName 
=  Regex.Match(keyword,  @" ^([\u4E00-\u9FA5]+)[\w\d]+ " ).Groups[ 1 ].Value;
                goodsModel 
=  keyword.Replace(goodsName,  string .Empty);
            }
            
else
            {
                
string [] keys  =   new   string [] {  " nec " " lg " " vk " " cect "  };
                
for  ( int  i  =   0 ; i  <  keys.Length; i ++ )
                {
                    
if  (keyword.IndexOf(keys[i])  ==   0 )
                    {
                        goodsName 
=  keys[i];
                        goodsModel 
=  goodsModel  =  keyword.Replace(goodsName,  string .Empty);
                        
return ;
                    }
                }
                goodsName 
=  keyword;
                goodsModel 
=  keyword;

            }
        }
复制代码

 

版权声明:本文原创发表于博客园,作者为路过秋天,原文链接:

http://www.cnblogs.com/cyq1162/archive/2010/04/18/1349062.html


相关文章
|
1天前
|
Web App开发 Linux Android开发
Chrome谷歌浏览器的WeChat微信模拟器,既可以设置模拟很多型号的手机设备Mozilla
Chrome谷歌浏览器的WeChat微信模拟器,既可以设置模拟很多型号的手机设备Mozilla
|
8月前
|
程序员 开发工具 iOS开发
iOS 获取手机的型号,系统版本,软件名称,软件版本,手机类型(型号)
iOS 获取手机的型号,系统版本,软件名称,软件版本,手机类型(型号)
83 0
|
8月前
|
JavaScript
vue监听手机键盘搜索事件
vue监听手机键盘搜索事件
|
Android开发
Android笔记: 获取手机的品牌、型号、Android系统版本号、IMEI、当前系统语言等工具类
Android笔记: 获取手机的品牌、型号、Android系统版本号、IMEI、当前系统语言等工具类
485 0
|
编解码 安全 生物认证
世界上最贵的手机品牌被中国壕买了,暴风 TV 京东众筹又出幺蛾子了 | 快报
上个星期,大疆才宣布要在深圳开设线下体验店,而今天亿航的线下体验店就已经在深圳开业了。亿航首家旗舰店占地大约 100 平方米,比大疆计划开设 800 平的线下旗舰店要小得多。店内将有亿航 GHOST 1.0 和最新发布的GHOST 2.0 供用户体验,并且配合亿航的 VR 虚拟现实眼镜,还能体验一把第一人称发行的快感。
162 0
世界上最贵的手机品牌被中国壕买了,暴风 TV 京东众筹又出幺蛾子了 | 快报
|
搜索推荐
为什么智能手机都不爱请品牌代言人了?
为什么智能手机都不爱请品牌代言人了?
110 0
为什么智能手机都不爱请品牌代言人了?
俄罗斯最喜欢的品牌调研,小米成手机品牌之最
近日,据Yandex.的市场调研报告显示,小米已经连续四年蝉联俄罗斯最受欢迎手机品牌的殊荣。早在2016年小米就超越了苹果和三星,以Redmi系列的两款手机包揽前两名。而且今年有28%的俄罗斯人在购买手机时会优先选择小米手机,其次是三星22%,苹果为19%。
206 0
俄罗斯最喜欢的品牌调研,小米成手机品牌之最
2020年Q1印度智能手机市场份额公布,中国品牌占比超70%
4月27日,据外媒报道,市场研究机构Canalys发布了关于印度智能手机市场的数据。数据中显示2020年第一季度,印度智能手机市场出货量达到3350万部,同比增长达12%。虽然增速惊人,但与中国市场相比仍有很大差距。
176 0
2020年Q1印度智能手机市场份额公布,中国品牌占比超70%
创建一个手机类 定义属性名称、型号、颜色、价格, 并定义打电话和听音乐的功能。在测试类中创建对象进行测试。
创建一个手机类 定义属性名称、型号、颜色、价格, 并定义打电话和听音乐的功能。在测试类中创建对象进行测试。
|
机器学习/深度学习 人工智能 运维
Elasticsearch大咖说 | Elasticsearch 在手机垂直搜索业务的应用创新
Elasticsearch作为一个分布式、高扩展、实时的搜索与数据分析引擎,因其轻量级、稳定、可靠、快速等特性受到越来越多开发者的青睐,在搜索、日志分析、运维监控和安全分析等领域得到广泛应用。阿里云Elasticsearch技术团队,深度采访了来自阿里巴巴、vivo、携程、eBay等知名公司的技术专家,推出了Elasticsearch大咖说系列专题,为广大开发者提供技术入门与进阶的经验分享,以及最佳应用实践参考。
1929 0
Elasticsearch大咖说 | Elasticsearch 在手机垂直搜索业务的应用创新

热门文章

最新文章