去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。
程序的功能:
1、采集数据
2、可配置的,只要输入一定的条件就能采任何东西了。
3、可导出成csv格式
4、可把数据导入到淘宝助手。
5、采集图片到本地。
6、可修改宝贝内容
7、可使用模板来进行描述
用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。
先看看配置文件:
1
<?
xml version="1.0" encoding="utf-8"
?>
2 < configuration >
3 < configSections >
4 < sectionGroup name ="userSettings" type ="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5 < section name ="MyCollection.CollectSetting" type ="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition ="MachineToLocalUser" requirePermission ="false" />
6 </ sectionGroup >
7 </ configSections >
8 < connectionStrings >
9 < add name ="MyCollection.Properties.Settings.MyCollectConnectionString"
10 connectionString ="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11 providerName ="System.Data.SqlClient" />
12 </ connectionStrings >
13 < userSettings >
14 < MyCollection.CollectSetting >
15 < setting name ="SaveImagePath" serializeAs ="String" >
16 < value > D:\办公\淘游馆\香水彩妆\商品图片\ </ value >
17 </ setting >
18 < setting name ="SaveCSVPath" serializeAs ="String" >
19 < value > D:\办公\淘游馆\香水彩妆\描述模板\ </ value >
20 </ setting >
21 < setting name ="HtmlTemplet" serializeAs ="String" >
22 < value > D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html </ value >
23 </ setting >
24 </ MyCollection.CollectSetting >
25 </ userSettings >
26 </ configuration >
2 < configuration >
3 < configSections >
4 < sectionGroup name ="userSettings" type ="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5 < section name ="MyCollection.CollectSetting" type ="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition ="MachineToLocalUser" requirePermission ="false" />
6 </ sectionGroup >
7 </ configSections >
8 < connectionStrings >
9 < add name ="MyCollection.Properties.Settings.MyCollectConnectionString"
10 connectionString ="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11 providerName ="System.Data.SqlClient" />
12 </ connectionStrings >
13 < userSettings >
14 < MyCollection.CollectSetting >
15 < setting name ="SaveImagePath" serializeAs ="String" >
16 < value > D:\办公\淘游馆\香水彩妆\商品图片\ </ value >
17 </ setting >
18 < setting name ="SaveCSVPath" serializeAs ="String" >
19 < value > D:\办公\淘游馆\香水彩妆\描述模板\ </ value >
20 </ setting >
21 < setting name ="HtmlTemplet" serializeAs ="String" >
22 < value > D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html </ value >
23 </ setting >
24 </ MyCollection.CollectSetting >
25 </ userSettings >
26 </ configuration >
SaveImagePath:保存图片到本地的路径
SaveCSVPath:导出文件所在目录
HtmlTemplet:宝贝描述模板文件
大概的界面:
主界面
显示此项目中的采集的数据
单个商品的详细内容,用的是winform的Edit,感觉还不错。
下面是进行采集的配置,界面如下:
如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。
在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。
在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。
程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P
东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)
PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。
PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(